Unicode: Japanese Writing System の
Japanese Writing System Character Sets
Japanese writing system uses the following characters:
- Japanese Phonetic alphabets, called Kana (仮名).
- Chinese characters, called Kanji (漢字).
- English alphabets, called Romaji. (Romaji literally means “Roman characters ”.)
Of the kana, there are 2 types:
- Hiragana (ひらがな, 平仮名)
-
There are a total of 48 hiragana in modern Japanese.
Hiragana ♦ a i u e o ♦ あ い う え お k か き く け こ s さ し す せ そ t た ち つ て と n な に ぬ ね の h は ひ ふ へ ほ m ま み む め も y や ♦ ゆ ♦ よ r ら り る れ ろ w わ ゐ ♦ ゑ を ん (n)
- Katakana (カタカナ, 片仮名)
-
- Katakana looks angular.
- Katakana is used for place names, company names, imported words, emphasis, etc.
- Purpose of Katakana is somewhat like English uppercase letters.
Katakana ♦ a i u e o ♦ ア イ ウ エ オ K カ キ ク ケ コ S サ シ ス セ ソ T タ チ ツ テ ト N ナ ニ ヌ ネ ノ H ハ ヒ フ ヘ ホ M マ ミ ム メ モ Y ヤ ♦ ユ ♦ ヨ R ラ リ ル レ ロ W ワ ヰ ♦ ヱ ヲ
Hiragana and Katakana Comparison
♦ | ♦ | k | s | t | n | h | m | y | r | w |
---|---|---|---|---|---|---|---|---|---|---|
a | あア a |
かカ ka | さサ sa | たタ ta | なナ na | はハ ha | まマ ma | やヤ ya | らラ ra | わワ wa |
i | いイ i | きキ ki | しシ si | ちチ ti | にニ ni | ひヒ hi | みミ mi | ♦ | りリ ri | ゐヰ wi |
u | うウ u | くク ku | すス su | つツ tu | ぬヌ nu | ふフ hu | むム mu | ゆユ yu | るル ru | ♦ |
e | えエ e | けケ ke | せセ se | てテ te | ねネ ne | へヘ he | めメ me | ♦ | れレ re | ゑヱ we |
o | おオ o | こコ ko | そソ so | とト to | のノ no | ほホ ho | もモ mo | よヨ yo | ろロ ro | をヲ wo |
n |
---|
んン n |
The Dakuten Diacritic Mark
゛ (U+309B: KATAKANA-HIRAGANA VOICED SOUND MARK)
Dakuten
゛
is a diacritic mark that often occurs for many hiragana.
When it appears on a hiragana, it means that the consonant of the syllable should be voiced.
History of Japanese Writing System
- Japanese writing system is borrowed from Chinese. In the beginning, it's all Chinese characters. (Chinese character used in Japanese has basically the same meaning as in Chinese.)
- The kana (phonetic alphabets), is invented in Japan. It is evolved from parts of Chinese characters.
Character Frequency in Japanese
In formal writing, such as newspaper or books, about 40% are kanji.
Characters | % |
---|---|
Kanji | 41.38 |
Hiragana | 36.62 |
Katakana | 6.38 |
Punctuation and symbols | 13.09 |
Digits | 2.07 |
English letters | 0.46 |
In informal writing, such as online chat, less kanji is used.
To read Japanese newspaper or books, you need to know 2k kanji. See Jōyō kanji (常用漢字)
In comparison, for Chinese people reading Chinese newspaper, 3500 characters are needed. 〔通用规范汉字表 [Table of General Standard Chinese Characters〕. Ministry of Education of the People's Republic of China. 18 Jun 2013.]
Source, Japanese newspaper Asahi Shimbun from the year 1993 (around 56.6 million tokens). [Chikamatsu, Nobuko; Yokoyama, Shoichi; Nozaki, Hironari; Long, Eric; Fukuda, Sachio (2000). A Japanese logographic character frequency list for cognitive science research. Behavior Research Methods, Instruments, and Computers. 32 (3): 482–500.] via Wikipedia Japanese writing system
Sample Japanese Text
Here is sample of Japanese writing, from Wikipedia Japanese article on keyboard:
キーボード(英: Keyboard)は、コンピュータへの入力機器の一つであり、手指でキーを押すことでコンピュータへ文字信号などを送信するもの。様々なソフトウェア上で文字入力を基本とした機器であるが、コンピュータ (OS) の操作全般にも用いられる。
日本語における 鍵盤はkey boardからの訳語であり両者は本来的に同一のものである。欧米においては鍵盤楽器のカラクリを応用した機械式タイプライターを経て、タイプライターのインタフェースを模した電子的入力機器へと連続的に発展していった歴史的経緯により一連の概念として理解されるが、タイプライターの普及が限定的に留まった日本の社会通念においては、楽器の鍵盤と入力機器のキーボードとは断絶しており個別に扱われることが多く、電子楽器のキーボードでわずかに関連性が示される程度である。
[2017-07-16 キーボード (コンピュータ)]
Those complex looking ones are kanji (Chinese characters). The cursive looking ones are hiragana, and angular ones are katakana.
Complete List of Hiragana in Unicode
あ い う え お か が き ぎ く ぐ け げ こ ご さ ざ し じ す ず せ ぜ そ ぞ た だ ち ぢ つ づ て で と ど な に ぬ ね の は ば ぱ ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ ぼ ぽ ま み む め も や ゆ よ ら り る れ ろ わ ゐ ゑ を ん ゔ
Unicode Small Hiragana
ぁ ぃ ぅ ぇ ぉ っ ゃ ゅ ょ ゎ ゕ ゖ
Misc Unicode Hiragana
ゝ ゞ ゟ 𛀁 🈀
Complete List of Katakana in Unicode
ア イ ウ エ オ カ ガ キ ギ ク グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ ダ チ ヂ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ ム メ モ ヤ ユ ヨ ラ リ ル レ ロ ワ ヰ ヱ ヲ ン ヴ ヷ ヸ ヹ ヺ
Unicode Small Katakana
ァ ィ ゥ ェ ォ ッ ャ ュ ョ ヮ ヵ ヶ ㇰ ㇱ ㇲ ㇳ ㇴ ㇵ ㇶ ㇷ ㇸ ㇹ ㇺ ㇻ ㇼ ㇽ ㇾ ㇿ
Misc
𛀀
Misc
・ ヽ ヾ ヿ
゛ ゜ ゠ ー
Half Width Kana
ア イ ウ エ オ カ キ ク ケ コ サ シ ス セ ソ タ チ ツ テ ト ナ ニ ヌ ネ ノ ハ ヒ フ ヘ ホ マ ミ ム メ モ ヤ ユ ヨ ラ リ ル レ ロ ワ ヲ ン ゙ ゚
ー ・
ァ ィ ゥ ェ ォ ャ ュ ョ ッ ー