Slide 7
Slide 7 text
なぜ21ビットなのか
●
Unicodeは最初、16ビットで世界中の字を入れられるとしていたが、その目
論見が見事に失敗したことで、1面以降に文字を追加する羽目になった
(Unicode 2.0)
●
UTF-16ではBMPの中にサロゲートペアを作って対処した
–
前16ビット(ハイサロゲート): U+D800〜U+DBFF (1024(2^10)コードポイント分)
–
後ろ16ビット(ローサロゲート): U+DC00〜U+DFFF (1024(2^10)コードポイント
分)
–
この組み合わせが1048576文字(2^20)分であり、U+10000〜U+10FFFFまでの範
囲となった
–
なお、サロゲートペアはUTF-16のみの概念で、他文字コードで扱えない
(UTF-8、UTF-32)
●
結果として21ビットの範囲となった。