絵文字の合字
合字とは「f」を2回重ねたときに「ff」のように2つがくっついた状態で表示されること.
一部の絵文字はこの合字を利用して複雑な絵文字を表現している場合がある.
それぞれの絵文字の間にZero Point Joiner(U+200D)という不可視の文字を入れることに
よってその絵文字は合成されているということを表す.
※Zero Point Joinerを使わないで合成される場合もあり(一部の国旗の絵文字など)
まとめ
n Unicodeにおける文字一つ一つに割り当てられるユニークなIDを Code Point と言g
n JSでは文字列の内部表現がUTF-16で統一されていh
n .lengthはCode Point単位の処理ではないので,直感と異なる値を返す事があh
n Code Point単位で得たい場合はIteratorを使g
n Unicodeでは「1Code Point = 直感的な1文字」とは限らな6
n 異体字セレク
n 結合文
n 絵文字の合
n et
n 直感的な1文字のことをUnicodeでは 書記素クラスタ と呼Æ
n JSでは Intl.Segmenter() を使うと簡単に書記素クラスタ単位に分割できる