Slide 17
Slide 17 text
Emoji bombからわかること
● ユーザーからの入力を、書記素クラスター
でバリデーションしようとしないほうが良
さげに見える
– 絵文字とZWJのおかげで1文字に見えるの
に、うん百メガバイトとか作れてしまう
● ただし、UAX #51 https://unicode.org/re
ports/tr51/#valid-emoji-tag-sequence
s によると、32コードポイントを上限として
いる
– それではなぜできるんだろう…?中の人に聞
いてみるか?
● ICUライブラリで聞いてみます https://unico
de-org.atlassian.net/browse/ICU-23302
There is one common constraint on valid emoji tag
sequences: the entire emoji_tag_sequence,
including tag_base and tag_end, must not be
longer than 32 code points.
https://unicode.org/reports/tr51/#valid-emoji-tag-
sequences より