本当は難しいPSL

2b027b9ba2b6c1dad842e15f99d17251?s=47 Masahiro Honma
November 22, 2019

 本当は難しいPSL

吉祥寺.pm のアンカンファレンスの資料です。
https://kichijojipm.connpass.com/event/152180/

2b027b9ba2b6c1dad842e15f99d17251?s=128

Masahiro Honma

November 22, 2019
Tweet

Transcript

  1. 本当は難しいPSL hiratara

  2. 問題). Chromeのアドレスバーに “吉祥寺.pm” と入れて検索す るとどうなる?

  3. 答え: http://吉祥寺.pm へ飛んでイラッとする

  4. 問題). Chromeのアドレスバーに “吉祥寺.pm20” と入れて検 索するとどうなる?

  5. 答え: 吉祥寺.pm20 を検索した結果が表示される

  6. 問題: 次のうちイラッとせず検索できる文字列は? • city.sapporo.jp • city.kichijoji.jp • town.nagoya.jp • town.kyoto.jp

    • 村.福岡.jp • 村.沖縄.jp • 高校.教育.香港 • こんにちわ.世界 • δγ.ελ • jcode.pl 答え
  7. Public Suffix List (PSL) とは (1) • https://publicsuffix.org/ • 2008年発祥

    • ドメインを登録可能な接尾辞の一覧 例: com, net co.jp, ne.jp
  8. Public Suffix List (PSL) とは (2) • Set-Cookie可能ドメインの判定のため作られた 例: www.fout.co.jp

    Set-Cookie 可能 fout.co.jp Set-Cookie 可能 co.jp Set-Cookie 不可 jp Set-Cookie 不可
  9. PSLの用途 • Cookieの制御 • Chromeのキーワード or URL判定 • URLバーでのドメインのハイライト •

    (任意のアプリケーションで)root domainのバリデーション
  10. PSL の構造 • 1行に1つ定義が書かれている • ピリオド区切りでPublic Suffixを記述する 例: co.jp •

    ワイルドカードが使える 例: *.nagoya.jp • 除外指定ができる 例: !city.nagoya.jp
  11. town.nagoya.jpでイラッとしなくて済む理由 • *.nagoya.jp のルールが適用できるので、これはPublic Suffix • 除外ルール !city.nagoya.jp にも当てはまらない •

    Public Suffix なので、登録不可能なドメインである→URLではない
  12. city.yokohama.jpでイラッとさせられる理由 • *.yokohama.jp のルールが適用できる • しかし、除外ルール !city.yokohama.jp に合致するため、 Public Suffix

    は yokohama.jp • yokohama.jp 配下に登録可能なドメイン → URLである
  13. アプリケーションからPSLを使う C, C# Elixir, Erlang, Go, Haskell, Java, JavaScript, TypeScript,

    Lua, .NET, Objective-C, Perl, PHP, Python, Ruby, Rust, Swift https://publicsuffix.org/learn/
  14. PSLの辛み • 人手による管理である https://github.com/publicsuffix/list • 静的にコンパイルして組み込む仕組みである ◦ 更新までに時間がかかる • ワイルドカード、除外ルールが割と複雑

    ◦ 単純な後方一致が使えない • リストが恐ろしく巨大 ◦ 12,987行もある ◦ .jp だけで 1,795行もある
  15. 問題: nagoya.jp は Public Suffix だろうか? • 2ラベルからなるので、 *.nagoya.jp というルールには合致しない

    • jp というルールに合致する。よって jp が Public Suffix • nagoya.jp は jp 以下に登録可能 → URL
  16. 結果: Chrome では Public Suffix 扱い

  17. Public Suffixの仕様とブラウザの挙動は違う • Chromeでは、*.x が PSL に含まれる場合に x も PSL

    に含まれるとする • platform.sh problem と呼ばれる問題 https://wiki.mozilla.org/Public_Suffix_List/platform.sh_Problem ◦ PSLの標準アルゴリズムとブラウザの一般的な挙動が異なる
  18. 問題: platform.sh は Public Suffix だろうか? • 2ラベルからなるので、厳密には *.platform.sh というルールには合致しない

    • しかし、 Chrome では platform.sh が Public Suffix と解釈される • よって、URLではなく検索語句として扱われるはず
  19. 結果: URLとして扱われる

  20. 理由: Chromiumのコード見るとパッチ当ててる https://github.com/chromium/chromium/blob/825b9883f937af7ece0967553c1eacb85e3dd254/net/base/registry_controlled_domain s/effective_tld_names.dat#L12487

  21. まとめ • ドメインの正当性はPSLというもので判定されている • PSLは手作業で更新され、静的にブラウザに組み込まれている • 複雑で、巨大で、例外があって、辛い (特にライブラリ作る時)