Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
本当は難しいPSL
Search
Masahiro Honma
November 22, 2019
Technology
3
4.1k
本当は難しいPSL
吉祥寺.pm のアンカンファレンスの資料です。
https://kichijojipm.connpass.com/event/152180/
Masahiro Honma
November 22, 2019
Tweet
Share
More Decks by Masahiro Honma
See All by Masahiro Honma
ARA に捧げる鎮魂歌
hiratara
0
1.2k
偶然見つけたEncode.pmのバグ
hiratara
1
340
Rustに入門したくて!
hiratara
0
720
Haskellを使おう
hiratara
3
2.8k
Lens : Smart setter for immutable data
hiratara
1
770
Other Decks in Technology
See All in Technology
タグ付きユニオン型を便利に使うテクニックとその注意点
uhyo
2
650
MAP-7thplaceSolution
yukichi0403
2
250
Bakuraku Engineering Team Deck
layerx
PRO
11
5.8k
Databricksによるエージェント構築
taka_aki
1
120
A Compass of Thought: Guiding the Future of Test Automation ( #jassttokai25 , #jassttokai )
teyamagu
PRO
1
200
プロダクトマネジメントの分業が生む「デリバリーの渋滞」を解消するTPMの越境
recruitengineers
PRO
3
450
Capture Checking / Separation Checking 入門
tanishiking
0
110
Docker, Infraestructuras seguras y Hardening
josejuansanchez
0
150
生成AI・AIエージェント時代、データサイエンティストは何をする人なのか?そして、今学生であるあなたは何を学ぶべきか?
kuri8ive
2
1.9k
法人支出管理領域におけるソフトウェアアーキテクチャに基づいたテスト戦略の実践
ogugu9
1
130
著者と読み解くAIエージェント現場導入の勘所 Lancers TechBook#2
smiyawaki0820
9
3.1k
日本Rubyの会の構造と実行とあと何か / hokurikurk01
takahashim
4
540
Featured
See All Featured
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Side Projects
sachag
455
43k
Why You Should Never Use an ORM
jnunemaker
PRO
60
9.6k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Optimising Largest Contentful Paint
csswizardry
37
3.5k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
31
2.7k
Automating Front-end Workflow
addyosmani
1371
200k
Building an army of robots
kneath
306
46k
Navigating Team Friction
lara
191
16k
Statistics for Hackers
jakevdp
799
230k
GitHub's CSS Performance
jonrohan
1032
470k
Transcript
本当は難しいPSL hiratara
問題). Chromeのアドレスバーに “吉祥寺.pm” と入れて検索す るとどうなる?
答え: http://吉祥寺.pm へ飛んでイラッとする
問題). Chromeのアドレスバーに “吉祥寺.pm20” と入れて検 索するとどうなる?
答え: 吉祥寺.pm20 を検索した結果が表示される
問題: 次のうちイラッとせず検索できる文字列は? • city.sapporo.jp • city.kichijoji.jp • town.nagoya.jp • town.kyoto.jp
• 村.福岡.jp • 村.沖縄.jp • 高校.教育.香港 • こんにちわ.世界 • δγ.ελ • jcode.pl 答え
Public Suffix List (PSL) とは (1) • https://publicsuffix.org/ • 2008年発祥
• ドメインを登録可能な接尾辞の一覧 例: com, net co.jp, ne.jp
Public Suffix List (PSL) とは (2) • Set-Cookie可能ドメインの判定のため作られた 例: www.fout.co.jp
Set-Cookie 可能 fout.co.jp Set-Cookie 可能 co.jp Set-Cookie 不可 jp Set-Cookie 不可
PSLの用途 • Cookieの制御 • Chromeのキーワード or URL判定 • URLバーでのドメインのハイライト •
(任意のアプリケーションで)root domainのバリデーション
PSL の構造 • 1行に1つ定義が書かれている • ピリオド区切りでPublic Suffixを記述する 例: co.jp •
ワイルドカードが使える 例: *.nagoya.jp • 除外指定ができる 例: !city.nagoya.jp
town.nagoya.jpでイラッとしなくて済む理由 • *.nagoya.jp のルールが適用できるので、これはPublic Suffix • 除外ルール !city.nagoya.jp にも当てはまらない •
Public Suffix なので、登録不可能なドメインである→URLではない
city.yokohama.jpでイラッとさせられる理由 • *.yokohama.jp のルールが適用できる • しかし、除外ルール !city.yokohama.jp に合致するため、 Public Suffix
は yokohama.jp • yokohama.jp 配下に登録可能なドメイン → URLである
アプリケーションからPSLを使う C, C# Elixir, Erlang, Go, Haskell, Java, JavaScript, TypeScript,
Lua, .NET, Objective-C, Perl, PHP, Python, Ruby, Rust, Swift https://publicsuffix.org/learn/
PSLの辛み • 人手による管理である https://github.com/publicsuffix/list • 静的にコンパイルして組み込む仕組みである ◦ 更新までに時間がかかる • ワイルドカード、除外ルールが割と複雑
◦ 単純な後方一致が使えない • リストが恐ろしく巨大 ◦ 12,987行もある ◦ .jp だけで 1,795行もある
問題: nagoya.jp は Public Suffix だろうか? • 2ラベルからなるので、 *.nagoya.jp というルールには合致しない
• jp というルールに合致する。よって jp が Public Suffix • nagoya.jp は jp 以下に登録可能 → URL
結果: Chrome では Public Suffix 扱い
Public Suffixの仕様とブラウザの挙動は違う • Chromeでは、*.x が PSL に含まれる場合に x も PSL
に含まれるとする • platform.sh problem と呼ばれる問題 https://wiki.mozilla.org/Public_Suffix_List/platform.sh_Problem ◦ PSLの標準アルゴリズムとブラウザの一般的な挙動が異なる
問題: platform.sh は Public Suffix だろうか? • 2ラベルからなるので、厳密には *.platform.sh というルールには合致しない
• しかし、 Chrome では platform.sh が Public Suffix と解釈される • よって、URLではなく検索語句として扱われるはず
結果: URLとして扱われる
理由: Chromiumのコード見るとパッチ当ててる https://github.com/chromium/chromium/blob/825b9883f937af7ece0967553c1eacb85e3dd254/net/base/registry_controlled_domain s/effective_tld_names.dat#L12487
まとめ • ドメインの正当性はPSLというもので判定されている • PSLは手作業で更新され、静的にブラウザに組み込まれている • 複雑で、巨大で、例外があって、辛い (特にライブラリ作る時)