Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
本当は難しいPSL
Search
Masahiro Honma
November 22, 2019
Technology
3
4k
本当は難しいPSL
吉祥寺.pm のアンカンファレンスの資料です。
https://kichijojipm.connpass.com/event/152180/
Masahiro Honma
November 22, 2019
Tweet
Share
More Decks by Masahiro Honma
See All by Masahiro Honma
偶然見つけたEncode.pmのバグ
hiratara
1
240
Rustに入門したくて!
hiratara
0
710
Haskellを使おう
hiratara
3
2.8k
Lens : Smart setter for immutable data
hiratara
1
750
Other Decks in Technology
See All in Technology
EKS Pod Identity における推移的な session tags
z63d
1
190
[CV勉強会@関東 CVPR2025 読み会] MegaSaM: Accurate, Fast, and Robust Structure and Motion from Casual Dynamic Videos (Li+, CVPR2025)
abemii
0
180
会社にデータエンジニアがいることでできるようになること
10xinc
9
1.4k
帳票Vibe Coding
terurou
0
120
Engineering Failure-Resilient Systems
infraplumber0
0
130
MCPサーバーを活用したAWSコスト管理
arie0703
0
150
RAID6 を楔形文字で組んで現代人を怖がらせましょう(実装編)
mimifuwa
0
260
生成AIによるデータサイエンスの変革
taka_aki
0
3.1k
マイクロモビリティシェアサービスを支える プラットフォームアーキテクチャ
grimoh
1
150
.NET開発者のためのAzureの概要
tomokusaba
0
210
信頼できる開発プラットフォームをどう作るか?-Governance as Codeと継続的監視/フィードバックが導くPlatform Engineeringの進め方
yuriemori
1
360
第4回 関東Kaggler会 [Training LLMs with Limited VRAM]
tascj
10
1.4k
Featured
See All Featured
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Typedesign – Prime Four
hannesfritz
42
2.8k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
Art, The Web, and Tiny UX
lynnandtonic
302
21k
Scaling GitHub
holman
462
140k
Balancing Empowerment & Direction
lara
2
580
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
131
19k
Done Done
chrislema
185
16k
Code Review Best Practice
trishagee
70
19k
Adopting Sorbet at Scale
ufuk
77
9.5k
Transcript
本当は難しいPSL hiratara
問題). Chromeのアドレスバーに “吉祥寺.pm” と入れて検索す るとどうなる?
答え: http://吉祥寺.pm へ飛んでイラッとする
問題). Chromeのアドレスバーに “吉祥寺.pm20” と入れて検 索するとどうなる?
答え: 吉祥寺.pm20 を検索した結果が表示される
問題: 次のうちイラッとせず検索できる文字列は? • city.sapporo.jp • city.kichijoji.jp • town.nagoya.jp • town.kyoto.jp
• 村.福岡.jp • 村.沖縄.jp • 高校.教育.香港 • こんにちわ.世界 • δγ.ελ • jcode.pl 答え
Public Suffix List (PSL) とは (1) • https://publicsuffix.org/ • 2008年発祥
• ドメインを登録可能な接尾辞の一覧 例: com, net co.jp, ne.jp
Public Suffix List (PSL) とは (2) • Set-Cookie可能ドメインの判定のため作られた 例: www.fout.co.jp
Set-Cookie 可能 fout.co.jp Set-Cookie 可能 co.jp Set-Cookie 不可 jp Set-Cookie 不可
PSLの用途 • Cookieの制御 • Chromeのキーワード or URL判定 • URLバーでのドメインのハイライト •
(任意のアプリケーションで)root domainのバリデーション
PSL の構造 • 1行に1つ定義が書かれている • ピリオド区切りでPublic Suffixを記述する 例: co.jp •
ワイルドカードが使える 例: *.nagoya.jp • 除外指定ができる 例: !city.nagoya.jp
town.nagoya.jpでイラッとしなくて済む理由 • *.nagoya.jp のルールが適用できるので、これはPublic Suffix • 除外ルール !city.nagoya.jp にも当てはまらない •
Public Suffix なので、登録不可能なドメインである→URLではない
city.yokohama.jpでイラッとさせられる理由 • *.yokohama.jp のルールが適用できる • しかし、除外ルール !city.yokohama.jp に合致するため、 Public Suffix
は yokohama.jp • yokohama.jp 配下に登録可能なドメイン → URLである
アプリケーションからPSLを使う C, C# Elixir, Erlang, Go, Haskell, Java, JavaScript, TypeScript,
Lua, .NET, Objective-C, Perl, PHP, Python, Ruby, Rust, Swift https://publicsuffix.org/learn/
PSLの辛み • 人手による管理である https://github.com/publicsuffix/list • 静的にコンパイルして組み込む仕組みである ◦ 更新までに時間がかかる • ワイルドカード、除外ルールが割と複雑
◦ 単純な後方一致が使えない • リストが恐ろしく巨大 ◦ 12,987行もある ◦ .jp だけで 1,795行もある
問題: nagoya.jp は Public Suffix だろうか? • 2ラベルからなるので、 *.nagoya.jp というルールには合致しない
• jp というルールに合致する。よって jp が Public Suffix • nagoya.jp は jp 以下に登録可能 → URL
結果: Chrome では Public Suffix 扱い
Public Suffixの仕様とブラウザの挙動は違う • Chromeでは、*.x が PSL に含まれる場合に x も PSL
に含まれるとする • platform.sh problem と呼ばれる問題 https://wiki.mozilla.org/Public_Suffix_List/platform.sh_Problem ◦ PSLの標準アルゴリズムとブラウザの一般的な挙動が異なる
問題: platform.sh は Public Suffix だろうか? • 2ラベルからなるので、厳密には *.platform.sh というルールには合致しない
• しかし、 Chrome では platform.sh が Public Suffix と解釈される • よって、URLではなく検索語句として扱われるはず
結果: URLとして扱われる
理由: Chromiumのコード見るとパッチ当ててる https://github.com/chromium/chromium/blob/825b9883f937af7ece0967553c1eacb85e3dd254/net/base/registry_controlled_domain s/effective_tld_names.dat#L12487
まとめ • ドメインの正当性はPSLというもので判定されている • PSLは手作業で更新され、静的にブラウザに組み込まれている • 複雑で、巨大で、例外があって、辛い (特にライブラリ作る時)