Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
本当は難しいPSL
Search
Masahiro Honma
November 22, 2019
Technology
3
3.7k
本当は難しいPSL
吉祥寺.pm のアンカンファレンスの資料です。
https://kichijojipm.connpass.com/event/152180/
Masahiro Honma
November 22, 2019
Tweet
Share
More Decks by Masahiro Honma
See All by Masahiro Honma
Rustに入門したくて!
hiratara
0
680
Haskellを使おう
hiratara
3
2.6k
Lens : Smart setter for immutable data
hiratara
1
690
Other Decks in Technology
See All in Technology
AWS学習者向けにAzureの解説スライドを作成した話
handy
3
220
AWSやJAWS-UGとの出会いを振り返る
yoyoyopg
1
180
IaCからAWSに入門した初心者が CloudFormationを通して考えた「AWS操作」の使い分け
maimyyym
3
630
類似ロジック実装をiOS/Android間で合わせる道標No.1
fumiyasac0921
1
180
LLM開発・活用の舞台裏@2024.04.25
yushin_n
3
1.4k
パスワードを保存しますか?
hanacchi
0
210
TailwindCSSでUIライブラリを作る際のハマりどころ
shuta13
0
140
Rustで「プリズモイダル法」を利用して「土量計算」をガチでやる
nokonoko1203
1
360
TiDBにおけるテーブル設計と最適化の事例
cygames
0
260
Autonomous Database Cloud 技術詳細 / adb-s_technical_detail_jp
oracle4engineer
PRO
15
35k
MixIT 2024 - Pulumi : Gérer son infra avec son langage de programmation préféré
ju_hnny5
1
130
NewSQL Landscape
oracle4engineer
PRO
2
2.7k
Featured
See All Featured
Ruby is Unlike a Banana
tanoku
96
10k
Building a Modern Day E-commerce SEO Strategy
aleyda
22
6.4k
How GitHub Uses GitHub to Build GitHub
holman
468
290k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
21
1.6k
The Cost Of JavaScript in 2023
addyosmani
21
3.9k
The World Runs on Bad Software
bkeepers
PRO
61
6.7k
Bootstrapping a Software Product
garrettdimon
PRO
302
110k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
34
8.9k
Statistics for Hackers
jakevdp
790
220k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
242
1.2M
Mobile First: as difficult as doing things right
swwweet
217
8.6k
The Art of Programming - Codeland 2020
erikaheidi
43
12k
Transcript
本当は難しいPSL hiratara
問題). Chromeのアドレスバーに “吉祥寺.pm” と入れて検索す るとどうなる?
答え: http://吉祥寺.pm へ飛んでイラッとする
問題). Chromeのアドレスバーに “吉祥寺.pm20” と入れて検 索するとどうなる?
答え: 吉祥寺.pm20 を検索した結果が表示される
問題: 次のうちイラッとせず検索できる文字列は? • city.sapporo.jp • city.kichijoji.jp • town.nagoya.jp • town.kyoto.jp
• 村.福岡.jp • 村.沖縄.jp • 高校.教育.香港 • こんにちわ.世界 • δγ.ελ • jcode.pl 答え
Public Suffix List (PSL) とは (1) • https://publicsuffix.org/ • 2008年発祥
• ドメインを登録可能な接尾辞の一覧 例: com, net co.jp, ne.jp
Public Suffix List (PSL) とは (2) • Set-Cookie可能ドメインの判定のため作られた 例: www.fout.co.jp
Set-Cookie 可能 fout.co.jp Set-Cookie 可能 co.jp Set-Cookie 不可 jp Set-Cookie 不可
PSLの用途 • Cookieの制御 • Chromeのキーワード or URL判定 • URLバーでのドメインのハイライト •
(任意のアプリケーションで)root domainのバリデーション
PSL の構造 • 1行に1つ定義が書かれている • ピリオド区切りでPublic Suffixを記述する 例: co.jp •
ワイルドカードが使える 例: *.nagoya.jp • 除外指定ができる 例: !city.nagoya.jp
town.nagoya.jpでイラッとしなくて済む理由 • *.nagoya.jp のルールが適用できるので、これはPublic Suffix • 除外ルール !city.nagoya.jp にも当てはまらない •
Public Suffix なので、登録不可能なドメインである→URLではない
city.yokohama.jpでイラッとさせられる理由 • *.yokohama.jp のルールが適用できる • しかし、除外ルール !city.yokohama.jp に合致するため、 Public Suffix
は yokohama.jp • yokohama.jp 配下に登録可能なドメイン → URLである
アプリケーションからPSLを使う C, C# Elixir, Erlang, Go, Haskell, Java, JavaScript, TypeScript,
Lua, .NET, Objective-C, Perl, PHP, Python, Ruby, Rust, Swift https://publicsuffix.org/learn/
PSLの辛み • 人手による管理である https://github.com/publicsuffix/list • 静的にコンパイルして組み込む仕組みである ◦ 更新までに時間がかかる • ワイルドカード、除外ルールが割と複雑
◦ 単純な後方一致が使えない • リストが恐ろしく巨大 ◦ 12,987行もある ◦ .jp だけで 1,795行もある
問題: nagoya.jp は Public Suffix だろうか? • 2ラベルからなるので、 *.nagoya.jp というルールには合致しない
• jp というルールに合致する。よって jp が Public Suffix • nagoya.jp は jp 以下に登録可能 → URL
結果: Chrome では Public Suffix 扱い
Public Suffixの仕様とブラウザの挙動は違う • Chromeでは、*.x が PSL に含まれる場合に x も PSL
に含まれるとする • platform.sh problem と呼ばれる問題 https://wiki.mozilla.org/Public_Suffix_List/platform.sh_Problem ◦ PSLの標準アルゴリズムとブラウザの一般的な挙動が異なる
問題: platform.sh は Public Suffix だろうか? • 2ラベルからなるので、厳密には *.platform.sh というルールには合致しない
• しかし、 Chrome では platform.sh が Public Suffix と解釈される • よって、URLではなく検索語句として扱われるはず
結果: URLとして扱われる
理由: Chromiumのコード見るとパッチ当ててる https://github.com/chromium/chromium/blob/825b9883f937af7ece0967553c1eacb85e3dd254/net/base/registry_controlled_domain s/effective_tld_names.dat#L12487
まとめ • ドメインの正当性はPSLというもので判定されている • PSLは手作業で更新され、静的にブラウザに組み込まれている • 複雑で、巨大で、例外があって、辛い (特にライブラリ作る時)