Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ホモグラフドメインを検出してみた/detect homograph domain

Takuma Kume
December 14, 2023

ホモグラフドメインを検出してみた/detect homograph domain

https://gmo.connpass.com/event/304045/
コードとカクテル:GMOペパボのAIナイト - LT大忘年会 -
https://developers.gmo.jp/41833/

Takuma Kume

December 14, 2023
Tweet

More Decks by Takuma Kume

Other Decks in Technology

Transcript

  1. はじめに • ホモグリフ(homoglyph) ◦ 同一または非常によく似た形をした文字 ◦ 例えば「O(オー)」と「0(ゼロ)」 • ホモグラフドメイン(homograph domain)

    ◦ ホモグリフを利用して特定の組織等になりすましたドメイン ◦ 例えば「AMAZON.COM」と「AMAZ0N.COM」 ホモグラフドメイン
  2. 実装 レーベンシュタイン距離 A B 距離 割合 micr0s0ft.com microsoft.com 2 84.62%

    amason.com amazon.com 1 90.00% • 距離だとどのくらい似ているか分かりにくいので、最大文字数で割る
  3. • ドメイン文字列を画像にして比較してみる 実装 ハミング距離 A B ハミング距離 レーベンシュタイン 6(とても近い) 3

    (0%) 32 (遠い) 4 (0%) 8(近い) 4 (55.56%) bec1986b63b21c3c bec1906b69b31c3c af93c0691f869b62 f887877868d02f87 bfc1c0372f386ac1 bfc2c03d2f3a38c1 ハミング距離が10以下だと似ていると判断できそう
  4. • レーベンシュタイン距離 ◦ mattn/go-lsd • 画像ハッシュ生成、ハミング距離 ◦ corona10/goimagehash • 文字列の画像生成

    ◦ fogleman/gg • 文字のフォント ◦ 日本語:IPAゴシック (https://moji.or.jp/ipafont/ipa00303/) ◦ その他:Monaco 実装 Golangによる実装
  5. • Microsoft takes on homograph domains ◦ https://globalbydesign.com/2021/08/18/microsoft-takes-on-homograph-domains/ • ホモグラフドメインの

    検知に関する研究 ◦ https://meetings.jpaawg.org/wp-content/uploads/2022/11/B2-5_kojima.pdf 参照資料