Upgrade to Pro — share decks privately, control downloads, hide ads and more …

非競プロ勢によるUSPTOコンペ参加記

chimuichimu
August 02, 2024
1k

 非競プロ勢によるUSPTOコンペ参加記

chimuichimu

August 02, 2024
Tweet

Transcript

  1. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. • テーマ ◦ USPTO(米国特許商標庁)がホストの「特許」がテーマのコンペ • 期間 ◦ 2024/4/24 ~ 7/24 • 参加チーム数 ◦ 571 チーム https://www.kaggle.com/competitions/uspto-explainable-ai
  2. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. タスク:類似特許を効率良く取得する boolean ク エリを作る
  3. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. ・・・ 各特許に対し、embedding から抽出された 類似特許が50個与えられる 特許X 近傍_1 近傍_2 近傍_3 近傍_50
  4. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. ・・・ それぞれの特許はタイトルなどのメタ情報を持つ 特許X 近傍_1 近傍_2 近傍_3 近傍_50 • title: “System and method for …” • abstract: “A method for customizing …” • cpc_codes: ['G06K9/00892', 'G06T15/20', … ] • ・・・
  5. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. ・・・ メタ情報から類似特許を取得するクエリを boolean 演算子(AND, OR, NOT, XOR)を使いトークン数の制限内で作る 特許X 近傍_1 近傍_2 近傍_3 近傍_50 (ti:beam AND cpc:H01J41/20) OR (ti:tube AND cpc:H01J2235/205) OR … → クエリにより「類似特許」の解釈性を特許の専門家に提供する
  6. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. ・・・ 類似特許の集合とクエリを実行した検索結果のランキングから MAP@50で評価 特許X 類似特許 ・・・ クエリ検索結果 MAP@50で評価
  7. コンペ中の取り組み © 2024 Wantedly, Inc. アプローチ (ti:tube AND cpc:H01J2235/205) (ti:gettering

    AND cpc:H01J41/04) (ti:beam AND cpc:H01J41/20) ・・・ (ti:beam AND cpc:H01J41/20) OR (ti:tube cpc:H01J2235/205) OR (ti:gettering cpc:H01J41/04) OR (ti:electron cpc:H01J1/304) OR (ti:compact cpc:H01J49/147) STEP1:類似特許のメタ情報から 候補となる子クエリを TF-IDFスコアなどをもとに作成
  8. コンペ中の取り組み © 2024 Wantedly, Inc. アプローチ (ti:tube AND cpc:H01J2235/205) (ti:gettering

    AND cpc:H01J41/04) (ti:beam AND cpc:H01J41/20) ・・・ (ti:beam AND cpc:H01J41/20) OR (ti:tube cpc:H01J2235/205) OR (ti:gettering cpc:H01J41/04) OR (ti:electron cpc:H01J1/304) OR (ti:compact cpc:H01J49/147) STEP2:子クエリを組み合わせて 最終的なクエリを作成
  9. コンペ中の取り組み © 2024 Wantedly, Inc. アプローチ (ti:tube AND cpc:H01J2235/205) (ti:gettering

    AND cpc:H01J41/04) (ti:beam AND cpc:H01J41/20) ・・・ (ti:beam AND cpc:H01J41/20) OR (ti:tube cpc:H01J2235/205) OR (ti:gettering cpc:H01J41/04) OR (ti:electron cpc:H01J1/304) OR (ti:compact cpc:H01J49/147) STEP2:子クエリを組み合わせて 最終的なクエリを作成 類似特許が所与なので 推論時に良い組合せを探索することが可能
  10. コンペ中の取り組み © 2024 Wantedly, Inc. 探索アルゴリズム • 良いクエリの組合せを探索するアルゴリズムを実験 ◦ 貪欲法

    ◦ 焼きなまし法 ◦ 遺伝的アルゴリズム など • 知識がなかったので期間中に書籍で学習 ◦ 右の本はコードや図解が豊富でとてもわかりやす かった https://amzn.asia/d/acp6O9M