Upgrade to Pro — share decks privately, control downloads, hide ads and more …

非競プロ勢によるUSPTOコンペ参加記

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for chimuichimu chimuichimu
August 02, 2024
2.3k

 非競プロ勢によるUSPTOコンペ参加記

Avatar for chimuichimu

chimuichimu

August 02, 2024
Tweet

More Decks by chimuichimu

Transcript

  1. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. • テーマ ◦ USPTO(米国特許商標庁)がホストの「特許」がテーマのコンペ • 期間 ◦ 2024/4/24 ~ 7/24 • 参加チーム数 ◦ 571 チーム https://www.kaggle.com/competitions/uspto-explainable-ai
  2. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. タスク:類似特許を効率良く取得する boolean ク エリを作る
  3. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. ・・・ 各特許に対し、embedding から抽出された 類似特許が50個与えられる 特許X 近傍_1 近傍_2 近傍_3 近傍_50
  4. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. ・・・ それぞれの特許はタイトルなどのメタ情報を持つ 特許X 近傍_1 近傍_2 近傍_3 近傍_50 • title: “System and method for …” • abstract: “A method for customizing …” • cpc_codes: ['G06K9/00892', 'G06T15/20', … ] • ・・・
  5. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. ・・・ メタ情報から類似特許を取得するクエリを boolean 演算子(AND, OR, NOT, XOR)を使いトークン数の制限内で作る 特許X 近傍_1 近傍_2 近傍_3 近傍_50 (ti:beam AND cpc:H01J41/20) OR (ti:tube AND cpc:H01J2235/205) OR … → クエリにより「類似特許」の解釈性を特許の専門家に提供する
  6. USPTO - Explainable AI for Patent Professionals © 2024 Wantedly,

    Inc. ・・・ 類似特許の集合とクエリを実行した検索結果のランキングから MAP@50で評価 特許X 類似特許 ・・・ クエリ検索結果 MAP@50で評価
  7. コンペ中の取り組み © 2024 Wantedly, Inc. アプローチ (ti:tube AND cpc:H01J2235/205) (ti:gettering

    AND cpc:H01J41/04) (ti:beam AND cpc:H01J41/20) ・・・ (ti:beam AND cpc:H01J41/20) OR (ti:tube cpc:H01J2235/205) OR (ti:gettering cpc:H01J41/04) OR (ti:electron cpc:H01J1/304) OR (ti:compact cpc:H01J49/147) STEP1:類似特許のメタ情報から 候補となる子クエリを TF-IDFスコアなどをもとに作成
  8. コンペ中の取り組み © 2024 Wantedly, Inc. アプローチ (ti:tube AND cpc:H01J2235/205) (ti:gettering

    AND cpc:H01J41/04) (ti:beam AND cpc:H01J41/20) ・・・ (ti:beam AND cpc:H01J41/20) OR (ti:tube cpc:H01J2235/205) OR (ti:gettering cpc:H01J41/04) OR (ti:electron cpc:H01J1/304) OR (ti:compact cpc:H01J49/147) STEP2:子クエリを組み合わせて 最終的なクエリを作成
  9. コンペ中の取り組み © 2024 Wantedly, Inc. アプローチ (ti:tube AND cpc:H01J2235/205) (ti:gettering

    AND cpc:H01J41/04) (ti:beam AND cpc:H01J41/20) ・・・ (ti:beam AND cpc:H01J41/20) OR (ti:tube cpc:H01J2235/205) OR (ti:gettering cpc:H01J41/04) OR (ti:electron cpc:H01J1/304) OR (ti:compact cpc:H01J49/147) STEP2:子クエリを組み合わせて 最終的なクエリを作成 類似特許が所与なので 推論時に良い組合せを探索することが可能
  10. コンペ中の取り組み © 2024 Wantedly, Inc. 探索アルゴリズム • 良いクエリの組合せを探索するアルゴリズムを実験 ◦ 貪欲法

    ◦ 焼きなまし法 ◦ 遺伝的アルゴリズム など • 知識がなかったので期間中に書籍で学習 ◦ 右の本はコードや図解が豊富でとてもわかりやす かった https://amzn.asia/d/acp6O9M