Upgrade to Pro — share decks privately, control downloads, hide ads and more …

実践マルチモーダル検索!

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

 実践マルチモーダル検索!

Avatar for shibuiwilliam

shibuiwilliam

October 30, 2025
Tweet

More Decks by shibuiwilliam

Other Decks in Technology

Transcript

  1. ⾃⼰紹介 shibui yusuke • いろいろ → Stability AI → LayerX(いまここ)

    • データ検索とR&Dのマネージャー • MLOps & データ検索 & バックエンド & インフラ & その他諸々エンジニア • MLOpsコミュニティ運営 • 最近やりたいこと ⽣成AIの⽣成AI以外のエンジニアリング • Github: @shibuiwilliam • FB: yusuke.shibui 猫のようで サイズは犬 猫耳メガネ LLMに聞いてみた
  2. © LayerX Inc. 8 ⽣成AIで拡張する情報抽出 { "title": "なぜスタートアップなのか", "description": "イノベーションを創出し、⼤きく成⻑するスター

    トアップは経済成⻑のドライバーとなる存在であることを⽰すス ライド。特に、⽶国経済ではGAFAMのような新興企業が経済成⻑ を牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10年 間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }, { "label": "TOPIX", "color": "黒", "trend": "ほぼ横ばいで推移。成⻑率は+100〜200%程度。" } ] }, "graph_meaning": { "main_message": "GAFAMのような新興企業が⽶国経済成⻑を 牽引しており、それらを除くと⽇⽶の株式市場の成⻑差は⼩さい ことを⽰している。", "insight": "スタートアップや新興企業の存在が経済全体の成⻑ に⼤きな影響を与えており、⽇本でも同様にイノベーションを⽣ み出すスタートアップの育成が重要であることを⽰唆している。" } }
  3. © LayerX Inc. 10 検索に登録するデータ 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 XXレポート.pptx

    個々のコンテンツ OCR/VLM Object detection 全⽂検索 ベクトル検索 ベクトル検索 ベクトル検索 カテゴリ検索 全⽂検索 全⽂検索 ベクトル検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 VLM
  4. © LayerX Inc. 11 検索する⽅法                画像による検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ

    画像⾔語 ベクトル 画像⾔語 ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 VLM VLM VLM VLM クエリ画像からテキストを 抽出してカテゴリ、全⽂検索 クエリ画像からベクトルを 作成して類似ベクトル検索
  5. © LayerX Inc. 12 検索する⽅法                画像による検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ

    画像⾔語 ベクトル 画像⾔語 ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 全般的に作成、調整、テストが⼿間
  6. © LayerX Inc. 14 検索する⽅法              テキストによる検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ

    画像⾔語 ベクトル テキスト ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 作成、調整しやすい 作成、調整が⼿間 画像コンテンツを テキスト検索する 丁度よい⼿法
  7. © LayerX Inc. 16 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding

    & rewrite LLMのテキスト‧画像認識を 活⽤して、スライドの コンテンツ情報を構造的に 抽出し、検索データとする Title Description Keywords Object
  8. © LayerX Inc. 17 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding

    & rewrite クエリの検索⽬的や⽤途に 応じてスキーマの重みを 調整し、検索性能を向上 Title: 0.1 Description: 0.3 Keywords: 0.1 Object: 0.5 Query 右肩上がりのグラフ
  9. © LayerX Inc. 18 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding

    & rewrite クエリやコンテキストから LLMで意図を理解し、 クエリをリライト Query AI Agentを作りたいけど 作り⽅とかわからないし 最近はOpenAIとか有名だ けどPythonとか‧‧‧ Rewrite AI Agentの作り⽅, OpenAIのAI Agent, PythonのAI Agent開発 初⼼者向け
  10. © LayerX Inc. 20 実践マルチモーダル検索!まとめ 検索インデックス クエリ 検索手法 コメント メタデータ

    → タグやカテゴリ タグやカテゴリ カテゴリ検索 これが一番楽。おすすめ テキスト → テキスト テキスト 全文検索 ベクトル検索 データ抽出も調整、テストも やりやすい 画像 → テキスト テキスト 全文検索 ベクトル検索 LLM/VLMを信じて費用対効果が 出せるならOK 画像 → 画像 画像 ベクトル検索 画像が好きなら試すのも有り
  11. © LayerX Inc. 21 We are hiring! AI検索エンジニア https://open.talentio.com/r/1/c/layerx/pages/107758 Applied

    R&Dリサーチエンジニア https://open.talentio.com/r/1/c/layerx/pages/110834 MLOps / 機械学習基盤エンジニア https://open.talentio.com/r/1/c/layerx/pages/112898