Upgrade to Pro — share decks privately, control downloads, hide ads and more …

マルチモーダル非構造データとの闘い

 マルチモーダル非構造データとの闘い

2026/04/06【DataOps Night #10 ~エンタープライズAIエージェントを支える技術~】登壇資料
https://finatext.connpass.com/event/386359/

Avatar for shibuiwilliam

shibuiwilliam

April 05, 2026

More Decks by shibuiwilliam

Other Decks in Technology

Transcript

  1. ⾃⼰紹介 shibui yusuke • いろいろ → Stability AI → LayerX(いまここ)

    • 検索データ, R&Dチームのマネージャー • MLOpsコミュニティ運営 • 最近やりたいこと ⽣成AIの⽣成AI以外のエンジニアリング • Github: @shibuiwilliam • FB: yusuke.shibui • データ検索基盤チームの起ち上げ https://tech.layerx.co.jp/entry/2026/01/20/140000
  2. © LayerX Inc. 11 LLM/VLMで増える扱えるデータ 世の中のドキュメントはマルチモーダル { "title": "なぜスタートアップなのか", "description":

    "イノベーションを創出し、⼤きく成⻑するスター トアップは経済成⻑のドライバーとなる存在であることを⽰すス ライド。特に、⽶国経済ではGAFAMのような新興企業が経済成⻑ を牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10年 間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }, { "label": "TOPIX", "color": "黒", "trend": "ほぼ横ばいで推移。成⻑率は+100〜200%程度。" } ] }, "graph_meaning": { "main_message": "GAFAMのような新興企業が⽶国経済成⻑を 牽引しており、それらを除くと⽇⽶の株式市場の成⻑差は⼩さい ことを⽰している。", "insight": "スタートアップや新興企業の存在が経済全体の成⻑ に⼤きな影響を与えており、⽇本でも同様にイノベーションを⽣ み出すスタートアップの育成が重要であることを⽰唆している。" } }
  3. © LayerX Inc. 24 マルチモーダルデータを扱う課題 { "title": "なぜスタートアップなのか", "description": "イノベーションを創出し、⼤きく成⻑するスター

    トアップは経済成⻑のドライバーとなる存在であることを⽰すス ライド。特に、⽶国経済ではGAFAMのような新興企業が経済成⻑ を牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10年 間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }... } LLM/ VLM LLM/ VLM 情報抽出 変換、登録 利⽤
  4. © LayerX Inc. 25 マルチモーダルデータを扱う課題 • 正確性 • 網羅性 •

    有⽤性 { "title": "なぜスタートアップなのか", "description": "イノベーションを創出し、⼤きく成⻑するスター トアップは経済成⻑のドライバーとなる存在であることを⽰すスラ イド。特に、⽶国経済ではGAFAMのような新興企業が経済成⻑を 牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10年 間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }... } LLM/ VLM LLM/ VLM • 信頼性 • 更新性 • ⽤途 • 発⾒可能性 • ⾃⼰修復性
  5. © LayerX Inc. 26 マルチモーダルデータを扱う課題 • 正確性 • 網羅性 •

    有⽤性 { "title": "なぜスタートアップなのか", "description": "イノベーションを創出し、⼤きく成⻑するスター トアップは経済成⻑のドライバーとなる存在であることを⽰すス ライド。特に、⽶国経済ではGAFAMのような新興企業が経済成⻑ を牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10 年間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }... } LLM/ VLM LLM/ VLM モデル⾃体の認識性能 プロンプトエンジニアリング LLM-as-a-Judge ML/AIとの組み合わせ LoRA/Fine tuning Feedback loopを回したいが、 データ規模と処理コスト的に 何度も検証できるものではない
  6. © LayerX Inc. 27 マルチモーダルデータを扱う課題 { "title": "なぜスタートアップなのか", "description": "イノベーションを創出し、⼤きく成⻑するス

    タートアップは経済成⻑のドライバーとなる存在であることを⽰ すスライド。特に、⽶国経済ではGAFAMのような新興企業が経済 成⻑を牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10 年間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }... } LLM/ VLM LLM/ VLM • 信頼性 • 更新性 • ⽤途 • 正確性 • 網羅性 • 有⽤性 ←情報抽出の性能が 変換‧登録の品質になる→ ⽤途によって変換⽅法や登録先が 異なるが、実装‧実⾏コストは 情報抽出より⾼い
  7. © LayerX Inc. 28 マルチモーダルデータを扱う課題 { "title": "なぜスタートアップなのか", "description": "イノベーションを創出し、⼤きく成⻑するスター

    トアップは経済成⻑のドライバーとなる存在であることを⽰すス ライド。特に、⽶国経済ではGAFAMのような新興企業が経済成⻑ を牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10 年間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }... } LLM/ VLM LLM/ VLM • 発⾒可能性 • ⾃⼰修復性 情報抽出、変換、登録の品質が AIエージェントによるデータ活⽤の 妥当性になる 同時に、AIエージェント⾃体が データ利活⽤の品質を左右
  8. © LayerX Inc. 29 マルチモーダル⾮構造データとの闘い • ほとんどのドキュメントはマルチモーダルであり、AIエージェントもマルチモーダル対応が必要 • 画像やグラフ、ダイアグラム、⾳声、動画等は⾃然⾔語よりも受け取り⼿によって理解が異なる •

    従来のマルチモーダルデータのエンジニアリングはML/AI領域だったが、AIエージェントの⼒を発揮 するためにデータエンジニアリングの戦場にもなってきている • 俺達の闘いはこれからだ!