Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実践マルチモーダル検索!
Search
shibuiwilliam
October 30, 2025
Technology
1.1k
3
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
実践マルチモーダル検索!
shibuiwilliam
October 30, 2025
More Decks by shibuiwilliam
See All by shibuiwilliam
Rule repository
shibuiwilliam
3
50
LLM時代の検索アーキテクチャと技術的意思決定
shibuiwilliam
4
2.4k
Why Open Dataspacesのまとめ
shibuiwilliam
2
59
マルチモーダル非構造データとの闘い
shibuiwilliam
2
600
飽くなき自動生成への挑戦
shibuiwilliam
1
85
AIエージェントのメモリについて
shibuiwilliam
1
730
画像生成AIについて
shibuiwilliam
1
68
2026年はチャンキングを極める!
shibuiwilliam
9
2.3k
R&Dチームを起ち上げる
shibuiwilliam
1
270
Other Decks in Technology
See All in Technology
2026年6月23日 Syncable Tech + Start Python Club にて
hamukazu
0
120
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
4
690
エラーバジェットのアラートのタイミングを考える.pdf
kairim0
0
150
就職⽀援サービスにおけるキャリアアドバイザーのシフトスケジューリング
recruitengineers
PRO
1
150
手塩にかけりゃいいってもんじゃない
ming_ayami
0
600
AmazonRoute 53ではじめてのドメイン取得!HTTPS化までの道のりを整理してみた
usanchuu
3
140
2026TECHFRESH畢業分享會 - AI 時代的人生存檔點
line_developers_tw
PRO
0
1.2k
AIはどのように 組織のアジリティを変えるのか?
junki
4
970
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
310
Agent Skills設計で柔軟性と硬さのバランスが難しい話
nassy20
0
130
日本 Fintech 未来予測レポート 2027〜2028年(手動編集版)
8maki
0
2.4k
Oracle AI Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
6
2k
Featured
See All Featured
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.2k
ラッコキーワード サービス紹介資料
rakko
1
3.7M
Game over? The fight for quality and originality in the time of robots
wayneb77
1
200
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
123
22k
Are puppies a ranking factor?
jonoalderson
1
3.6k
Everyday Curiosity
cassininazir
0
230
Bridging the Design Gap: How Collaborative Modelling removes blockers to flow between stakeholders and teams @FastFlow conf
baasie
0
590
Tell your own story through comics
letsgokoyo
1
950
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
62k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
840
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Transcript
© LayerX Inc. 実践マルチモーダル検索! 2025/10/30 LayerX Ai Workforce事業部 R&D(データ検索基盤)マネージャー しぶい
⾃⼰紹介 shibui yusuke • いろいろ → Stability AI → LayerX(いまここ)
• データ検索とR&Dのマネージャー • MLOps & データ検索 & バックエンド & インフラ & その他諸々エンジニア • MLOpsコミュニティ運営 • 最近やりたいこと ⽣成AIの⽣成AI以外のエンジニアリング • Github: @shibuiwilliam • FB: yusuke.shibui 猫のようで サイズは犬 猫耳メガネ LLMに聞いてみた
機械学習を本番システムに組み込む方法を デザインパターンとして整理! 機械学習を組み込んだ本番システムを 実際にハンズオンで作る! 【共著】大企業からスタートアップまで、 MLOpsの実践例を集約! 乞うご期待! ???
© LayerX Inc. 4 Ai Workforceは情報利活⽤のハブ 構造化 データ ⽣成 情報検索
© LayerX Inc. 5 「知的単純作業」 ドキュメントワークの多くは、思考⼒‧集中⼒が必要であり、その業界‧業務の専⾨性が必要である。 ⼀⽅、正解が決まっていてクリエイティビティがなく、「早く終わらせる」以外に差別化が乏しい。 毎回同じことの繰り返しで やりがいがない 必要なファイルを探すのに
時間がかかる 自分以外に 引き継げる人がいない
© LayerX Inc. 6 AIワークフロー機能を使って、さまざまな処理をブロックのように組み合わせることで幅広い業務をAIが代⾏。 処理結果に対して根拠の箇所に直接スクロールしてハイライトしてくれるレビュー機能などを備える。 「知的単純作業」 をLLMとAI Agentで解くAi Workforce
AIワークフローの構築 業務実行&レビュー
• 実践マルチモーダル検索! • まとめ
© LayerX Inc. 8 ⽣成AIで拡張する情報抽出 { "title": "なぜスタートアップなのか", "description": "イノベーションを創出し、⼤きく成⻑するスター
トアップは経済成⻑のドライバーとなる存在であることを⽰すス ライド。特に、⽶国経済ではGAFAMのような新興企業が経済成⻑ を牽引していることを強調している。", "graph_overview": { "graph_title": "⽇本(TOPIX)と⽶国(S&P)における直近10年 間の株式市場のパフォーマンスの推移", "x_axis": "年(2010〜2020)", "y_axis": "騰落率(%)", "data_series": [ { "label": "S&P500(GAFAM含む)", "color": "⻘", "trend": "2010年以降、急上昇し約+900%近くまで成⻑。" }, { "label": "S&P500(GAFAM除く)", "color": "⾚", "trend": "緩やかな上昇。約+200〜300%程度の伸び。" }, { "label": "TOPIX", "color": "黒", "trend": "ほぼ横ばいで推移。成⻑率は+100〜200%程度。" } ] }, "graph_meaning": { "main_message": "GAFAMのような新興企業が⽶国経済成⻑を 牽引しており、それらを除くと⽇⽶の株式市場の成⻑差は⼩さい ことを⽰している。", "insight": "スタートアップや新興企業の存在が経済全体の成⻑ に⼤きな影響を与えており、⽇本でも同様にイノベーションを⽣ み出すスタートアップの育成が重要であることを⽰唆している。" } }
© LayerX Inc. 9 検索に登録するデータ 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 XXレポート.pptx
ファイル名「XXレポート.pptx」 個々のコンテンツ OCR/VLM VLM Object detection ドキュメント種別「経済分析」「スライド」
© LayerX Inc. 10 検索に登録するデータ 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 XXレポート.pptx
個々のコンテンツ OCR/VLM Object detection 全⽂検索 ベクトル検索 ベクトル検索 ベクトル検索 カテゴリ検索 全⽂検索 全⽂検索 ベクトル検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 VLM
© LayerX Inc. 11 検索する⽅法 画像による検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ
画像⾔語 ベクトル 画像⾔語 ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 VLM VLM VLM VLM クエリ画像からテキストを 抽出してカテゴリ、全⽂検索 クエリ画像からベクトルを 作成して類似ベクトル検索
© LayerX Inc. 12 検索する⽅法 画像による検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ
画像⾔語 ベクトル 画像⾔語 ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 全般的に作成、調整、テストが⼿間
© LayerX Inc. 13 検索する⽅法 テキストによる検索 検索「スタートアップ」 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体
個々のコンテンツ 画像⾔語 ベクトル テキスト ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 VLM LLM
© LayerX Inc. 14 検索する⽅法 テキストによる検索 書いてある情報「なぜスタートアップなのか」 コンテンツから抽出した説明「S&P(GAFAM含 む)は2010年から2020年で900%近く成⻑」 ドキュメント全体 個々のコンテンツ
画像⾔語 ベクトル テキスト ベクトル カテゴリ検索 全⽂検索 ファイル名「XXレポート.pptx」 ドキュメント種別「経済分析」「スライド」 作成、調整しやすい 作成、調整が⼿間 画像コンテンツを テキスト検索する 丁度よい⼿法
© LayerX Inc. 15 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding
& rewrite
© LayerX Inc. 16 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding
& rewrite LLMのテキスト‧画像認識を 活⽤して、スライドの コンテンツ情報を構造的に 抽出し、検索データとする Title Description Keywords Object
© LayerX Inc. 17 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding
& rewrite クエリの検索⽬的や⽤途に 応じてスキーマの重みを 調整し、検索性能を向上 Title: 0.1 Description: 0.3 Keywords: 0.1 Object: 0.5 Query 右肩上がりのグラフ
© LayerX Inc. 18 LLMを駆使したスライド検索 情報抽出 検索 インデックス Query understanding
& rewrite クエリやコンテキストから LLMで意図を理解し、 クエリをリライト Query AI Agentを作りたいけど 作り⽅とかわからないし 最近はOpenAIとか有名だ けどPythonとか‧‧‧ Rewrite AI Agentの作り⽅, OpenAIのAI Agent, PythonのAI Agent開発 初⼼者向け
• 実践マルチモーダル検索! • まとめ
© LayerX Inc. 20 実践マルチモーダル検索!まとめ 検索インデックス クエリ 検索手法 コメント メタデータ
→ タグやカテゴリ タグやカテゴリ カテゴリ検索 これが一番楽。おすすめ テキスト → テキスト テキスト 全文検索 ベクトル検索 データ抽出も調整、テストも やりやすい 画像 → テキスト テキスト 全文検索 ベクトル検索 LLM/VLMを信じて費用対効果が 出せるならOK 画像 → 画像 画像 ベクトル検索 画像が好きなら試すのも有り
© LayerX Inc. 21 We are hiring! AI検索エンジニア https://open.talentio.com/r/1/c/layerx/pages/107758 Applied
R&Dリサーチエンジニア https://open.talentio.com/r/1/c/layerx/pages/110834 MLOps / 機械学習基盤エンジニア https://open.talentio.com/r/1/c/layerx/pages/112898
実践マルチモーダル検索! ありがとうございました!