Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
データエージェントのためのナレッジカタログ
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
na0
May 25, 2026
530
0
Share
データエージェントのためのナレッジカタログ
2026-05-25 データ利活用分科会 #33
https://jaguer.connpass.com/event/392373/
na0
May 25, 2026
More Decks by na0
See All by na0
データ活用 3.0 with Socrates
na0
2
2k
AI 時代のデータ戦略
na0
8
6k
adk-samples に学ぶデータ分析 LLM エージェント開発
na0
3
1.7k
BigQuery でできること、人間がやるべきこと
na0
0
1.3k
データ分析エージェント Socrates の育て方
na0
10
6.6k
AI エージェントと考え直すデータ基盤
na0
26
13k
メルカリにおけるデータアナリティクス AI エージェント「Socrates」と ADK 活用事例
na0
29
35k
BigQuery リリースノート - 2023年上半期 #bq_sushi
na0
3
510
2023 年の BigQuery 権限管理
na0
5
3.4k
Featured
See All Featured
Ethics towards AI in product and experience design
skipperchong
2
280
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
180
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
110
Ecommerce SEO: The Keys for Success Now & Beyond - #SERPConf2024
aleyda
1
2k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
190
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.7k
Leading Effective Engineering Teams in the AI Era
addyosmani
9
1.9k
How to Think Like a Performance Engineer
csswizardry
28
2.6k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
330
Un-Boring Meetings
codingconduct
0
290
Lightning talk: Run Django tests with GitHub Actions
sabderemane
0
180
Transcript
1 データエージェントのためのナレッジカタログ 2026-05-25 データ利活用分科会 #33 na0
2 メルカリ Japan Business Data Google Developer Expert (Cloud) na0
Japan Region Mercari Group Fintech 3 会社概要 メルカリグループは、株式会社メルカリと、その連結子会社で構成されています。 Marketplace
株式会社メルカリ ◼設立 ◼事業内容 ◼所在地 ◼拠点 ◼代表執行役 CEO ◼執行役 SVP of Japan Region ◼執行役員 CEO Marketplace 2013年2月1日 スマートフォン向けフリマアプリ 「メルカリ」の企画・開発・運営 〒106-6118 東京都港区六本木6-10-1 六本木ヒルズ森タワー 東京、福岡、大阪 山田進太郎 山本真人 迫俊亮 ①2017年11月20日 ②金融事業 ③永沢岳志 株式会社メルペイ ①2014年1月 ②US版メルカリの企画・開発・運営 ③山田進太郎 ④Palo Alto, California Mercari, Inc.(US) ①1991年10月1日 ②フットボールクラブ運営 ③小泉文明 ④茨城県立カシマサッカースタジアム 指定管理茨城県鹿嶋市 粟生東山2887番地 株式会社鹿島 アントラーズ・エフ・シー インド開発拠点 ①2022年6月 ②インターネットサービス開発 ③Carlos Donderis(取締役 Managing Director) ④Bangalore, Karnataka, India Mercari Software Technologies India Private Limited ①2021年4月28日 ②暗号資産・ブロックチェーン ③中村奎太 株式会社メルコイン ①設立 ②事業内容 ③CEO ④所在地
2013年2月1日 会社設立日 東京、福岡、大阪 Palo Alto、Bangalore オフィス 2,190名(連結) 従業員数 4
株式会社メルカリ 概要
5 データエージェント Socrates 自然言語でデータを扱える LLM エージェント Web / A2A 環境
550+ MAU
6 高額な「検証税」を節税するには …? 生成 AI で節約した時間のうち 4 割が手戻りで失われる 37 %
https://forms.workday.com/en-us/reports/beyond-productivity-ai-value/form.html Beyond Productivity: Measuring the Real Value of AI
7 データ環境の複雑さ、曖昧さ、が主な原因 データ業務における「検証税」の正体 https://arxiv.org/abs/2411.07763 Spider 2.0: Evaluating Language Models on
Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル / 列選択の誤り 35.5 % 多段クエリ / 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り 7.4 % 構文 エラー 4.7 % ナレッジ の誤解 5.1 % コンテキ スト限界
8 Socrates の現在地
9 BigQuery Socrates の技術要素 Web / MCP / A2A Google
ADK Gemini Skills Tools LLMs Looker Vector Search その他
10 Socrates Skills : 多段クエリ / 高度な計算を支援する 複雑な CTE、新しい BigQuery
関数の記述を支援する Agent Skills を提供
11 ナレッジの読み書きツールを Web / MCP で提供 主なドキュメント • Looker /
BigQuery に 未実装のルール • 社内固有の概念 • 歴史的経緯 • ガバナンスルール Socrates Knowledge : テーブル / 列 / 行選択を支援
12 Socrates Resource Catalog : コンテキストの最小化 project dataset users transactions
dataset_b payments 階層構造の API users transactions payments フラットなカタログで効率化
13 これまでの取り組みで 一部領域の「検証税」を抑制する 仕組みができつつある 「検証税」の 90% 抑制を目指す https://arxiv.org/abs/2411.07763 Spider 2.0:
Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル・ 列選択の誤り 35.5 % 多段クエリ・ 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り ✅ 5.1 % コンテキ スト限界 7.4 % 構文 エラー 4.7 % ナレッジ の誤解
14 Socrates のこれから
15 問題:品質と網羅性を両立できない AI 時代の機動性 を組織に導入するために、このトレードオフから脱却したい 品質 網羅性 既存レポート 定形外クエリ 定型クエリ
Socrates Knowledge トレードオフ
16 小問題:書き手が品質を管理できない 構造の問題をエージェントで解消し、誰でもナレッジに貢献できる仕組みへ 現状 理想 • 書き手の負担が大きい • 新人が参加しにくい •
特定の場所 / ルールへの依存 • 書きたい時に書く (人 & AI) • 誰でも参加しやすい • どこに書いても参画できる 執筆 検証 ナレッジ 執筆 生ナレッジ 検証 ナレッジ 司書 エージェント
17 Socrates Knowledge v2 ingest : 取り込み query : 検索
compile : 構造化 lint : 検証 deprecate : 破棄 raw sources Wiki https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f LLM Wiki 司書 エージェント
18 Socrates Knowledge v2 - compile 生ナレッジ • 個人メモ •
チーム固有の概念 • 歴史的経緯 • BigQuery descriptions … compile : 構造化 構造化ナレッジ「主張」 名前 : GMV 定義 : メルカリの取引総額 計算式 : SUM(price) WHERE status=’complete’ 参考文献 notion.so/xxx slack.com/yyy 異なる定義の用例 …
19 Socrates Knowledge v2 - lint 構造化ナレッジ「主張」 名前 : GMV
定義 : メルカリの取引総額 計算式 : SUM(price) WHERE status=’complete’ 証拠 notion.so/xxx slack.com/yyy 異なる定義の用例 … lint : 評価 lint score • 矛盾はないか • Raw sources の提案 • 過剰な推論はないか • 証拠能力 • 証拠の鮮度 ...
20 司書エージェントの導入で 全領域の「検証税」抑制へ 全ての「検証税」の抑制する https://arxiv.org/abs/2411.07763 Spider 2.0: Evaluating Language Models
on Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル・ 列選択の誤り 35.5 % 多段クエリ・ 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り ✅ 5.1 % コンテキ スト限界 7.4 % 構文 エラー 4.7 % ナレッジ の誤解
21 データ業務の完全自動運転を目指して 「検証税」がなくなると、より遠くへ自走できる Level 2 現在地 人が運転席 Agent は助手席 「これ調べて」
→ Agent が回答 Level 3 これから Agent が運転席 「こんな仮説あるけど」 → 「すでに調べてあるよ」 「この情報考慮して」 →「新情報を発見したよ」