Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データエージェントのためのナレッジカタログ

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for na0 na0
May 25, 2026
530

 データエージェントのためのナレッジカタログ

2026-05-25 データ利活用分科会 #33
https://jaguer.connpass.com/event/392373/

Avatar for na0

na0

May 25, 2026

More Decks by na0

Transcript

  1.    Japan Region Mercari Group Fintech 3 会社概要 メルカリグループは、株式会社メルカリと、その連結子会社で構成されています。 Marketplace

    株式会社メルカリ ◼設立 ◼事業内容 ◼所在地 ◼拠点 ◼代表執行役 CEO ◼執行役 SVP of Japan Region ◼執行役員 CEO Marketplace     2013年2月1日     スマートフォン向けフリマアプリ     「メルカリ」の企画・開発・運営     〒106-6118 東京都港区六本木6-10-1     六本木ヒルズ森タワー     東京、福岡、大阪     山田進太郎     山本真人     迫俊亮 ①2017年11月20日 ②金融事業 ③永沢岳志 株式会社メルペイ ①2014年1月 ②US版メルカリの企画・開発・運営 ③山田進太郎 ④Palo Alto, California Mercari, Inc.(US) ①1991年10月1日 ②フットボールクラブ運営 ③小泉文明 ④茨城県立カシマサッカースタジアム 指定管理茨城県鹿嶋市 粟生東山2887番地 株式会社鹿島 アントラーズ・エフ・シー インド開発拠点 ①2022年6月 ②インターネットサービス開発 ③Carlos Donderis(取締役 Managing Director) ④Bangalore, Karnataka, India Mercari Software Technologies India Private Limited ①2021年4月28日 ②暗号資産・ブロックチェーン ③中村奎太 株式会社メルコイン ①設立 ②事業内容 ③CEO ④所在地
  2. 6 高額な「検証税」を節税するには …? 生成 AI で節約した時間のうち 4 割が手戻りで失われる 37 %

    https://forms.workday.com/en-us/reports/beyond-productivity-ai-value/form.html Beyond Productivity: Measuring the Real Value of AI
  3. 7 データ環境の複雑さ、曖昧さ、が主な原因 データ業務における「検証税」の正体 https://arxiv.org/abs/2411.07763 Spider 2.0: Evaluating Language Models on

    Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル / 列選択の誤り 35.5 % 多段クエリ / 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り 7.4 % 構文 エラー 4.7 % ナレッジ の誤解 5.1 % コンテキ スト限界
  4. 9 BigQuery Socrates の技術要素 Web / MCP / A2A Google

    ADK Gemini Skills Tools LLMs Looker Vector Search その他
  5. 11 ナレッジの読み書きツールを Web / MCP で提供 主なドキュメント • Looker /

    BigQuery に 未実装のルール • 社内固有の概念 • 歴史的経緯 • ガバナンスルール Socrates Knowledge : テーブル / 列 / 行選択を支援
  6. 12 Socrates Resource Catalog : コンテキストの最小化 project dataset users transactions

    dataset_b payments 階層構造の API users transactions payments フラットなカタログで効率化
  7. 13 これまでの取り組みで 一部領域の「検証税」を抑制する 仕組みができつつある 「検証税」の 90% 抑制を目指す https://arxiv.org/abs/2411.07763 Spider 2.0:

    Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル・ 列選択の誤り 35.5 % 多段クエリ・ 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り ✅ 5.1 % コンテキ スト限界 7.4 % 構文 エラー 4.7 % ナレッジ の誤解
  8. 16 小問題:書き手が品質を管理できない 構造の問題をエージェントで解消し、誰でもナレッジに貢献できる仕組みへ 現状 理想 • 書き手の負担が大きい • 新人が参加しにくい •

    特定の場所 / ルールへの依存 • 書きたい時に書く (人 & AI) • 誰でも参加しやすい • どこに書いても参画できる 執筆 検証 ナレッジ 執筆 生ナレッジ 検証 ナレッジ 司書 エージェント
  9. 17 Socrates Knowledge v2 ingest : 取り込み query : 検索

    compile : 構造化 lint : 検証 deprecate : 破棄 raw sources Wiki https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f LLM Wiki 司書 エージェント
  10. 18 Socrates Knowledge v2 - compile 生ナレッジ • 個人メモ •

    チーム固有の概念 • 歴史的経緯 • BigQuery descriptions … compile : 構造化 構造化ナレッジ「主張」 名前 : GMV 定義 : メルカリの取引総額 計算式 : SUM(price) WHERE status=’complete’ 参考文献 notion.so/xxx slack.com/yyy 異なる定義の用例 …
  11. 19 Socrates Knowledge v2 - lint 構造化ナレッジ「主張」 名前 : GMV

    定義 : メルカリの取引総額 計算式 : SUM(price) WHERE status=’complete’ 証拠 notion.so/xxx slack.com/yyy 異なる定義の用例 … lint : 評価 lint score • 矛盾はないか • Raw sources の提案 • 過剰な推論はないか • 証拠能力 • 証拠の鮮度 ...
  12. 20 司書エージェントの導入で 全領域の「検証税」抑制へ 全ての「検証税」の抑制する https://arxiv.org/abs/2411.07763 Spider 2.0: Evaluating Language Models

    on Real-World Enterprise Text-to-SQL Workflows 27.6 % テーブル・ 列選択の誤り 35.5 % 多段クエリ・ 高度な計算の誤り 11.5 % 行選択の 誤り 8.3 % 結合の 誤り ✅ 5.1 % コンテキ スト限界 7.4 % 構文 エラー 4.7 % ナレッジ の誤解
  13. 21 データ業務の完全自動運転を目指して 「検証税」がなくなると、より遠くへ自走できる Level 2 現在地 人が運転席 Agent は助手席 「これ調べて」

     → Agent が回答 Level 3 これから Agent が運転席 「こんな仮説あるけど」  → 「すでに調べてあるよ」 「この情報考慮して」  →「新情報を発見したよ」