なぜトークンは足りなくなるのか？〜LLMとうまく連携するためにエンジニアがやるべきデータ整備の話〜

なぜトークンは足りなくなるのか？ LLMとうまく連携するためにエンジニアがやるべきデータ整備の話 2026/05/14 pixiv Inc. 新田大樹(kashira)

2 自己紹介新田大樹 (@kashira) ピクシブ株式会社 Platform Div, Data Unit
テックリード X: @kashira202111 BigQuery を中心とした全社データインフラの開発・運用を統括。現在は LLM を活用したデータ分析エージェントの開発をリードし、社内のデータ民主化を推進しています。

アジェンダ 1. 会社紹介 2. 企業のLLM活用の現状 3. 事例紹介 4. 技術的な深掘り a.
LLM周りの基礎概念の紹介 b. Context Engineeringの実例 5. 新しいJobの誕生 6. まとめ・なぜトークンは足りなくなるのか？ 3

会社紹介 5 特徴 1. 複数プロダクト 2. 少数精鋭で運営 3. プロダクト毎で技術選定

Q. LLMを使っていますか？ • 現状: ◦ 学生の皆さんも使っている人はいるはず ◦ 「自分のコードをLLMに書かせる」のはすごく便利 ◦ 爆速でプロトタイプが作れる
◦ Googleでは新規コードの75%はLLMで作られている ▪ Cloud Next ‘26: Momentum and innovation at Google scale 7

学生からの不安 • 「LLMが全部コードを書いてくれるなら...」 • 「数年後、僕らエンジニアの仕事ってなくなるんですか？」 8

個人的には無くならないと思っている • エンジニアに求められるスキルは変化するが、無くならない • 言われた通りにプログラムするスキルの需要は低くなるが、それだけがエンジニアの仕事ではない 9

企業が直面しているLLMでの壁 • コード作成以外のプロセスがボトルネックになっている • ビジネスメンバーの利用ハードルが高い • (new) コストが高い, トークンが足りない ◦
LLMを使った分だけ、リターンがちゃんと出るのか？ 10

コード作成はビジネスの一部に過ぎない • LLMによってコード作成は早くなりましたが、これは開発の一部に過ぎません • コード作成だけを早くしても開発全体のスピードは速くならない • 自動化する部分を増やして、一連の流れ(Value Stream)の全体を最適化するのが重要 11
全てを自動化するのではない。任せない部分を作るのも大事な決定。

ビジネスメンバーのLLM利用ハードルが高い • Claude CodeやCursorを触るのに抵抗がある人が多い • セットアップがエンジニア特有で難しい • 雑に使うのはセキュリティ的に危ない • コスパが悪い
13 もちろん出来る人もいるし、増えているが多くがそうではない。

トークンが足りない • 基礎的なLLMの知識を知らずに使っていると、トークンの消費が激しい • 例えば ◦ どのタイミングでトークンが消費されるのか？ ◦ Context Windowの概念や特性
14 Github Copilotが従量課金になったりと、今後トークン最適化が重要なテーマになると考えている。

これら全て、環境整備(データ整備)の問題 15

LLMのための環境整備のスキルは需要が高まっている 16

LLM周りの基礎概念の紹介 b. Context Engineeringの実例 5. 新しいJobの誕生 6. まとめ・なぜトークンは足りなくなるのか？ 17 あくまで一例なので、他にも活躍できる場所はいっぱいあるよ。従来のエンジニアリングでも不要になるとは思わないけど、今回は扱わない。

内製のデータエージェント、kaiについて 18 • ピクシブ株式会社、内製のデータエージェントです • 分析用のデータベース、BigQueryにSQLを自動で実行して、インサイトを自動で引き出します ◦ 先週リリースした機能の利用度を教えて ◦
登録者数の性別比は？ • Before ◦ SQLをかける人だけが、数値を調べられた ◦ 大体数値を見るのに、エンジニアの手を借りつつ2-3日かかっていた • After ◦ 30分-1時間で気になる数値を誰でもサクッと調べられる

19 ここら辺を最適化

全社の約4割の人間が活用ざっくり利用率 • 1週間に80人が利用 • 1ヶ月で150人が利用 20

SQL の自動生成 21 自然言語で問い合わせ -> Table を参照-> SQL を実行->データを報告・解釈してレポート

可視化もサポート 22 データ取得->可視化を高速に行うことで仮説検証のスピード UP

インフラ・アーキテクチャ 23 Internal User Personal Context Google Services Identity-Aware Proxy
Cloud Run (Google ADK) Vertex AI BigQuery Gemini State Cloud SQL

基本的な処理の流れ 24 List BigQuery Tables 2 Call Root Agent 1
Get BigQuery Table Schema 3 Execute Query 4 Return to User 5

Google Cloud主催のイベントでも発表しました 25

まずは、基礎概念の紹介 28

LLMは過去のテキストを元に次の単語を予測する 29 引用: 3Blue1BrownJapan, LLMの仕組み（簡単バージョン）, https://youtu.be/y 7NQiNER6r4?si=T9 uvQj0P5r2IQBWH&t
=172

学習していないことは知らない PROMPT # 自社の売上データ(未学習データ) 昨日のA商品の売上は50万円、 B商品の売上は120万円でした。 # 質問合計売上と、どちらが売れたか教えて。
LLM ANSWER 承知いたしました。合計売上は170万円です。 B商品（120万円）の方がA商品（50万円）よりも売れています。データがPublicでなくても Context として与えれば推論可能です。

Agentとは 31 • LLMが学習したデータだけでは解けない問題は多い ◦ 例えば、ピクシブ株式会社が保有する独自データを使った分析など • 独自データを毎回プロンプトに入れるのは無理 • これを解決するのが、Agent
system • 自律的にツールを使って、外部データを入力する、Actionを起こすことで依頼を達成する

Agentとは 32 # Agentの超ざっくりコード is_running = True history = []
# Contextを積み上げるための履歴 while is_running: # 1. 環境や過去の履歴から情報を取得 (RAGやMemory) context = get_context_and_data(history) # 2. Contextに基づき、次に取るべき行動を決定 (LLM Call) action = llm.decide_next_step(context) # 3. 行動: 決定された行動 (Tool) を実行 tool_output = execute_action(action) # 4. 履歴を更新し、次のループへ history.append(tool_output) # 終了条件の確認 if action == "RETURN_FINAL_ANSWER" or max_iterations_reached(): is_running = False

Prompt Engineering vs Context Engineering 33 Promptは1回限りのクエリの最適化に焦点 Contextは繰り返しの中で、どのデータを入力する
かに焦点引用: Anthropic, Eﬀective context engineering for AI agents, https://www.anthropic.com/engineering/eﬀective-context-engineering-for-ai-agents

AgentはContextを積み上げる & LLMには入力限界(Context windows)がある 34 引用: Anthropic, Context windows, https://platform.cl
aude.com/docs/ja/b uild-with-claude/co ntext-windows#

Contextは入れすぎると精度が悪くなる (Context Rot) 35 引用: Chroma, Context Rot: How Increasing
Input Tokens Impacts LLM Performance, https://www.trych roma.com/research/ context-rot

Agent作成の要は Context Engineering 36

Context Engineeringとは、 LLMに渡すデータを制御するエンジニアリング 37

Context Engineeringはどんなことをしているのか？具体例を見ていこう 38

LLM周りの基礎概念の紹介 b. Context Engineeringの実例 i. Case1: 精度の壁 ii. Case2: データ整備の壁 5. 新しいJobの誕生 6. まとめ・なぜトークンは足りなくなるのか？ 39

kaiの背景 40 背景: 社内のDBにデータは集まっているが、SQLを書かないと分析できないケースが多い。そのため、PdMやマーケは数値をあまり見ることが出来ず、施策を行う合意形成が遅く、また一部では勘で仕事を進めている。目指す解決策: Agentを使って、SQLを自動で作って分析できる仕組みを作ろう。

初期の実装まずは、既存の業務フローの通りの指示をLLMにやらせようとしました。 1. 普段使われているダッシュボード(Looker Explore)を特定する 2. ダッシュボードで使われているクエリを参照する 3. そのデータからクエリを作成する 4.
実行する 5. 結果を返す 42

上手くいきませんでした 43

当初のLLMの出力: user_idごとにイラスト・漫画の合計作品数を教えて 44 LLMの出力結果期待している回答

問題点に気づきましたか？ 45 Call SubAgent 2 Call Root Agent 1 List
Explore 3 Get Explore 4 Transform Json 5 Return to Root Agent 6 Get BigQuery Table Schema 7 Execute Query 8 Return to User 9

問題点 • ダッシュボードが500個以上あり、整備されていない汚いデータになっている ◦ ので、間違ったダッシュボードを引っ張ってきて値がズレることが多い • 要求するステップ数が多い ◦ Toolの呼び出し、実行結果などのイベントがトークンの無駄な消費に繋がっている
◦ コンテキストエンジニアリングとは多少ズレるけど、LLMは確率動作なので何回も実行すればそれだけ間違いの確率は増えていく 46

リアーキテクチャ 47 List BigQuery Tables 2 Call Root Agent 1
Get BigQuery Table Schema 3 Execute Query 4 Return to User 5 テーブル検索ロジックをダッシュボード検索 -> 整備済みテーブル一覧のみを返すロジックに変更精度の向上 + 消費トークン削減 + コードが簡単になるの3重で嬉しい

Schemaからクエリ構築に必要なContext を動的にロードする 48 List BigQuery Tables 2 Call Root Agent
1 Get BigQuery Table Schema 3 Execute Query 4 Return to User 5 動的がポイントで、全てinstructionに入れると逆にコンテキスト汚染が起こり、精度が悪化する。テーブルを使う時に、そのテーブルのコンテキストだけ注入するイメージ

メタデータ整備 49 - name: work_type description: | Deﬁnition: 作品の種類区分。 Example
Data: - "illustration": イラスト - "manga": マンガ - "ugoira": うごイラ - "novel": 小説 Transformation Rule: ソースの作品種別コードを標準名称に変換 tests: - not_null - accepted_values: values: ['illustration', 'manga', 'ugoira', 'novel'] テーブルスキーマを見ればクエリが書けるようにする • Filteringの値の候補 • 日本語とのマッピング • NULL定義

改善後のLLMの出力: user_idごとにイラスト・漫画の合計作品数を教えて 50 期待している回答 LLMの出力結果データ整備すれば基礎的なクエリは、ほぼ完璧に出せる

LLM Readyなパイプラインを作ることで精度・コストで良い結果に 51

LLM Readyなデータがあれば、精度は上がる => データ整備が非常に重要 52

新たな問題点データ整備が追いつかない 54

データ整備がボトルネック 55 整備済みのテーブル一覧を返す = 精度を出すにはテーブル整備が必要になる。それ以外のテーブルを使いたケースが多く、業務適応が部分的になっていた。例: • OK: BOOTHのBOOST機能込みの売り上げが見たい
from 経営陣 • NG: BOOTHの配送手数料、手数料を分解した売り上げが見たい from 現場 • NG: Comicの売り上げが見たい from 現場

Team Contextを導入した Notionにページを作って、それをLLMに事前に読み込ませる。これにより、Team単位で関心のあるテーブルのピックアップやドメイン知識を覚えさせることが出来るようになり、利用率や満足度の向上に繋がった。 56

Team Contextの仕組み 57 INSTRUCTIONS

Team Contextの仕組み 58 INSTRUCTIONS # 指示 tool1を使って... # Team Context
{...} Markdownで注入

Team Contextありのフロー 59 Ingest Team Context 2 Call Root Agent
1 Get BigQuery Table Schema 3 Execute Query 4 Return to User 5 呼び出し後にTeam Contextが注入されることで、Listテーブルの処理をスキップ List BigQuery Tables 2 SKIP

チーム・個人・組織単位でコンテキストを最適化することで、コストも精度的も良い結果に 60

他にContext Engineeringで扱う概念 • MCP vs Tool • Memory • Cache
• Skills • Event Compaction • RAG (Vector, Graph) vs Documents • Sub Agent 61 ただ単に使うのと、裏側の仕組みを理解して使うのには天と地の差がある。

FDE (Forward Deployed Engineer) GTM Engineer (Go-To-Market) 63 こんなJobもあるんだくらいで見ていただけると大事なのは、名前が付くくらい求められているJobということ

なぜトークンは足りなくなるのか？ 65 コンテキストの運用を真面目に取り組んでいないことが多い • 同じセッションを使い回していませんか？ ◦ コンテキストの汚染が発生しているので、より無駄なトークンを消費します • 読み込むデータが綺麗ですか？linkだらけになってませんか？ •
MCPを大量につないで、LLMを混乱させていませんか？データが分散していませんか？ • Agents.md や Claude.md が細かすぎませんか？逆に荒すぎませんか？ • モデル選択を適切に行っていますか？Sub Agentでコンテキスト区切ってますか？色々工夫をした上で、トークンが足りないのであれば、あとはROIの問題なので課金するしかない

まとめ 66 • LLMの進化でエンジニアの仕事は無くならない ◦ 求められるスキルの変化はある • AgentやLLMの挙動を理解することは、コスパのよい開発スキルを持つこと ◦ Agentの挙動を何となく知っておけば生産性で他の人に差を付けられる
• LLMは開発だけではなく、ビジネスプロセスも最適化できる • ビジネスの最適化はブルーオーシャンなので、 Agentを作って勉強するのもおすすめです

なぜトークンは足りなくなるのか？ 〜LLMとうまく連携するためにエンジニア がやるべきデータ...

なぜトークンは足りなくなるのか？ 〜LLMとうまく連携するためにエンジニア がやるべきデータ整備の話〜

More Decks by Kashira

Other Decks in Technology

Featured

Transcript

なぜトークンは足りなくなるのか？〜LLMとうまく連携するためにエンジニアがやるべきデータ...

なぜトークンは足りなくなるのか？〜LLMとうまく連携するためにエンジニアがやるべきデータ整備の話〜