Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【ClickHouseMeetup】LibreChat × ClickHouse プロンプトキ...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Hisashi Hibino
March 09, 2026
Technology
91
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
【ClickHouseMeetup】LibreChat × ClickHouse プロンプトキャッシュ機能の効果とその仕組み
ClickHouse Meetup Tokyo -Librechat Night‐ 2026/03/09(
https://connpass.com/event/383869/
)
Hisashi Hibino
March 09, 2026
More Decks by Hisashi Hibino
See All by Hisashi Hibino
【Cyber-sec+】経営層を"動かす"ための考え方
hssh2_bin
0
200
【ClickHouseMeetup】ClickHouseを活用したセキュリティログ解析AIエージェント『LogEater』とは
hssh2_bin
0
480
【ClickHouseMeetup】JSON データ型はクラウド時代の可変フィールドにどこまで対応できるのか
hssh2_bin
0
150
【インフラエンジニアbooks】30分でわかる「AWS継続的セキュリティ実践ガイド」
hssh2_bin
10
2.6k
【ログ分析勉強会】EDR ログで内部不正を検出できるのか、Copilot に聞いてみた
hssh2_bin
2
1.5k
【OpsJAWS】踏み台サーバーって何がうれしいんだっけ?
hssh2_bin
14
6.2k
【Cyber-sec+】ログの森で出会ったCloudTrail との奇妙な旅
hssh2_bin
1
780
【OpsJAWS】EC2 のセキュリティの運用と監視について考えてみた件
hssh2_bin
7
1.4k
【SecurityJAWS】時間切れで書き切れなかったOCSFの行く末とは
hssh2_bin
2
2.5k
Other Decks in Technology
See All in Technology
AIに障害切り分けを全部やってもらった。 。 。 。
estie
0
150
千葉での単身赴任からAWSをやり続け、千葉に戻ってきた話
yama3133
1
120
ロボティクスの技術 / Robotics Technology
ks91
PRO
0
130
クラウドファンディング版StackChan 3体(4体)をインタラクティブな体験型作品にして展示もした話 / スタックチャンお誕生日会2026
you
PRO
0
180
【Snowflake Summit 2026 Recap!!】Snowflake Summit Deep Dive: Security & Governance
civitaspo
1
310
本当の”仕事”を手放せる未来が見えた
mu7889yoon
0
130
AI 不只幫你寫 Code: 當專案從 300 暴增到 1500, 我們如何撐住 DevOps
appleboy
0
230
10年間のブログ発信を振り返って見えたWebアプリケーションエンジニアとしての軌跡
stefafafan
0
190
AIチャットの改善から見えた、良いAI体験とは / What Constitutes a Good AI Experience: Insights from Improving AI Chat
kubode
0
120
元銀行員がAIだけでアプリを量産!「バイブコーディング実演セミナー 」
tatsuya1970
0
110
自分が詳しくない領域でAIを使う #プロヒス2026
konifar
20
7.5k
Multi-Agent並列開発を 安全に回すための技術 / Technology for Safely Multi-Agent Parallel Development
tooppoo
0
180
Featured
See All Featured
The SEO Collaboration Effect
kristinabergwall1
1
490
SEO for Brand Visibility & Recognition
aleyda
0
4.6k
The innovator’s Mindset - Leading Through an Era of Exponential Change - McGill University 2025
jdejongh
PRO
1
210
Automating Front-end Workflow
addyosmani
1370
210k
Utilizing Notion as your number one productivity tool
mfonobong
4
330
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Optimizing for Happiness
mojombo
378
71k
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.3k
The Pragmatic Product Professional
lauravandoore
37
7.3k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
140
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
1
330
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
Transcript
Hisashi Hibino/日比野 恒 ログスペクト株式会社 LibreChat × ClickHouse プロンプトキャッシュ機能の効果とその仕組み
日比野 恒 - Hisashi Hibino ログスペクト株式会社 Security Architect CISSP, CCSP,
CySA+, CISA, PMP, 情報処理安全確保支援士(000999) [書籍] ➢ Elastic Stack 実践ガイド [Logstash/Beats 編](インプレス刊) ➢ AWS 継続的セキュリティ実践ガイド (翔泳社刊) [略歴] ⚫ 2018 年まで 10 年間 フューチャーアーキテクト株式会社に在籍 ⚫ 2019 年より株式会社リクルートのセキュリティ組織に所属 ログ基盤やクラウドセキュリティに関するプロジェクトを推進 ⚫ 2024 年にログスペクト株式会社を設立し、LogEater を開発・展開中 自己紹介
LogEater とは データアナリストの採用を前提にしません 少子高齢化が進むと人の採用自体が難しくなります。知識のある 人を業務にアサインできないことを前提に「ログの民主化」を実 現するためのツールになります。 ログ基盤の運用コストを削減します LogEater はクラウドサービスのため、ログ基盤の運用は不要で す。また超高圧縮データストアを採用しているため、ログ保管に
かかるコストを極限まで削減します。 クエリ言語の学習は不要です もうクエリを書けなくても大丈夫です。 日本語でやりたいことを伝えるだけで必要な情報を提供してくれ ます。ログの解析結果をチャットやグラフで回答してくれます。 LibreChat × ClickHouse を使ったログ解析 AI エージェントサービスです 1 2 3 LogEater 公式サイト: https://logeater.ai/
本日の内容 3 2 プロンプトキャッシュとは 1 技術的な動作検証の実施 その結果含め、総括
プロンプトキャッシュとは • アテンション状態をキャッシュすることで、プロンプトによって LLM が消費するトークン数を節約できる仕組みです input Prompt Cache LLM output
キャッシュヒットした 内容を output に送る ヒットせず キャッシュ検索 output の内容を キャッシュに登録 【 プロンプトキャッシュとは】 LLM が文章を理解するとき、「どの単語がどの 単語と関係しているのか」を計算する仕組みであ るアテンション状態を異なる複数のプロンプト間 で再利用できるようにキャッシュする仕組み 【 input 中身】 1. system(システムプロンプト) 2. messages: user(ユーザープロンプト) 3. tools(ツール定義) 【 output 中身】 1. messages: assistant(アシスタントプロンプト)
プロンプトキャッシュで期待できる効果 • LLM はチャット内の過去のやり取りを記憶できないため、リクエストするたびに過去の履歴を追加して問い合わせします 出展: Anthropic 社 コンテキストウィンドウ(https://platform.claude.com/docs/ja/build-with-claude/context-windows) プロンプトキャッシュの キャッシュにヒットする領域
# フィールド キャッシュ効果 1 system ほぼ 100% ヒット(固定値のため) 2 messages 過去の履歴部分はヒット 3 tools ほぼ 100% ヒット(固定値のため) 【input の詳細】
プロンプトキャッシュの設定方法 • LibreChat の v0.8.1-rc2 以降のバージョンでは、 Bedrock プロンプトキャッシュがデフォルトで有効になっています 参考: LibreChat
v0.8.1-rc2(https://github.com/danny-avila/LibreChat/releases/tag/v0.8.1-rc2)
動作検証の内容 • Bedrock のプロンプトキャッシュ機能の制約を考慮し、以下のシナリオで動作検証を実施しました 参考: AWS Bedrock プロンプトキャッシュ(https://docs.aws.amazon.com/bedrock/latest/userguide/prompt-caching.html) User A
User B Me EC2 Docker LibreChat v0.8.3-rc1 AWS Bedrock Prompt Cache LLM Claude Sonnet 4.6 ClickHouse Cloud CloudWarch Logs OpenSearch Elastic Cloud AWS @Tokyo BigQuery MCP 「こんにちは!(20:10)」 「CloudTrail のログ解析がしたい(20:11)」 「こんにちは!(20:13)」 「CloudTrail のログ解析がしたい(20:14)」 Bedrock のキャッシュ保持期間は 5 分間(標準)のため 5 分以内に LibreChat の異なるユーザーで同じプロンプトを実施 同一アカウント/同一 リージョンでキャッ シュが共有されます キャッシュチェックポ イントあたりの最小 トークン数は 4,096 になります キャッシュ対象の フィールドは system, messages, tools に なります
LibreChat 設定内容 • 以下、LibreChat で設定している AWS Bedrock Claude Sonnet 4.6
に関する設定の抜粋になります endpoints: bedrock: titleModel: "jp.anthropic.claude-sonnet-4-6" inferenceProfiles: "jp.anthropic.claude-sonnet-4-6": "${BEDROCK_INFERENCE_PROFILE_ARN}" streamRate: 35 availableRegions: - "ap-northeast-1" agents: recursionLimit: 50 maxRecursionLimit: 100 disableBuilder: false # Bedrock Settings BEDROCK_AWS_DEFAULT_REGION=ap-northeast-1 BEDROCK_AWS_MODELS=jp.anthropic.claude-sonnet-4-6 BEDROCK_INFERENCE_PROFILE_ARN=arn:aws:bedrock:ap-northeast-1:{AWS ACCPUNT}:application-inference-profile/{INFERENCE_PROFILE_ID} .env の抜粋 librechat.yaml の抜粋 参考: LibreChat AWS Bedrock(https://www.librechat.ai/docs/configuration/pre_configured_ai/bedrock)
システムプロンプトと MCP Server の設定 • 本動作検証環境におけるシステムプロンプト(指示文)および MCP Server の設定は以下の通りです
実施結果 # 時刻 User system/tools input output messages messages 1
20:10:02 A 2 20:10:05 A 3 20:11:03 A ◦ (詳細省略) - ◦ (詳細省略) 4 20:11:35 A 5 20:11:37 A 6 20:13:02 B ◦ (詳細省略) - ◦ (詳細省略) 7 20:13:05 B 8 20:14:06 B - ◦ (詳細省略) こんにちは! Provide a concise, 5-word-or-less title for the conversation, using title case conventions. Only return the title itself. No1 の input と output + CloudTrail のログ解析がしたい こんにちは! \n\n何かお手伝いできることはあります か?\nAWS環境のログ解析、Google Cloudの監査ログ 解析、セッションマネージャーの操作ログ解析など、お気 軽にご相談ください! 日本語の挨拶 CloudTrail のログ解析ですね!AWS 環境のログ解析な ので、**ClickHouse** と **CloudWatch** を確認して みます。まず両方のデータソースを同時に調べてみますね。 (toolUse あり) No4 の input と output + (ClickHouse と CloudWatch のス キーマ情報) - こんにちは! 次に、ClickHouse の `default` データベースにあるテー ブルを確認してみます。 ClickHouse の `default` データベースに **`aws_cloudtrail`** テーブルが見つかりました! (以下、量が多いため、省略) こんにちは! \n\n何かお手伝いできることはあります か?AWS環境のログ解析、Google Cloudの監査ログ解 析、セッションマネージャーの操作ログ解析など、お気軽 にご相談ください! Provide a concise, 5-word-or-less title for the conversation, using title case conventions. Only return the title itself. No6 の input と output + CloudTrail のログ解析がしたい Japanese Greeting Exchange CloudTrail のログ解析ですね!\n\nAWS環境のログ解 析については、**ClickHouse** と **CloudWatch** を 確認します。(以下、量が多いため、省略) input TokenCount output TokenCount cacheRead Input TokenCount cacheWrite Input TokenCount 20,622 110 129 12 10 222 - - 0 0 0 20,704 1,567 88 16,915 736 20,622 109 20,704 141 20,845 0 - - 128 7 10 339 0 0 0 20,703
結果の考察 # 時刻 User system/tools input output messages messages 1
20:10:02 A 2 20:10:05 A 3 20:11:03 A ◦ (詳細省略) - ◦ (詳細省略) 4 20:11:35 A 5 20:11:37 A 6 20:13:02 B ◦ (詳細省略) - ◦ (詳細省略) 7 20:13:05 B 8 20:14:06 B - ◦ (詳細省略) こんにちは! Provide a concise, 5-word-or-less title for the conversation, using title case conventions. Only return the title itself. No1 の input と output + CloudTrail のログ解析がしたい こんにちは! \n\n何かお手伝いできることはあります か?\nAWS環境のログ解析、Google Cloudの監査ログ 解析、セッションマネージャーの操作ログ解析など、お気 軽にご相談ください! 日本語の挨拶 CloudTrail のログ解析ですね!AWS 環境のログ解析な ので、**ClickHouse** と **CloudWatch** を確認して みます。まず両方のデータソースを同時に調べてみますね。 (toolUse あり) No4 の input と output + (ClickHouse と CloudWatch のス キーマ情報) - こんにちは! 次に、ClickHouse の `default` データベースにあるテー ブルを確認してみます。 ClickHouse の `default` データベースに **`aws_cloudtrail`** テーブルが見つかりました! (以下、量が多いため、省略) こんにちは! \n\n何かお手伝いできることはあります か?AWS環境のログ解析、Google Cloudの監査ログ解 析、セッションマネージャーの操作ログ解析など、お気軽 にご相談ください! Provide a concise, 5-word-or-less title for the conversation, using title case conventions. Only return the title itself. No6 の input と output + CloudTrail のログ解析がしたい Japanese Greeting Exchange CloudTrail のログ解析ですね!\n\nAWS環境のログ解 析については、**ClickHouse** と **CloudWatch** を 確認します。(以下、量が多いため、省略) input TokenCount output TokenCount cacheRead Input TokenCount cacheWrite Input TokenCount 20,622 110 129 12 10 222 - - 0 0 0 20,704 1,567 88 16,915 736 20,622 109 20,704 141 20,845 0 - - 128 7 10 339 0 0 0 20,703 初回のプロンプトがキャッシュ乗っていない (cachePoint を設定していないと思われる) output messages の内容が User A と一文字(改行 コード)が異なるためキャッシュに乗らなかった チャットのタイトルを自動生成するため LibreChat が別リクエストを発行している ここで初回のやり取りがキャッシュに乗っている system と tools のトークン消費が大きい No4 のツール利用結果を踏まえて、追加でツールを利 用したため、別のリクエストになったと推察される
本日のまとめ ✓ 設定内容にもよるが、システムプロンプトとツール定義で消費するトークン数が多くを占めていた ✓ そのトークン消費が毎リクエストに乗ってくるため、それをプロンプトキャッシュで節約できる効果は大きい ✓ LLM は過去のチャット履歴を記憶できないため、やり取りの回数が増えるほどキャッシュの効果が発揮される ✓ 異なるユーザーで同じプロンプトを実行しても生成
AI の回答が一文字ズレるだけキャッシュには乗らない ✓ 同一 AWS アカウント/同一リージョンでも、意外と異なるプロンプトでキャッシュに乗せるのは難しい ✓ ユーザーが LibreChat で投げたリクエストが生成 AI に対するリクエストと一致するとは限らない ✓ チャットタイトルを自動生成するためのリクエストが走っていた ✓ MCP で得た結果を用いて段階的に MCP を使う場合に生成 AI に対するリクエストは別になっていた 過去のチャット履歴を記憶できない LLM の仕組みにおいて システムプロンプトとツール定義で消費されるトークン量を大幅に節約できるため 80 % 近いトークンコストが抑制できるという説は正しそう
ご清聴ありがとうございました