Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ローカルLLMを使ってB2Bサービスを作っていての学び
Search
Hiroshige Umino
June 02, 2026
Programming
210
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
ローカルLLMを使ってB2Bサービスを作っていての学び
https://hannari-python.connpass.com/event/392555/
の発表資料です。
Hiroshige Umino
June 02, 2026
More Decks by Hiroshige Umino
See All by Hiroshige Umino
AIに任せる仕事、任せない仕事
yaotti
0
26
Product Team Management
yaotti
16
35k
開発フローの作り方
yaotti
37
12k
プログラミングの道具作り
yaotti
3
290
How to contribute to Git
yaotti
1
300
Sole Rubyist's Fight
yaotti
4
710
Technology supporting Qiita and Kobito
yaotti
4
410
Qiita at #fluxflex meetup
yaotti
3
350
Other Decks in Programming
See All in Programming
ADKを使って簡単にAIエージェントを作ってみよう
k1mu21
0
280
不変条件と整合性境界—ビジネスが決める設計判断と実現パターン / Invariants and Consistency Boundaries
nrslib
14
5.8k
並列実装の現場、2ヶ月間実務でAIを使い倒したAIもPCも私も限界が近い
ming_ayami
0
130
A2UI という光を覗いてみる
satohjohn
1
150
dRuby over BLE
makicamel
2
390
Performance Engineering for Everyone
elenatanasoiu
0
210
生成AI時代にこそ効くGo | Why Go Works in the Age of Generative AI
mom0tomo
8
3.3k
コンテキストの使い捨てをやめる — ビジネスルール駆動開発と miko —
ioki
0
230
ECSアプリログをFireLensでコスト削減しようとしたけど諦めた話 in Fargate×Node.js
akihisaikeda
2
4.2k
Lemonade + Foundry Toolkit でお手軽アプリ開発
seosoft
1
370
鹿野さんに聞く!『TypeScriptコードレシピ集』で磨く実践力
tonkotsuboy_com
2
670
Claspは野良GASの夢をみるか
takter00
0
210
Featured
See All Featured
Practical Orchestrator
shlominoach
191
11k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
170
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
410
A better future with KSS
kneath
240
18k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
WENDY [Excerpt]
tessaabrams
11
38k
Building an army of robots
kneath
306
46k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
11
950
Why Our Code Smells
bkeepers
PRO
340
58k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
Transcript
ローカルLLMを使って B2Bサービスを作っていての学び はんなり「ローカルLLMやってみたLT会」 海野弘成(@yaotti/やおっち) / ACK Craft株式会社 代表 1
自己紹介 海野弘成(@yaotti / やおっち) Qiita (プログラミング情報共有サービス) の創業社長 newmo (タクシー・ライドシェア) でLLMによる電話対応サービスのプロトタイ
プ→運用(対応率が70%から100% / GENIAC PRIZE 1位) 今年2月に ACK Craft 株式会社 を京都で創業、 「ツギキ(継木)AI」を開発中 「頭の中にある知見や経験を形にする」 に興味があります 2
業務引き継ぎ支援AI「ツギキ」— ロ ーカルLLM前提のMacアプリ 退職・異動で消える 業務の暗黙知 を、 作業中の画面録画を見せるだけ でマニュアルに するサービス Macアプリ(メニューバー常駐)
業務情報が対象 → 外部APIは使わずロー カルLLM(gemma4:e4b(約9.6GB) + Ollama)で ローカル完結 観る → まとめる → 聞く の3ステップで、 そこそこ妥当な叩き台 が出る 現在、一部の企業とトライアル(PoC)中 3
失敗①:映っていないChromeを見たと言ってきた 開発中の画面録画を見せたら観察ログにこう出た 録画37枚を全確認 → やはり無い OCRで裏取りさせても 捏造は止まらない 4
直し方: 「無ければ“不明”でいい」と許可する プロンプトに一言追加 画面に確実にあるものだけ記述。無ければ「不明」でよい → 正直に答えるように。 「答えなければならない」というプレッシャーが捏造を生んで いた 1年ほど前のフロンティアモデルのハルシネーション対策と同じ定石 (
「分からないなら“分からない”と言わせる」 ) 。ローカルも同じ道を辿って良くなるは ず。 5
失敗②:処理に時間がかかりすぎる マニュアル生成が30分待っても 2/6 しか進まない。ログを見ると 10s: 0トークン受信 20s: 0トークン受信 ... 170s:
0トークン受信 最初のトークン受信: 170s 170秒沈黙し続けており、その間ずっとMacは発熱していた 6
原因:thinking の出力を、content だけ見ていた gemma4:e4b は デフォルトで thinkingモード 出力の大半が message.thinking へ
message.content は 空のまま → 「沈黙」に見えた Ollama /api/chat に渡す body に think: false を1つ const payload = { model: "gemma4:e4b", messages, stream: true, think: false, // ← options の中ではなく body 直下! options: { temperature: 0.3, num_ctx: 8192 }, }; // fetch(`${OLLAMA}/api/chat`, { body: JSON.stringify(payload) }) 7
まとめ ローカルLLMを使ってB2Bプロダクトを作っています 出力の裏を取る — 平気で嘘をつくから(映ってないChrome) モデルのデフォルトを知る — thinking みたいな初期設定の罠 クラウドに出さずに一定の精度は出せそうという手応えが出てきた
8
ローカルLLMで作ってる・実験してる人、話 しましょう 今作っているツギキAIはローカルLLM前提ですが、ローカ ルLLMを活用したプロダクトはあまりありません。 同じくローカルLLMで何か作っている・試している方、 ぜひ情報交換させてください。 Discord でも X(@yaotti)でも —
気軽に連絡ください 9