Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ローカルLLMを使ってB2Bサービスを作っていての学び

Sponsored · SiteGround - Reliable hosting with speed, security, and support you can count on.

 ローカルLLMを使ってB2Bサービスを作っていての学び

Avatar for Hiroshige Umino

Hiroshige Umino

June 02, 2026

More Decks by Hiroshige Umino

Other Decks in Programming

Transcript

  1. 自己紹介 海野弘成(@yaotti / やおっち) Qiita (プログラミング情報共有サービス) の創業社長 newmo (タクシー・ライドシェア) でLLMによる電話対応サービスのプロトタイ

    プ→運用(対応率が70%から100% / GENIAC PRIZE 1位) 今年2月に ACK Craft 株式会社 を京都で創業、 「ツギキ(継木)AI」を開発中 「頭の中にある知見や経験を形にする」 に興味があります 2
  2. 業務引き継ぎ支援AI「ツギキ」— ロ ーカルLLM前提のMacアプリ 退職・異動で消える 業務の暗黙知 を、 作業中の画面録画を見せるだけ でマニュアルに するサービス Macアプリ(メニューバー常駐)

    業務情報が対象 → 外部APIは使わずロー カルLLM(gemma4:e4b(約9.6GB) + Ollama)で ローカル完結 観る → まとめる → 聞く の3ステップで、 そこそこ妥当な叩き台 が出る 現在、一部の企業とトライアル(PoC)中 3
  3. 失敗②:処理に時間がかかりすぎる マニュアル生成が30分待っても 2/6 しか進まない。ログを見ると 10s: 0トークン受信 20s: 0トークン受信 ... 170s:

    0トークン受信 最初のトークン受信: 170s 170秒沈黙し続けており、その間ずっとMacは発熱していた 6
  4. 原因:thinking の出力を、content だけ見ていた gemma4:e4b は デフォルトで thinkingモード 出力の大半が message.thinking へ

    message.content は 空のまま → 「沈黙」に見えた Ollama /api/chat に渡す body に think: false を1つ const payload = { model: "gemma4:e4b", messages, stream: true, think: false, // ← options の中ではなく body 直下! options: { temperature: 0.3, num_ctx: 8192 }, }; // fetch(`${OLLAMA}/api/chat`, { body: JSON.stringify(payload) }) 7