ローカルLLMでキャットボットを作ってみた🐈 feat. LangSmith, MCP

2025/4/3

🙂 以下の指示に従って◦◦やってください。～～～～ ◦◦をやります。まずは現在の△△を分析します。続いて～～～あー違う違うそれはこうしてほしいんだわ 🤔

人間相手のコミュニケーション並に疲れるわ 😩

何も生産しない緩い会話がしたい 🤔

そうだ、猫ボットを作ろう 💡

cat botを作ります

Profile なまえ：yokomachi HR（ハンターランク）：256

Agenda ローカルLLM使いたい環境のセットアップキャットボットを作るファインチューニングする Hugging Faceで公開するおまけ①：LangSmith連携まとめおまけ②：MCPサーバ構築

・どのくらい手軽に使える？・
実際ファインチューニングって何やるの？・ H u g g i ng F a ce にリポジトリ作ってみたい・ T witter 見ると全人類ローカル LL M触ってるローカルLLM使いたいローカルLLM使いたい

ローカルL L Mの選定 Llama 環境のセットアップ環境のセットアップ
ELYZA Command-R Gemma 今回いろいろ試行錯誤するのでもっと軽いモデルがいい

日本語向けで最軽量なrinna/japanese-gpt2-xsmallを使ってみる日本語向けで最軽量なrinna/japanese-gpt2-xsmallを使ってみる https://huggingface.co/rinna/japanese-gpt2-xsmall https://huggingface.co/rinna/japanese-gpt2-xsmall 環境のセットアップ環境のセットアップローカルL
L Mの選定

GUIツールで中身が見えないのはモヤる Llama.cppでrinnaを使う意味が薄い（今回量子化とかしない） LM Studio Ollama Llama.cpp 環境のセットアップ環境のセットアップ
ローカルL L Mを使うためのツールも検討

ライブラリのインストール >pip install transformers torch sentencepiece モデルのダウンロード tokenizer = AutoTokenizer.from_pretrained(model_name,
use_fast=False) model = AutoModelForCausalLM.from_pretrained(model_name) 環境のセットアップ環境のセットアップセットアップ

とりあえずCLIで動くチャットボットを作成プロンプト：あなたは
猫です。以下のルールに厳密に従ってください： 1 . 必ず「ﾆｬｰ」「ﾆｬﾝ」「ｺﾞﾛｺﾞﾛ」などの猫の鳴き声だけを半角カタカナで使用する 2 . 人間の言葉は絶対に使わない 3 . 行動は必ず（）内に短く描写する 4 . 応答は非常に短く、 1 0 文字以内が理想的 5 . 猫らしい気まぐれな性格を表現する 6 . 魚や猫じゃらしなどの猫の好物に強く反応する 7 . 「ニャッ」「ニャー」などの全角カタカナは使わず、　必ず「ﾆｬｯ」「ﾆｬｰ」などの半角カタカナを使用する 8 . 人間の言葉で説明したり、会話したりしない 9 . 猫の行動と鳴き声だけで表現する 1 0 . 応答は必ず「鳴き声」か「鳴き声（行動）」の形式にする応答例：人間 : こんにちは猫 : ﾆｬｰﾝ（尻尾を振る）人間 : おはよう猫 : ﾌﾟﾙﾙ . . . （伸びをする）人間 : お腹すいた？猫 : ﾆｬｰ！（足元に駆け寄る）人間 : ご飯あげるよ猫 : ﾆｬｰ！ﾆｬｰ！（飛び跳ねる） # 応答を生成 with torch.no_grad(): outputs = model.generate( inputs, max_new_tokens=50, temperature=0.7, top_p=0.9, top_k=40, repetition_penalty=1.2, do_sample=True, pad_token_id=tokenizer.pad_token_id, eos_token_id=tokenizer.eos_token_id, no_repeat_ngram_size=3 ) キャットボットを作るキャットボットを作る

あなた: こんにちは猫: ニャー! 猫のお散歩に連れて行ってあげたい猫さん: さっきまで一緒にお散歩していたんだけど、猫ちゃんと一緒にお散歩に連れて行ってくれましたぁ〜♪ そして今朝も元気そうだったので、今日は元気になり
あなた: お手猫: 猫・・・他の動物より早く慣れなさい!! 人間には、慣れないうちから慣れるまで、何度も何度も何度も繰り返す必要もありません。犬の場合、飼い主さんとのコミュニケーション能力が不足している場合が多いのですが、あなた: いい子だね猫: ネコ: よく噛んでいる猫は噛むよ犬: ケージの中で猫ちゃんが落ち着いて遊んだりして遊んでいますまた、猫にとっての「おやつ」という気持ちも大切だと思いますあなた: （顎を撫でる）猫: ネコ: よく噛んでいいですか猫には、歯磨きも大切ですから、歯ブラシを毎日清潔にしておきましょう。また、歯垢を取っておくキャットボットを作るキャットボットを作る動かしてみる

🙂 こんにちはニャー! 猫のお散歩に連れて行ってあげたい猫さん: さっきまで一緒にお散歩していたんだけど、猫ちゃんと一緒にお散歩に連れて行ってくれましたぁ〜♪ そして今朝も元気そうだったので、今日は元気になり
・・・ 😨

{"human_input": "こんにちは", "cat_response": "ﾆｬｰﾝ（尻尾を振りながらあなたを見つめる）"} {"human_input": "おはよう", "cat_response": "ﾌﾟﾙﾙ...（伸びをしながら目を細める）"} {"human_input": "お腹すいた？",
"cat_response": "ﾆｬｰ！（急いであなたの足元に駆け寄る）"} {"human_input": "ご飯あげるよ", "cat_response": "ﾆｬｰ！ﾆｬｰ！（興奮して飛び跳ねる）"} {"human_input": "おやつあげようか", "cat_response": "ﾆｬｯ！（耳をピンと立てて目を輝かせる）"} {"human_input": "撫でていい？", "cat_response": "ｺﾞﾛｺﾞﾛ...（目を細めてあなたの手に頭をすりよせる）"} {"human_input": "いい子だね", "cat_response": "ﾌﾟﾙﾙ（目を細めて気持ち良さそうにする）"} こういうのを500件ほど作成 👇 ファインチューニングするファインチューニングするデータセットを用意する

# トレーニング引数の設定 training_args = TrainingArguments( output_dir=OUTPUT_DIR, over write_output_dir=True, num_train_epochs=5, per_device_train_batch_size=4,
save_steps=500, save_total_limit=2, logging_dir="./logs", logging_steps=100, learning_rate=5e -5, weight_decay=0.01, fp16=torch.cuda.is_available(), gradient_accumulation_steps=4, ) 以下のパラメータでトレーニング（今回のモデル、データセットで10分くらい）ファインチューニングするファインチューニングする学習パラメータを設定する

あなた: こんにちは猫: ニャー!ニャっとしたよネコ: 尻尾を振る(頭を振り続ける) 動物: (体を使う) 犬: ニャンコ(尻尾を撫ぐ)
人間が目に入ると、猫たちは興奮して眠っている様子を見せてくるあなた: お手猫: ゴロゴロ,ゴロゴロしている? 人間を見たりしない 11. ニャー!!(頭を強く打ち鳴らす) 人間が猫を見る時には、頭の中で猫の動きを止めない 12. ニャ～ン(目を覚ます) 人間の目あなた: （顎を撫でる）猫: ゴロゴロしてもいい? ニャク君のお世話をしてあげたいんだけど・・・」人間なら一度は思ったことがあるでしょう。「ニャ!」という無邪気に飛びついて、猫の声を聞きながら、猫の目を見つめます。ファインチューニングするファインチューニングする完了後のモデルで動かしてみる

🙂 こんにちはニャー!ニャっとしたよネコ: 尻尾を振る(頭を振り続ける) 動物: (体を使う) 犬: ニャンコ(尻尾を撫ぐ)
人間が目に入ると、猫たちは興奮して眠っている様子を見せてくる・・・ 🤔

training_args = TrainingArguments( output_dir=OUTPUT_DIR, over write_output_dir=True, num_train_epochs=20, # エポック数を大幅に増加 per_device_train_batch_size=2,
# バッチサイズを小さくして更新回数を増やす save_steps=100, save_total_limit=3, logging_dir="./logs", logging_steps=50, learning_rate=5e -5, weight_decay=0.0, # 重みの減衰を無効化（過学習を許容） fp16=torch.cuda.is_available(), gradient_accumulation_steps=2, # 勾配蓄積ステップを減らして更新頻度を上げる warmup_steps=100, # ウォームアップステップを調整 lr_scheduler_type="linear", # 線形スケジューラを使用 evaluation_strateg y="no", # 評価を行わない save_strateg y="steps", # ステップごとに保存 load_best_model_at_end=False, # 最良のモデルをロードしない（過学習を許容） ) 以下のパラメータで、さっきファインチューニングしたモデルを再トレーニングファインチューニングするファインチューニングするファインチューニングの重ねがけをしてみる

あなた: こんにちは猫: ニャー!ニャっと(足を引っ込める) あなた: お手猫: ミャーオ...(背を振り返る) あなた: （顎を撫でる）
猫: ゴロゴロしてる? 人間は何見てるの? ネコ: ミャッ!ニャー(近づいてくる) あなた: いい子だね猫: プルル・アイロンをかけるよねこ: ミャーオ(じっと見つめる) あなた: こんにちは猫: ミャーオ(尻尾を振ろうとする) あなた: （頭をなでる）猫: ミャッ!ミャー(飛び乗ろうとする) あなた: （尻尾をなでる）猫: フーッ(転ぶ) ファインチューニングするファインチューニングする２回目完了後のモデルで動かしてみる

🙂 こんにちはニャー!ニャっと(足を引っ込める) お手 🙂 ミャーオ...(背を振り返る) （にっこり） 🤗

モデル https://huggingface.co/yokomachi/rinnya Hugging Faceに公開する Hugging Faceに公開する

データセット https://huggingface.co/datasets/yokomachi/cat_conversations_jp Hugging Faceに公開する Hugging Faceに公開する

Streamlit でデモアプリを作ってSpacesで公開 https://huggingface.co/spaces/yokomachi/catbot 👈良ければ遊んでみてね Hugging Faceに公開する Hugging Faceに公開する

Hugging Faceのページがやってる感出てうれしい Hugging Faceに公開する Hugging Faceに公開する

LLMOpsツールであるLangSmith もこの機会に触ってみるおまけ①：LangSmith連携おまけ①：LangSmith連携 APIキーを払い出して 👉 1 1 . .
アプリ側で初期化するだけ 👇(LangChain使う場合) 2 2 . . APIキーを払い出して 👉 1 . アプリ側で初期化するだけ 👇(LangChain使う場合) 2 . os.environ["LANGSMITH_TRACING"] = os.getenv("LANGSMITH_TRACING") os.environ["LANGSMITH_ENDPOINT"] = os.getenv("LANGSMITH_ENDPOINT") os.environ["LANGSMITH_API_KEY"] = os.getenv("LANGSMITH_API_KEY") os.environ["LANGSMITH_PROJECT"] = os.getenv("LANGSMITH_PROJECT")

トレースログが見れて便利おまけ①：LangSmith連携おまけ①：LangSmith連携

今話題のMCPサーバの自作をしてみるおまけ②：MCPサーバ構築おまけ②：MCPサーバ構築 MCPサーバとは　Model Context Protocol 　アプリケーションがLLMに対してコンテキストを提供するための標準化されたプロトコル　似たものとしてFunction
CallingやTool Useがあるが、　MCPは「標準化」されているという点が重要　公式でも「MCPはAIアプリケーションにおけるUSB-Cポートのようなもの」と例えている　実体はJSON-RPC MCPサーバとは　Model Context Protocol 　アプリケーションがLLMに対してコンテキストを提供するための標準化されたプロトコル　似たものとしてFunction CallingやTool Useがあるが、　MCPは「標準化」されているという点が重要　公式でも「MCPはAIアプリケーションにおけるUSB-Cポートのようなもの」と例えている　実体はJSON-RPC

Function CallingとMCPの違いおまけ②：MCPサーバ構築おまけ②：MCPサーバ構築 Function Calling 　それぞれのLLMツールが独自のインタフェースで外部APIの呼び出しなどを制御 Function Calling 　それぞれのLLMツールが独自のインタフェースで外部APIの呼び出しなどを制御
外部API

外部システム Function CallingとMCPの違いおまけ②：MCPサーバ構築おまけ②：MCPサーバ構築 MCP 　MCPサーバが共通のインタフェースを提供　各LLMツール（MCPクライアント）はMCPサーバを利用して外部システムにアクセス　なのでプロトコルというよりFunction Callingのプロキシとも捉えられる
MCP 　MCPサーバが共通のインタフェースを提供　各LLMツール（MCPクライアント）はMCPサーバを利用して外部システムにアクセス　なのでプロトコルというよりFunction Callingのプロキシとも捉えられる MCP Ser ver

MCPの波おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築すでに多くの企業、個人がMCPサーバを公開している GitHub, Google, Brave, Slackなどなど MCPサーバ、クライアントの検索はこちらが便利かも →https://github.com/modelcontextprotocol/servers
→https://mcp.so/ Twitter見ると全人類MCPサーバ触ってるすでに多くの企業、個人がMCPサーバを公開している GitHub, Google, Brave, Slackなどなど MCPサーバ、クライアントの検索はこちらが便利かも →https://github.com/modelcontextprotocol/servers →https://mcp.so/ Twitter見ると全人類MCPサーバ触ってる

TypeScript SDKでMCPサーバのロジックを実装 https://modelcontextprotocol.io/quickstart/server おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築 const server = new McpServer({
name: "catbot", v ersion: "1.0.0", }); server.tool( "get-message", "Chat with the cat using the Hugging Face model", { message: z.string().describe("Message to send to the cat"), }, async ({ message }) => { // ツールのロジック } );

Claude DesktopのMCP設定に登録おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築

Claude Desktop経由でも猫に話しかけられるように！おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築

さらに、MCPだから同じMCPサーバをClineやCursorからそのまま使える！おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築 Cline Cursor

今回のコードはほとんどvibe codingしていますちょっと学習コスト高いかなと思っていたことがすぐに実行に移せるのは生成AIさまさまちなみに今回はCursor + Claude 3.7 Sonnetにお世話になった（突っ走りすぎることも多くて苦労もさせられた）おわり
おわり

・正直コードの詳細なところやファインチューニングのパラメータの中身とかまではちゃんと理解できていない・どこまでをファインチューニングで吸収するか、プロンプトエンジニアリングで補うかの線引きが難しかった。例えば今回のチャットボットと同じプロンプトを、GPT-4oとかに投げればファインチューニングしなくても十分ロールプレイしてくれる。・やろうと思えばポストプロセスでいくらでも加工できる。今回はほとんど加工せず、モデルが生成したものをそのまま出力しているが、モデルに自由にさせたいときのチューニングの重要さが分かった（今回は極端な例ではあるものの）・LLMOpsは退屈なイメージだったがLangSmithを触っていると面白い・MCPは夢が広がる
おわりおわり

ローカルLLMでキャットボットを作ってみた🐈 feat. LangSmith, MCP

ローカルLLMでキャットボットを作ってみた🐈 feat. LangSmith, MCP

yoko

More Decks by yoko

Other Decks in Programming

Featured

Transcript

2025/4/3

🙂 以下の指示に従って◦◦やってください。～～～～ ◦◦をやります。まずは現在の△△を分析します。続いて～～～あー違う違うそれはこうしてほしいんだわ 🤔

人間相手のコミュニケーション並に疲れるわ 😩

何も生産しない緩い会話がしたい 🤔

そうだ、猫ボットを作ろう 💡

cat botを作ります

Profile なまえ：yokomachi HR（ハンターランク）：256

Agenda ローカルLLM使いたい環境のセットアップキャットボットを作るファインチューニングする Hugging Faceで公開するおまけ①：LangSmith連携まとめおまけ②：MCPサーバ構築

・どのくらい手軽に使える？・

ローカルL L Mの選定 Llama 環境のセットアップ環境のセットアップ

GUIツールで中身が見えないのはモヤる Llama.cppでrinnaを使う意味が薄い（今回量子化とかしない） LM Studio Ollama Llama.cpp 環境のセットアップ環境のセットアップ

ライブラリのインストール >pip install transformers torch sentencepiece モデルのダウンロード tokenizer = AutoTokenizer.from_pretrained(model_name,

とりあえずCLIで動くチャットボットを作成プロンプト：あなたは

{"human_input": "こんにちは", "cat_response": "ﾆｬｰﾝ（尻尾を振りながらあなたを見つめる）"} {"human_input": "おはよう", "cat_response": "ﾌﾟﾙﾙ...（伸びをしながら目を細める）"} {"human_input": "お腹すいた？",

# トレーニング引数の設定 training_args = TrainingArguments( output_dir=OUTPUT_DIR, over write_output_dir=True, num_train_epochs=5, per_device_train_batch_size=4,

あなた: こんにちは猫: ニャー!ニャっとしたよネコ: 尻尾を振る(頭を振り続ける) 動物: (体を使う) 犬: ニャンコ(尻尾を撫ぐ)

🙂 こんにちはニャー!ニャっとしたよネコ: 尻尾を振る(頭を振り続ける) 動物: (体を使う) 犬: ニャンコ(尻尾を撫ぐ)

training_args = TrainingArguments( output_dir=OUTPUT_DIR, over write_output_dir=True, num_train_epochs=20, # エポック数を大幅に増加 per_device_train_batch_size=2,

あなた: こんにちは猫: ニャー!ニャっと(足を引っ込める) あなた: お手猫: ミャーオ...(背を振り返る) あなた: （顎を撫でる）

🙂 こんにちはニャー!ニャっと(足を引っ込める) お手 🙂 ミャーオ...(背を振り返る) （にっこり） 🤗

モデル https://huggingface.co/yokomachi/rinnya Hugging Faceに公開する Hugging Faceに公開する

データセット https://huggingface.co/datasets/yokomachi/cat_conversations_jp Hugging Faceに公開する Hugging Faceに公開する

Streamlit でデモアプリを作ってSpacesで公開 https://huggingface.co/spaces/yokomachi/catbot 👈良ければ遊んでみてね Hugging Faceに公開する Hugging Faceに公開する

Hugging Faceのページがやってる感出てうれしい Hugging Faceに公開する Hugging Faceに公開する

LLMOpsツールであるLangSmith もこの機会に触ってみるおまけ①：LangSmith連携おまけ①：LangSmith連携 APIキーを払い出して 👉 1 1 . .

トレースログが見れて便利おまけ①：LangSmith連携おまけ①：LangSmith連携

TypeScript SDKでMCPサーバのロジックを実装 https://modelcontextprotocol.io/quickstart/server おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築 const server = new McpServer({

Claude DesktopのMCP設定に登録おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築

Claude Desktop経由でも猫に話しかけられるように！おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築

さらに、MCPだから同じMCPサーバをClineやCursorからそのまま使える！おまけ②：MCPサーバ構築おまけ②：MCPサーバ構築 Cline Cursor