Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TinyTroupeで人狼ゲームやってみた!
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ueponx
March 14, 2026
Technology
790
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
TinyTroupeで人狼ゲームやってみた!
Microsoft製 マルチエージェントシミュレーションライブラリであるTinyTroupeを使用して人狼ゲームのシミュレーションをおこなってみました。その時の知見を共有します。
ueponx
March 14, 2026
More Decks by ueponx
See All by ueponx
Node-REDで広がるプログラミング教育の可能性
ueponx
1
360
開発用LLMインフラをVSCode内で完結させる
ueponx
1
460
Node-REDからreCameraへのファーストタッチ
ueponx
0
200
Pythonでもちょっとリッチな見た目のアプリを設計してみる
ueponx
1
3k
SORACOM UG 東海 #9
ueponx
0
170
PythonとFletで簡単 GUIアプリを作ろう
ueponx
0
2.3k
変化する時代のIBMChampionの新しい挑戦
ueponx
0
270
EduBlocksでPythonのブロックプログラミング体験!
ueponx
0
2k
enebular in education 大学講義での実践を通して
ueponx
0
320
Other Decks in Technology
See All in Technology
「エンジニア進化論」2028年の開発完全自動化、エンジニアはどう進化するか
cyberagentdevelopers
PRO
6
5.3k
【セミナー資料】Claude Code をセキュアに使うための考え方と設定の勘どころ / Claude Code Webinar 20260616
masahirokawahara
2
360
自律型AIエージェントは何を破壊するのか
kojira
0
160
Kiroで書いた 設計書 が AI レビューの 採点基準 になる
ezaki
0
110
アンオフィシャルな、オフィシャルからのお願い
wyamazak_devrel
0
110
2026 TECHFRESH 畢業分享會 - AI-Native 重塑軟體工程與虛擬講師
line_developers_tw
PRO
0
1.1k
Claude Code の Sandbox 機能を Anthropic Sandbox Runtime(srt) で試そう!/lets-play-anthropic-sandbox-runtime
tomoki10
1
620
脆弱性対応、どこで線を引くか
rymiyamoto
1
400
AI駆動開発を通して感じた、 AI時代のデザイナーの役割変化
whisaiyo
3
2.2k
SONiC Scale-Up Working Group から探る Scale-UpやUltraEthernet機能の実装方法
ebiken
PRO
2
350
2026TECHFRESH畢業分享會 - Lightning Talk - E起 See See : 電商推薦讀心術? 數據說了算
line_developers_tw
PRO
0
1.1k
LLMにもCAP定理があるという話
harukasakihara
0
380
Featured
See All Featured
Everyday Curiosity
cassininazir
0
230
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
Automating Front-end Workflow
addyosmani
1370
210k
Technical Leadership for Architectural Decision Making
baasie
3
410
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
310
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.9k
YesSQL, Process and Tooling at Scale
rocio
174
15k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.5k
The browser strikes back
jonoalderson
0
1.2k
Transcript
1 / 7 TinyTroupeで 人狼ゲームをやってみた AIマルチエージェントの理想と現実 上田茂雄 / @ueponx
ueponx 上田 茂雄 / Ueda Shigeo @ueponx 上田茂雄 uepon日々の備忘録 所属
中京テレビ放送 ICT推進部 名城大学 非常勤講師 愛知大学 非常勤講師 京都精華大学 非常勤講師 名古屋工業大学 修士(社会工学)2026年3月修了 コミュニティ • IBM Champion 8年連続受賞(2026含む) • Nagoazu運営 Azure User Group Nagoya • SeeedJP UG運営 IoT / Maker Community Skills & Interests IBM Champion Node-RED IoT / Raspberry Pi AI / LLM RAG / GraphRAG ナレッジグラフ RDF / Neo4j MCP / AI Agent 放送システム watsonx Azure ローカルLLM
2 / 7 TinyTroupeとは Microsoft製 マルチエージェントシミュレーションライブラリ LLMでペルソナを持つエージェント(TinyPerson)を作成し、 仮想環境(TinyWorld)内でエージェント同士を対話させるPythonライブラリ GitHub ★
7,000+ MITライセンス v0.6.0(2025年) 対応 LLM OpenAI / Azure(推奨) Ollama(実験的) 想定用途 顧客インタビュー フォーカスグループ 広告評価 ✦ 本来は「善意の対話者」同士の自由な対話をシミュレーションするツール
3 / 7 AI × 人狼ゲームの背景 人狼知能プロジェクト(AIWolf) • 2013年から続くAI研究のグランドチャ レンジ
• 不完全情報 × コミュニケーションゲーム • 将棋・囲碁とは異なるAI課題 • 「推定+思考」と「コミュニケーション」の 両方が必要 実験について TinyTroupeの仕組み 各エージェントは別々のAPIコールで動作 → 内部状態は分離されている ただし 非対称性をゲームとして機能させるには プロンプトや設定の十分な設計が必要 要素 完全情報ゲーム(将棋等) 人狼ゲーム 情報構造 全情報公開 非対称(役職を秘匿) コミュニケーション 不要(手を指すのみ) 自然言語での議論が必須 求められる能力 探索・評価 推理・欺瞞・説得
4 / 7 ローカルLLMへの切り替え デフォルト構成 OpenAI API Azure OpenAI (クラウド型LLM)
壁にぶつかる 従量課金コスト レート制限(TPM) 429エラー頻発 ローカルに変更 Ollama + gpt-oss:20b WSL2 + RTX 4090 → → 技術的なポイント • TinyTroupe v0.6.0のOllamaクライアントにバグ → OpenAI互換モード(/v1)で回避 • WSL2からWindows側Ollamaへの接続: ip route でホストIP取得 + OLLAMA_HOST=0.0.0.0 • 環境切り替えスクリプト: source ollama_activate_env.sh でconfig.ini自動生成 • RTX 4090版: WSL2上にOllamaをインストール、ローカルGPUで直接推論(レート制限なし)
5 / 7 盛大に失敗した結果 ゲーム文脈が崩壊 「人狼」を哲学的な「人間とは何か」と解釈。 風や雨について詩的に語り始める。 投票が完全に破綻 宮崎駿・宮本武蔵・山田太郎に投票。 ゲーム参加者の名前を挙げられない。
同調・オウム返しの連鎖 全員「観察しましょう」で合意し続ける。 対立・疑惑・反論が一切発生しない。 役職行動の欠如 人狼が嘘をつかない。占い師が占わない。 3人の発言を入れ替えても違和感なし。 3回の試行すべてで人狼ゲームとして成立する議論は実現できなかった
6 / 7 構造的な課題 情報の非対称性を活かす設計の不足 各エージェントは別々のAPIコールで動作し、内部状態は分離されている。しかし、その非対称性をゲームとして機能 させるには、プロンプトや設定の十分な設計が必要。デフォルトの仕組みだけでは不十分だった。 ハルシネーション+同調 他エージェントの発言に引きずられ 全員が同じ方向に流れる。
対立構造が生まれない。 トークン消費が膨大 1エージェント1回: 5,000〜7,000トークン 3人最小構成の1日分: 約54,000トークン 5人3日間: 約462,000トークン レート制限の壁 → ローカルGPU必須の領域 バックエンド レート制限 評価 Ollama Cloud(Free) 日次上限あり / 429頻発 マルチエージェントには不向き OpenAI API(Tier 1) 200K TPM 3人が限界、5人は困難 ローカルGPU(RTX 4090) 制限なし TinyTroupeに最適
7 / 7 まとめ・学び 01 人狼ゲームには 十分な設計が必要 各エージェントの内部状態は 分離されているが、非対称性を 活かすにはプロンプトの作り込み
が不可欠。 02 マルチエージェント = トークン爆発 エージェント数 × ターン数 × トークン数でコストが乗算的に 増加。ローカルGPUが必須。 03 TinyTroupeの 得意・不得意 協調的な自由対話には最適。 対立・欺瞞・ルール進行の ゲームには設計が合わない。 今後について • 独立エージェント間の対戦構造で真の駆け引きを実現 • ハイブリッドアプローチの検討 … ルールベース(戦略判断)+ LLM(自然言語生成)の組み合わせ