Slide 24
Slide 24 text
LLMから大規模アクションモデル LAM への進化
Large Action Models: From Inception to Implementation
MicrosoftからLAMsの設計と実装に関する体系的なフレームワークを提案
• LAMsはユーザー意図を解釈して計画を立案し、それを行動シーケンスに変換して実行
• LAMsの学習には、タスクプラン(計画)データとタスクアクション(実行)データの両方が必要
• タスクプランデータの例は行動系列が作れそうなアプリのドキュメント、オンライン「How-to」ガイド、Bingの検索履歴
学習ステップ
• 1. Task-PlanのSFT, 2. 行動生成の学習, 3. 学習済LAMで追加の軌跡生成&学習, 4. 成功と失敗の軌跡からPPO
ポイント
• データ収集したものに手順を少し加えた挑戦的なタスクにデータ拡張する
• 行動シーケンスは実行できるか検証してから使う
12月30日 更新分
Agent Framework