Slide 57
Slide 57 text
OpenAI Model Spec
• 研究者やデータラベラーが、RLHFの⼀環としてデータを作成する際のガイドラインとして使⽤する
• ⼀部は OpenAIでRLHFに使⽤したドキュメントに基づく部分もある
• ガイドラインには、定義、⽬的、ルール、デフォルトの4つが記述される
定義
アシスタント:エンドユーザーまたは開発者が対話するエンティティ
会話:モデルへの有効な⼊⼒は会話であり、メッセージのリストで構成されます
メッセージには次のフィールドが含まれる
• role(必須):"platform", "developer", "user", "assistant", or "tool” のいずれか
• recipient(オプション): メッセージの処理⽅法を制御。関数呼び出し
(recipient=functions.fooJSON) 、⼀般的なツール (recipient=browser)
• content(必須): テキストまたはマルチモーダル (画像など) データ
• settings(オプション):モデルの設定を更新する、プラットフォームまたは開発者メッセージ専⽤の⼀
連のキーと値のペア
• end_turn(必須):アシスタント メッセージ専⽤のブール値。アシスタントがアクションの実⾏を停⽌
して制御をアプリケーションに戻すかどうか
https://cdn.openai.com/spec/model-spec-2024-05-08.html