スケーリング則
●
言語モデルの性能がパラメータ数、データセットサイズ、計算予
算を変数としたべき乗になる
●
OpenAIが予算をつぎ込むキッカケになった
Scaling Laws for Neural Language Models (Jared Kaplan, Sam McCandlish et al., 2020-01-23)
Slide 9
Slide 9 text
チャット対応とRLHF
●
チャットに対応するファインチューニング
●
指示応答モデル
●
使いやすくなって爆発的人気
●
RLHF(Reinforcement Learning from Human Feedback)
●
人間の評価による強化学習
●
やりとりの心地よさ