Slide 28
Slide 28 text
研究過程上流で生じた変動への適応/変動の吸収
仮説1:ReLU が悪さしてるのでは?
検証1:ReLu を取り外す/別のものに変えて学習&比較
問い1:なぜOOのテスト精度がよくないのか?
仮説2:訓練データの質が悪いのではないか?
仮説1:人の価値観をよく理解してそれを教えればいいのでは?
検証1:人の価値観を表現するデータを作成して学習&評価
問い2:どうすればAIが人の価値に沿うようにできるか?
仮説2:人の価値に沿うよう推論時に指示すればいいのでは?
検証2:訓練データを集め直して学習&比較
検証2:人の価値に沿う指示したプロンプトで推論&評価
この多様性に如何
に対応して適切な
仮説生成/検証を
計画・実行させる
ことができるか?
どのような制約を
どこまで加えれば
どれだけの広いク
ラスの研究をカバ
ーできるか?