ChatGPT人間のフィードバックから強化学習した対話AI

Slide 1

Slide 1 text

ChatGPT ⼈間のフィードバックから強化学習した対話AI 東京⼤学⼤学院⼯学系研究科技術経営戦略学専攻今井翔太 Email: [email protected] Twitter：今井翔太 / Shota Imai@えるエル @ImAI_Eruel

Slide 27

Slide 27 text

従来のGPTの問題点 n データセットとして集めた⼤量のWebテキストデータ⾃体には，好ましくないテキストも⼤量に含まれる - 暴⼒的，デマ，陰謀論，極端な政治的主張，倫理に反する内容…など n GPTのような⾔語モデルはデータをもとに，「もっともらしい」⾔語出⼒をするように学習するだけなので，これらの問題を考慮・回避するようにはされていない n つまり，⼈間「らしい」⾔語の出⼒は可能だが，⼈間が「好ましい」出⼒をするようには学習されていない（例）「会社の上司との関係が悪いのですが，どうしたらいいですか？」という⽂章をGPTに⼊⼒した場合のGPTの出⼒好ましくない出⼒・暴⼒的である，倫理に反する内容も含まれているが，⼈間の⾔語としては⽂法も語彙も破綻しておらず正しい・Webにはこのような⽂章も多量に含まれるまずはその上司を⼀発殴ってやりましょう．暴⼒は全てを解決します．または，その上司が⾔うことをすべて無視するのもいいかもしれません．最終⼿段としては，その上司の秘密情報を⼊⼿して・・・ GPT いくつかの選択肢があります．まずは，上司本⼈と時間をとって⼀対⼀で話合うことが考えられます．他に考えられるのは，その上司のさらに上司にあたる⼈などに相談することです．社内で尽くせる⼿段をとっても解決しない場合，社外の相談機関に頼ることも考えるべきです． GPT 好ましい出⼒・暴⼒的な内容，倫理に反する内容を含まず，⽂法，語彙も正しい・解決策が⼀つではないことを⽰し，⼈間に最終的な判断を委ねる

Slide 50

Slide 50 text

定性評価 2/2 出⼒例1 誤った前提に基づくプロンプトを与えた場合 Why is it important to eat socks after meditating?（なぜ瞑想後に靴下を⾷べることが重要なのですか？） ※当然，瞑想後に靴下を⾷べるという常識は存在しない n GPT-3の出⼒ “靴下から何を学ぶことができますか？ A: 靴下を⾷べるということは、悟りのエッセンスを味わうということです。悟りのエッセンスを味わっているのです。あなたは、覚醒した⼼の本当の味を覚醒したマインドの本当の味を味わっているのです。 Q: ⽬覚めた⼼の本当の味とは何でしょう？本当の味とは何ですか？ A：覚醒した⼼の本当の味は味のない味です。そして、無味の本当の味は無味の味とは、⾜の臭いの味である。” n InstructGPTの出⼒ “この質問に対する明確な答えはありませんが、瞑想の後に靴下を⾷べる必要があることを説明する理論はたくさんあります。靴下を⾷べるという⾏為は、瞑想の結果、脳が変容した状態から抜け出すのを助けると考える専⾨家もいれば、瞑想のような⾁体的にも精神的にも難しい活動に従事した後の⾝体への燃料補給と関係があると指摘する専⾨家もいます。また、靴下を⾷べることで、瞑想者に新しい感覚を与えたり、普段の思考プロセスや⽇常から脱却して、物理的、物質的な世界とつながることができるのではないかという説もあります。しかし、これらの説を裏付ける確固たる科学的根拠は今のところなく、靴下を⾷べることがなぜ重要なのかは、最終的には各個⼈の経験や考えに基づいて決定されることでしょう。” Shota Imai | The University of Tokyo 50

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text

Slide 22

Slide 22 text

Slide 23

Slide 23 text

Slide 24

Slide 24 text

Slide 25

Slide 25 text

Slide 26

Slide 26 text

Slide 27

Slide 27 text

Slide 28

Slide 28 text

Slide 29

Slide 29 text

Slide 30

Slide 30 text

Slide 31

Slide 31 text

Slide 32

Slide 32 text

Slide 33

Slide 33 text

Slide 34

Slide 34 text

Slide 35

Slide 35 text

Slide 36

Slide 36 text

Slide 37

Slide 37 text

Slide 38

Slide 38 text

Slide 39

Slide 39 text

Slide 40

Slide 40 text