Upgrade to Pro — share decks privately, control downloads, hide ads and more …

大規模言語モデルについて

 大規模言語モデルについて

タイトル:大規模言語モデルについて
発表者:岩城安浩(GVA TECH株式会社 CAIO)
イベント:StartupConnect vol.2
- 開催テーマ: 生成系AI
- 開催日付: 2023/07/28
- 開催場所: 株式会社welldayオフィス

Avatar for Startup Connect

Startup Connect

July 31, 2023
Tweet

More Decks by Startup Connect

Other Decks in Technology

Transcript

  1. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      1 Startup Connect Vol.2 LT4
 ~ 大規模言語モデルについて ~
 (GVA TECH株式会社 CAIO 岩城安浩)

  2. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      2 GVA TECH株式会社 概要 GVA TECH株式会社 会社名 代表取締役 山本 俊(弁護士) 設立 2017年1月4日 資本金 1,495百万円(資本準備金含む) 事業内容 GVAシリーズの開発・運営 従業員数 67名 受賞歴(一例) 法務管理クラウド GVA manage AI契約審査クラウド GVA assist 商業・会社変更登記申請オンライン支援サービス GVA 法人登記 法人の登記簿謄本取得サービス GVA 登記簿取得 AI による秘密保持契約書チェックサービス GVA NDAチェック GVAシリーズ GVAシリーズをより成長させるエンジニア 募集中
  3. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      3 大規模言語モデル研究開発チームを立ち上げました リーガルテックのGVA TECHが「GPT-4」等の大規模言語モデル利用についての研究開発チームを 発足し、法務領域での利用研究を開始。
  4. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      4 本日お話すること
 • 文章生成可能な大規模言語モデルの概要を紹介 • 「勘違い騎士道事件」を題材としたGPT利用例 • 大規模言語モデルの長所、短所、今後の展望など • まとめ
  5. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      5 本日お話すること
 • 文章生成可能な大規模言語モデルの概要を紹介 • 「勘違い騎士道事件」を題材としたGPT利用例 • 大規模言語モデルの長所、短所、今後の展望など • まとめ
  6. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      6 大規模言語モデルの概要紹介
 • 本節の内容は以下 Preferred Networks 岡野原 氏の書籍や資料(の方)が(はるかに)参考になる ◦ 岡野原 大輔: 大規模言語モデルは新たな知能か , 岩波書店, 2023. ◦ 岡野原 大輔: 生成モデルは世界をどのように理解しているのか ”, 統計的機械学習」の中核 としての統計数理シンポジウム , 2023.
  7. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      7 識別モデルについて(*)
 (*) 藤野昭典, 上田修功, 磯崎秀樹: 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用 , 情報学会論文誌, 数理モデル 化と応用, Vol2. No.2, 132-144, 2009.
  8. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      8 生成モデルについて(*)
 (*) 藤野昭典, 上田修功, 磯崎秀樹: 生成・識別モデルの統合に基づく半教師あり学習法とその多重分類への応用 , 情報学会論文誌, 数理モデル 化と応用, Vol2. No.2, 132-144, 2009.
  9. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      9 言語モデルについて(*)
 (*) Alec Radford, Narthik Narasimhan, Tim Salimans, Ilya Sutskever: Improving Language Understanding by Generatiive Pre-Training.
  10. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      10 大規模言語モデルとは
 • 大量の文章で自己回帰型の事前学習 (Pre-Training)を施した巨大な規模の言語モデル • 大規模言語モデルとして有名な OpenAIのGPT(Generative Pretrained Transformer)は、 尤もらしい文章を生成可能な生成系 AIの一つ • 大規模言語モデルの例を下表に示す モデル名 企業名 GPT(Generative Pretrained Transformer) OpenAI LaMDA(Language Model for Dialogue Applications) Google PaLM(Pathways Language Model) Google LLaMA(Large Language Model Meta AI) Meta Sparrow DeepMind
  11. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      11 大規模言語モデルの特筆すべき特徴(*)
 • Transformer構造の大規模言語モデルでは、 自己回帰学習におけるテスト「損失」 と「計算量」、「データ量」、「パラメータ数」それぞれの間に「冪乗則」の関係が成立する • 大規模言語モデルの事前学習では、計算量、データ量、パラメータ数などが巨大になるほど性 能が良くなる (*) J. Kaplan et al.: Scaling Laws for Neural Language Models. arXiv:2001.08361, 2020.
  12. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      12 本日お話すること
 • 文章生成可能な大規模言語モデルの概要を紹介 • 「勘違い騎士道事件」を題材としたGPT利用例 • 大規模言語モデルの長所、短所、今後の展望など • まとめ
  13. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      13 題材 - 1
 勘違い騎士道事件 概要 勘違い騎士道事件(かんちがいきしどうじけん)または英国騎士道事件(えいこくきしどうじけん)は、 日本で起きた刑事事件である。最高裁判所が 誤想過剰防衛について刑法36条2項による刑の減刑 を認めた事例として知られる。英国人である被告人が、 状況を誤解したまま騎士道精神に基づいて 行動しようとしたために起きた事件であることからこのように言われる。 出典: フリー百科事典『ウィキペディア( Wikipedia)』
  14. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      14 題材 - 1
 勘違い騎士道事件 概要 勘違い騎士道事件(かんちがいきしどうじけん)または英国騎士道事件(えいこくきしどうじけん)は、 日本で起きた刑事事件である。最高裁判所が 誤想過剰防衛について刑法36条2項による刑の減刑 を認めた事例として知られる。英国人である被告人が、 状況を誤解したまま騎士道精神に基づいて 行動しようとしたために起きた事件であることからこのように言われる。 出典: フリー百科事典『ウィキペディア( Wikipedia)』 「誤想過剰防衛」とは 急迫不正の侵害がないにもかかわらず、あるものと誤信して防衛のための反撃を行った (誤想防 衛)ものの、それが誤信した侵害に対する防衛として過剰だった場合をいう
  15. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      15 題材 - 2
 勘違い騎士道事件 事案 1981年7月5日午後10時20分頃、空手3段の腕前である英国人の被告人が、夜間帰宅途中の路上 で、酩酊した女性とそれをなだめていた男性とが揉み合ううち、女性が倉庫の鉄製シャッターにぶつ かって女性が尻餅をついたのを目撃した。被告人は女性が男性に暴行を受けているものと誤解し て、両者の間に割って入った。被告人は女性を助け起こそうとし、ついで男性のほうに振り向き両手 を差し出した。男性はこれを見て、被告人が自分に襲い掛かってくるものと誤解し、防御するために 自分の手を握って胸の前あたりに上げた。 これを見た被告人は、男性がボクシングのファイティングポーズをとり、自分に襲い掛かってくるもの と誤解し、自己および女性の身体を防衛しようと考え、男性の顔面付近を狙って空手技である回し蹴 りを行い、実際に男性の右顔面付近に命中させた。それにより、男性は転倒して頭蓋骨骨折などの 重傷を負い、その障害に起因する脳硬膜外出血および脳挫滅によって、 8日後に死亡した。 出典: フリー百科事典『ウィキペディア( Wikipedia)』
  16. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      16 題材 - 3
 題材を以下のように簡略化 酔っ払った女性Aさんと介抱する男性 Bさんがいました。介抱の過程で Aさんは倒れてしまいます。そ こに居合わせた空手の達人 Cさんは、AさんをBさんから助けなければならないと思って二人の間に 入りました。Bさんは驚きのあまり防御体制に入り、その姿に攻撃意思を感じた Cさんが咄嗟にBさん へ回し蹴りをクリーンヒットさせました。後日 Cさんの回し蹴りが原因で Bさんは亡くなりました。この場 合Cさんの回し蹴りは正当防衛となるでしょうか。
  17. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      17 単純にGPTへ質問してみる - 1
 [prompt] あなたはベテラン弁護士です 酔っ払った女性 Aさんと介抱する男性 Bさんがいました。介抱の過程で Aさんは倒れてしまいます。そこに居合わせた空手の達 人Cさんは、AさんをBさんから助けなければならないと思って二人の間に入りました。 Bさんは驚きのあまり防御体制に入り、そ の姿に攻撃意思を感じた Cさんが咄嗟にBさんへ回し蹴りをクリーンヒットさせました。後日 Cさんの回し蹴りが原因で Bさんは亡 くなりました。この場合 Cさんの回し蹴りは正当防衛となるでしょうか。
  18. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      18 単純にGPTへ質問してみる - 2
 [GPTの出力] この場合、Cさんの行為が正当防衛と認められるかどうかは、以下の要件が満たされているかどうかによります。 1. 不法侵害の現在性: BさんがCさんに対して直ちに危害を加える可能性があったか。 2. 防衛の必要性:Cさんが自身の身を守るためには、回し蹴りをするしかなかったか。 3. 防衛の相当性:Cさんの行為が適切な範囲内であったか。 あなたが述べた事案に基づくと、 Bさんが防御体制に入ったという事実があるものの、それが Cさんに対する攻撃意思を示すも のであったかは明確ではありません。また、 Cさんが回し蹴りをするしかなかったかどうか、そしてその行為が適切な範囲内で あったかどうかも疑問が残ります。特に、 Cさんが空手の達人であることを考慮すると、より抑制的な防衛手段を選択できた可 能性もあります。 したがって、この事案において Cさんの行為が正当防衛と認められるかどうかは、裁判所が具体的な事情を詳細に審理した上 で判断する必要があります。ただし、一般的には、 Cさんの行為が正当防衛と認められる可能性は低いと考えられます。
  19. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      19 単純にGPTへ質問してみる - 2
 [GPTの出力] この場合、Cさんの行為が正当防衛と認められるかどうかは、以下の要件が満たされているかどうかによります。 1. 不法侵害の現在性: BさんがCさんに対して直ちに危害を加える可能性があったか 。 2. 防衛の必要性:Cさんが自身の身を守るためには、回し蹴りをするしかなかったか 。 3. 防衛の相当性:Cさんの行為が適切な範囲内であったか 。 あなたが述べた事案に基づくと、 Bさんが防御体制に入ったという事実があるものの、それが Cさんに対する攻撃意思を示すも のであったかは明確ではありません 。また、Cさんが回し蹴りをするしかなかったかどうか、そしてその行為が 適切な範囲内で あったかどうかも疑問 が残ります。特に、 Cさんが空手の達人であることを考慮すると、より 抑制的な防衛手段を選択できた可 能性もあります。 したがって、この事案において Cさんの行為が正当防衛と認められるかどうかは、裁判所が具体的な事情を詳細に審理した上 で判断する必要があります。ただし、一般的には、 Cさんの行為が正当防衛と認められる可能性は低いと考えられます。 • 「誤想過剰防衛」の観点が提示されている • 一読しただけでは素人が理解しにくい ?
  20. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      20 素人が理解しやすい文章とするには?
 • 文章を対話形式にすると、読者がその文章を主観的に受け入れやすくなる効果が期待される (*) • 入門書や取扱説明書などで、読者の理解を促進させることを目的として対話形式の文章が用 いられることが多い • GPTの出力形式を対話形式とするために、 GPTにブレストさせる (GPT出力を単純な質問に対する回答からブレストへ変える ) (*) 藤木大介, 田中瑠音, 井関龍太, 島田英昭: 文章を対話型にすることで理解は促進されるか , 日本心理学会第84回大会, PL-005, 2020.
  21. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      21 GPTにブレストさせる - 1
 # 命令書: - 次の制約条件のもとでブレインストーミングを行い、出力文以降に結果を出力して下さい。 # 制約条件: - ブレインストーミングの参加者は以下 3名とします。 理系を目指す高校3年生 ベテラン弁護士 法学部3年の大学生 - ブレインストーミングのテーマは以下です。 酔っ払った女性Aさんと介抱する男性 Bさんがいました。介抱の過程で Aさんは倒れてしまいます。そこに居合わせた空手の達人 Cさんは、Aさんを Bさんから助けなければならないと思って二人の間に入りました。 Bさんは驚きのあまり防御体制に入り、その姿に攻撃意思を感じた Cさんが咄嗟 にBさんへ回し蹴りをクリーンヒットさせました。後日 Cさんの回し蹴りが原因で Bさんは亡くなりました。この場合 Cさんの回し蹴りは正当防衛となる でしょうか。 - ブレインストーミングの参加者は 1人複数回発言して下さい。 - 出力文は以下のjsonリスト形式のみを出力して下さい。 [ {"{参加者名}": 参加者の発言}, ... ] # 出力文:
  22. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      22 GPTにブレストさせる - 2
 [高校3年生] まず、正当防衛の定義について理解する必要があると思います。それは自分や他人の生命、身体、自由などを守るために、やむを得ず行った行 為が罪に問われないという法の規定です。 [ベテラン弁護士] また、正当防衛には「相当性」という要素も必要です。つまり、防衛のための行為が適切であったかどうかです。この場合、 Cさんが回し蹴りを行っ たことが適切だったかどうかも問われます。 [法学部3年の大学生] その通りです。しかし、この場合、 CさんがBさんに対して回し蹴りを行った行為が「やむを得ず行った行為」であったかが問われます。 Bさんが防御 体制に入ったとはいえ、それが攻撃意思を示すものであったかは疑問です。 [高校3年生] それに、Cさんが空手の達人であることも考慮する必要があります。空手の達人である Cさんは、自身の行為がどれほどのダメージを与えるかを理 解していたはずです。 [ベテラン弁護士] 全ての事情を考慮した上で、この場合の Cさんの行為が正当防衛に該当するかどうかは、裁判所の判断に委ねられます。しかし、私の経験上、 C さんの行為が正当防衛と認められる可能性は低いと思います。 [法学部3年の大学生] その点については、 Cさんが自身の技の威力を理解していたとしても、その瞬間に Bさんが亡くなるとは予想できなかった可能性もあります。しか し、それでも回し蹴りを選択した Cさんの判断は問われるでしょう。
  23. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      23 GPTにブレストさせる - 2
 [高校3年生] まず、正当防衛の定義について理解する必要があると思います。それは自分や他人の生命、身体、自由などを守るために、やむを得ず行った行 為が罪に問われないという法の規定です。 [ベテラン弁護士] また、正当防衛には「相当性」という要素も必要です。つまり、 防衛のための行為が適切であったかどうか です。この場合、Cさんが回し蹴りを行っ たことが適切だったかどうかも問われます。 [法学部3年の大学生] その通りです。しかし、この場合、 CさんがBさんに対して回し蹴りを行った行為が 「やむを得ず行った行為」であったか が問われます。Bさんが防御 体制に入ったとはいえ、それが 攻撃意思を示すものであったかは疑問 です。 [高校3年生] それに、Cさんが空手の達人であることも考慮する必要があります。空手の達人である Cさんは、自身の行為がどれほどのダメージを与えるかを理 解していたはずです。 [ベテラン弁護士] 全ての事情を考慮した上で、この場合の Cさんの行為が正当防衛に該当するかどうかは、裁判所の判断に委ねられます。しかし、私の経験上、 C さんの行為が正当防衛と認められる可能性は低いと思います。 [法学部3年の大学生] その点については、 Cさんが自身の技の威力を理解していたとしても、その瞬間に Bさんが亡くなるとは予想できなかった可能性もあります。しか し、それでも回し蹴りを選択したCさんの判断は問われる でしょう。 • 「誤想過剰防衛」の観点が提示されている • 対話形式で素人にも理解しやすくなった ?
  24. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      24 本日お話すること
 • 文章生成可能な大規模言語モデルの概要を紹介 • 「勘違い騎士道事件」を題材としたGPT利用例 • 大規模言語モデルの長所、短所、今後の展望など • まとめ
  25. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      25 大規模言語モデルの長所
 • 「勘違い騎士道事件」を簡略化した題材において、 GPTへ投入するプロンプトを自然言語で修 正するだけで、質問に対する回答出力からブレスト出力へタスク変更できた • 従来の機械学習モデルでタスク変更を行うには少なくとも以下が必要 ◦ 新たな学習データの用意 ◦ パラメータ変更を伴うモデルの新たな学習 • 大規模言語モデルは、新たな学習データやパラメータ変更を伴う新たな計算なしで、自然言語 によるプロンプトを変更する (プロンプトエンジニアリング )だけで様々なタスクに対応できる 必ずしもドメイン知識や機械学習の専門知識が要求されないという観点において、大規模言 語モデルはAIの民主化へ大きく貢献
  26. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      26 大規模言語モデルの短所
 • 「勘違い騎士道事件」を簡略化した題材において、 GPTへ単純な質問回答を出力させた場合、 「誤想過剰防衛」に関する観点が記載されていたものの、出典情報が不明確 (GPTの生成した文章が正しいものか判断するための情報が示されない ) • 「勘違い騎士道事件」を簡略化した題材において、 GPTへブレストを出力させた場合、「誤想過 剰防衛」に関する観点が記載されていたものの、まるで実存する会話の一部のような文章が 得られた (GPTの生成した文章が事実として展開される可能性がある ) • 大規模言語モデルは、尤もらしい文章を生成しているだけで、生成された文章が内容として常 に正しいものとは限らず、事実に基づくものか定かではない 大規模言語モデルは、正しくないあるいは事実とは異なる内容をまるで事実かのように出力す る、「Hallucination(幻覚)」を起こす危険性を秘めている
  27. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      27 大規模言語モデルの今後の展望
 • 大規模言語モデルのプロンプトエンジニアリングによって多くのプロトタイプ AIが生まれる(誰も が簡単にそれらしい出力を返す AIを作れる) • 大規模言語モデルをベースとして作られた AIの出力が対象タスクの課題解決として成立する 内容になっているかを検証する仕組みが重要 ◦ プロンプトエンジニアリングに学習データは必要ないが、 出力検証のために何かしら整備されたデータは必要 ◦ プロンプトエンジニアリングにモデル計算は必要ないが、 出力検証を定量評価する際に何かしらの計算は必要 • 大規模言語モデルのプロンプトエンジニアリングでは、学習データの用意やモデル計算の過 程がスキップされている分、対象タスクの課題を解決する AIを「いかに作るか」よりも「いかに 評価するか」が鍵となる (?)
  28. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      28 大規模言語モデルの今後の展望
 • 用意した学習データが対象とする問題設定を解くために十分な情報を持つか、そもそも設定し た問題に期待する解が存在するか、我々は知り得ない • 当面は大規模言語モデルの巨大化、大規模言語モデルを利用したプロンプトエンジニアリン グやファインチューニングが上述問題への対処方法の候補となりえる • どのような手法を採用しようとも、検証や評価を通じて「対象の問題設定を考える」部分は共通 しており、逃れることができない (大規模言語モデルという手法が勝手に我々の課題を解決してくれるわけではない )
  29. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      29 本日お話すること
 • 文章生成可能な大規模言語モデルの概要を紹介 • 「勘違い騎士道事件」を題材としたGPT利用例 • 大規模言語モデルの長所、短所、今後の展望など • まとめ
  30. © 2022 GVA TECH All rights reserved 複写禁、転載禁 CONFIDENTIAL:This document

    is for your company’s internal use only and may not be copied nor distributed to any other third parties      30 まとめ
 ❏ 文章生成可能な大規模言語モデルの概要を紹介 ❏ 「勘違い騎士道事件」を題材とした GPT利用例 ❏ 大規模言語モデルの長所、短所、今後の展望など ❏ 学習データなしモデル計算なしの自然言語によるプロンプトエンジニアリングで誰もが AI開発 に参加できるようになった ❏ 出力にHallucination(幻覚) が発生する危険あり ❏ 「いかに作るか」よりも「いかに評価するか」が重要になりそう (?)