Upgrade to Pro — share decks privately, control downloads, hide ads and more …

外部データを利用したLLM出力精度の向上と著作権問題

 外部データを利用したLLM出力精度の向上と著作権問題

本スライドは、2023年12月26日にSTORIA法律事務所主催で開催したオンラインセミナーのスライドです。

FAQシステムやチャットボットなど「何か知りたいこと(検索文・質問文)」を入力して検索や回答生成を行うに際して、検索や回答精度を向上させたり、回答根拠を明示させるために、LLM技術と外部データを組み合わせたシステムの研究開発や実装が急速に進んでいます。

 ここでいう「外部データ」とは、「LLMの外部にあるデータ」という意味でして、その中には社内文書や、書籍・ウェブページ上のデータなどが含まれます。当該「外部データ」の中には、他人が著作権を持つ著作物(以下「既存著作物」といいます)も含まれるため、それら既存著作物を外部データとして利用する場合には、著作権侵害にならないよう注意をする必要があります。

 そこで、本セミナーでは、LLM技術と外部データ活用による検索・回答精度向上のいくつかの手法(ファインチューニング、セマンティック検索、In-Context Learning、RAG)と著作権侵害についてお話をします。
 以下が目次と各章の概要です。

第1 はじめに
第2 ファインチューニング
第3 セマンティック検索
第4 In-Context Learning
第5 RAG
第6 著作権侵害にならないシステム設計とは
第7 誰が著作権侵害の責任を負うのか

▼ 「第2 ファインチューニング」「第3 セマンティック検索」「第4 第4 In-Context Learning」「第5 RAG」
 ファインチューニング(FT)やセマンティック検索、ICL、RAGと著作権侵害について解説
  →セマンティック検索、ICL、RAGについては、それぞれ3つのパターンにわけて解説します。RAGは技術的には「セマンティック検索+ICL」なので、前の方の説明をよく聞いていただきたい。

▼ 「第6 著作権侵害にならないシステム設計とは」 
 著作権侵害の有無を決する分かれ目について解説。

▼ 「第7 誰が著作権侵害の責任を負うのか」
 ユーザーがみずから自社システムとして構築する場合のみならず、サービサーが自社サービスとして、あるいは受託開発してRAGを提供する場合に誰が著作権侵害の責任を負うか解説。

taichikakinuma

January 01, 2024
Tweet

More Decks by taichikakinuma

Other Decks in Technology

Transcript

  1. 【自己紹介】 ▼ 1997年京都大学卒業 ▼ 2000年4月弁護士登録 ▼ 2015年STORIA法律事務所設立 ▼ AI、データ、知的財産、スタートアッ プ法務を主として取り扱う

    ▼ 経産省の「AI・データ契約ガイドライ ン」検討委員会委員(2018) ▼ 経済産業省 「オープンイノベーション を促進するための技術分野別契約ガイドラ インに関する調査研究」委員会事務局(2021 ~) ▼ 日本データベース学会理事 ▼ JDLA有識者委員・理事
  2. ▪ 目次 🄫Storialaw.jp All rights reserved. 2 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  3. ▪ 目次 🄫Storialaw.jp All rights reserved. 3 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  4. 第1 はじめに 🄫Storialaw.jp All rights reserved. 4 質問 LLM 回答

    入力 解析 生成 【課題】 ① 最新の知識を反映させられない ② 社内ナレッジ、ドメイン知識などを反映させられない ③ 回答の根拠が不明
  5. 第1 はじめに 🄫Storialaw.jp All rights reserved. 5 1 ファインチューニング 専門知識を学習用データとしてLLMの学習(パラメーターの物理的な更新)を行う。

    2 In-Context Learning ・ LLMの学習(パラメーターの物理的な更新)は行わない。 ・ 質問と関連性が高い(回答の参考にしてほしい)専門知識を質問と同時に入力して回答精度を 上げ、回答根拠を明示する。
  6. 第1 はじめに 🄫Storialaw.jp All rights reserved. 6 3 RAG(*セマンテック検索を利用する場合) ①

    回答生成に利用したい専門知識をベクトルDB化しておく ② 質問が行われたら質問と関連性が高い(回答の参考にしてほしい)専門知識を検索(セマン ティック検索)する ③ 質問+②で検索された専門知識を同時にLLMに入力して回答を生成する)In-Context Learning) →セマンティック検索+In-Context Learning
  7. 第1 はじめに 🄫Storialaw.jp All rights reserved. 7 4 著作権法との関連性 精度向上策としてのファインチューニング(FT)やセマンティック検索、ICL、RAGでは、外部

    データとして他人の著作物(Webページ、書籍等)を利用することがある。 →無許諾でそれらの著作物を利用した場合、著作権侵害に該当しないかの問題 ファインチューニング ICL、RAG
  8. 第1 はじめに 🄫Storialaw.jp All rights reserved. 8 5 本セミナーの構成 ▼

    「第2 ファインチューニング」「第3 セマンティック検索」「第4 第4 In-Context Learning」「第5 RAG」 ファインチューニング(FT)やセマンティック検索、ICL、RAGと著作権侵害について解説 →セマンティック検索、ICL、RAGについては、それぞれ3つのパターンにわけて解説します。 RAGは技術的には「セマンティック検索+ICL」なので、前の方の説明をよく聞いていただきたい。 ▼ 「第6 著作権侵害にならないシステム設計とは」 著作権侵害の有無を決する分かれ目について解説。 ▼ 「第7 誰が著作権侵害の責任を負うのか」 ユーザーがみずから自社システムとして構築する場合のみならず、サービサーが自社サービスとし て、あるいは受託開発してRAGを提供する場合に誰が著作権侵害の責任を負うか解説。
  9. ▪ 目次 🄫Storialaw.jp All rights reserved. 9 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  10. 1 具体例 🄫Storialaw.jp All rights reserved. 12 ① 第三者が提供する画像生成AIのOSSを使い、他者の画像でファインチューニング(LoRA含 む)を行って自社専用の画像生成AIを構築

    ② 第三者が提供するLLMのAPI を利用した自社専用FAQシステムの構築の際、回答精度を上げる ため、各種データによる当該LLMのFTを行う。
  11. 2 原則 🄫Storialaw.jp All rights reserved. 13 いずれの具体例も30条の4第2号により原則として適法。 *「情報解析」には LoRA、FTも含む

    (著作物に表現された思想又は感情の享受を目的としない利用) 第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享 受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、い ずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに 当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。 一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合 二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他 の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第 二号において同じ。)の用に供する場合 三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該 著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつ ては、当該著作物の電子計算機における実行を除く。)に供する場合
  12. 3 日本著作権法30条の4の特殊性 🄫Storialaw.jp All rights reserved. 14 ▼ 主体や利用目的に制限がない。 例:英国の場合、「非商業的調査のためのテキストおよびデータの解析のための複製」のみが権

    利制限の対象(著作権・意匠・特許法29A条、2014年改正) 。 ▼ 利用行為が国外で行われた場合に日本の著作権法30条の4が適用されるか(準拠法の問題) 「当該著作物が利用される地」(利用行為地国)の法律が適用 →LLM開発目的で著作物の利用行為を行う場合でも、当該利用に関する利用行為地(≒サーバ所 在地)が日本であれば日本著作権法が適用され、米国であれば米国著作権法が適用されることにな る。 ▼ 著作権者が誰かは無関係 準拠法の問題は、あくまで「利用行為地」が日本国内か否かの問題であって、当該著作物の著作 権者が日本の企業なのか外国の企業なのかは無関係
  13. 3 日本著作権法30条の4の特殊性 🄫Storialaw.jp All rights reserved. 15 ▼ 第三者のために学習行為や学習に必要な著作物利用行為を行う場合(例:受託開発)や、第三 者に当該行為を行わせる場合(例:自炊業者の利用)でも適用される

    (理由) ① 30条の4は、30条のように、権利制限規定の適用対象を「その使用する者が複製する」場合 に限定していない ② 30条の4は「情報解析・・・の用に供する場合」及び「いずれの方法によるかを問わず、利 用することができる」と規定されていることから、他人による情報解析のためのデータセット作成 行為や、情報解析目的で収集したデータセット等を情報解析に供する第三者に譲渡したり、公衆送 信をすることも可能。
  14. 4 例外 🄫Storialaw.jp All rights reserved. 16 (1) 例外1 著作物の利用行為時に「情報解析」等の目的に加えて、学習対象著作物の享受目的が併存してい

    る場合 (2) 例外2 30条の4但書「ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利 益を不当に害することとなる場合は、この限りでない。」に該当する場合
  15. 4 例外 🄫Storialaw.jp All rights reserved. 17 (1)例外1:著作物の利用行為時に「情報解析」等の目的に加えて、学習対象著作物の享受目的が 併存している場合 「情報解析(学習)のために対象著作物の利用行為を行うに際して、対象著作物の「表現上の本

    質的な特徴」を感じ取れるようなAI生成物の作成目的(=対象著作物の享受目的)が併存している 場合 ▼そのような目的はなかったが、たまたま上記のようなAI生成物が生成された場合には「享受目 的あり」とは推認されない →実際には、どの程度の確率で上記のような状態になるかによって判断されると思われる(素 案P4)
  16. 4 例外 🄫Storialaw.jp All rights reserved. 18 (1)例外1:著作物の利用行為時に「情報解析」等の目的に加えて、学習対象著作物の享受目的が 併存している場合(*以下の例は素案P3~4から、形式的修正をした上で引用) ▼

    ファインチューニングのうち、意図的に、学習データをそのまま出力させることを目的とした ものを行うため、著作物の複製等を行う場合。 (例)いわゆる「過学習」(overfitting)を意図的に行う場合)
  17. 4 例外 🄫Storialaw.jp All rights reserved. 19 (1)例外1:著作物の利用行為時に「情報解析」等の目的に加えて、学習対象著作物の享受目的が 併存している場合(*以下の例は素案P3~4から、形式的修正をした上で引用) ▼

    学習データをそのまま出力させる意図までは有していないが、少量の学習データを用いて、学 習データの影響を強く受けた生成物が出力されるようなファインチューニングを行うため、著作物 の複製等を行う場合 →具体的事案に応じて、学習データの著作物の表現上の本質的特徴を直接感得できる生成物を出 力することが目的であると評価される場合は、享受目的が併存すると考えられる。
  18. 4 例外 🄫Storialaw.jp All rights reserved. 20 (1)例外1:著作物の利用行為時に「情報解析」等の目的に加えて、学習対象著作物の享受目的が 併存している場合(*以下の例は素案P3~4から、形式的修正をした上で引用。青字は柿沼) ▼

    特定のクリエイターの作品である著作物のみを学習データとしてファインチューニングを行う ことで、当該作品群の影響を強く受けた生成物を生成することを可能とする行為が行われており、 このような行為によって特定のクリエイターの、いわゆる「作風」を容易に模倣できてしまうと いった点に対する懸念も示されている。 →このような場合、当該作品群は、表現に至らないアイデアのレベルにおいて、当該クリエイ ターのいわゆる「作風」を共通して有しているにとどまらず表現のレベルにおいても、当該作品群 には、これに共通する表現上の本質的特徴があると評価できる場合もあると考えられることに配意 すべきである。
  19. 4 例外 🄫Storialaw.jp All rights reserved. 21 (1)例外1:著作物の利用行為時に「情報解析」等の目的に加えて、学習対象著作物の享受目的が 併存している場合(*以下の例は素案P3~4から、形式的修正をした上で引用) ▼

    ポイント:著作物を利用する際に「享受目的」があることが必要 →そのような目的はなかったが、結果的に「偶然」利用対象著作物と同一・類似のAI生成物が生 成されただけで、著作物の利用行為に「享受目的」が推認されるわけではない 素案P4 なお、生成・利用段階において、AI が学習した著作物に類似した生成物が生成される事例があったとしても、 通常、このような事実のみをもって開発・学習段階における享受目的の存在を推認することまではできず、法第 30 条の4の適用は直ちに否定されるものではないと考えられる。他方で、生成・利用段階において、学習され た著作物に類似した生成物の生成が頻発するといった事情は、開発・学習段階における享受目的の存在を推認す る上での一要素となり得ると考えられる。 *上記は「学習」における著作物利用行為が著作権侵害にならないかの問題であり、「生成・利用 段階」で、「偶然」生成された、利用対象著作物と同一・類似のAI生成物を利用することが著作権 侵害にならないかとは別の問題であることに注意が必要。
  20. 4 例外 🄫Storialaw.jp All rights reserved. 22 (2)例外2: 30条の4但書「ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし 著作権者の利益を不当に害することとなる場合は、この限りでない。」

    ▼ 30条の4が適用される行為は著作権者の利益を通常害するものではない。 ▼ ただし書に該当するか否かは、同様のただし書を置いている他の権利制限規定(法35条第1項 等)と同様に、著作権者の著作物の利用市場と衝突するか、あるいは将来における著作物の潜在的 市場を阻害するかという観点から判断 →典型的には、「大量の情報を容易に情報解析に活用できる形で整理したデータベースの著作物 が販売されている場合(DVD、ネットからのダウンロード、API提供等)に,当該データベースを 情報解析目的で複製等する行為」(「基本的な考え方」9頁、素案P6)が該当。 ▼ 「作風や画風といったアイデア等が類似するにとどまり、既存の著作物との類似性が認められ ない生成物は、これを生成・利用したとしても、既存の著作物との関係で著作権侵害とはならな い。」(素案P6)
  21. 4 例外 🄫Storialaw.jp All rights reserved. 23 (2)例外2: 30条の4但書「ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし 著作権者の利益を不当に害することとなる場合は、この限りでない。」

    ▼ 議論を呼びそうなのは素案P7に記載されている例(以下は柿沼において適宜修正した上で引 用したもの) ① AI 学習のための著作物の複製等を防止する技術的な措置(ウェブサイト内のファイ ル”robots.txt”への記述や、ID・パスワード等を用いた認証)が講じられており ② 当該ウェブサイト内のデータを含み、情報解析に活用できる形で整理したデータベースの著作 物が将来販売される予定があることが推認される場合、 ③ ①の措置を回避して行う AI 学習のための複製等(①②③は柿沼が付けた番号) →当該データベースの著作物の将来における潜在的販路を阻害する行為として、通常、法第 30 条の4ただし書に該当し、同条による権利制限の対象とはならないと考えられる(素案P7)。
  22. 4 例外 🄫Storialaw.jp All rights reserved. 24 (2)例外2: 30条の4但書「ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし 著作権者の利益を不当に害することとなる場合は、この限りでない。」

    ▼ 素案P7の記載に対する疑問 ① 「将来販売される予定があることが推認される場合」が曖昧ではないか。 →この部分が曖昧だと、AI学習にかなり大きな萎縮効果が生じるのではないか。「推認」でいい となると、おそらく全権利者が「このデータは、将来データベースの著作物として販売する予定が ある」と言い出すのではないかと思われる。 →なお、素案の脚注で示されている例(The New York Times、Financial Times、The Guardian、Axel Springer)は、いずれも「将来販売される予定があることが推認される場合」で はなく、「実際に既に販売されている事例」なので理解できるが、なぜ素案の本文では「将来販売 される・・・」と、かなり広い解釈を示しているのかはよくわからない。 ② 平成30年著作権法改正時の附帯決議(改正前著作権法において権利制限の対象として想定され ていた行為については引き続き権利制限の対象とする)との関係。 ③ 著作権法においては、技術的制限手段を回避すると権利制限規定の適用がない場合はその旨条 文に明記されている(30条1項2号、47条の5第1項)が、30条の4にはそのような規定はない(た だし、素案が上記「措置」=著作権法上の技術的利用制限手段・技術的保護手段に該当するとして いるわけではない)。
  23. ▪ 目次 🄫Storialaw.jp All rights reserved. 25 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  24. 2 セマンテック検索のフロー 🄫Storialaw.jp All rights reserved. 27 ① 検索対象文書とそのベクトルをベクトルデータベース(ベクトルDB)内に蓄積 ②

    ユーザーによる質問文の入力 ③ 質問文のベクトル化 ④ 質問文ベクトルと検索対象文書をマッチング ⑤ 質問文ベクトルと関連性が高い検索対象文書を抽出 ⑥ 検索結果提供及びそれに伴う検索対象文書の表示
  25. 3 セマンテック検索の3つのパターン 🄫Storialaw.jp All rights reserved. 28 ▼ パターン1 検索結果提供(ヒットした書籍の書誌情報やURLの提供)と共に、マッチングした検索対象文書

    の全部が表示される ▼ パターン2 検索結果提供と共に、マッチングした検索対象文書の一部が表示される ▼ パターン3 検索結果提供だけが行われ、マッチングした検索対象文書は一切表示されない
  26. 4 検討フロー 🄫Storialaw.jp All rights reserved. 33 (電子計算機による情報処理及びその結果の提供に付随する軽微利用等) 第四十七条の五 電子計算機を用いた情報処理により新たな知見又は情報を創出することによつて著作物の利用の促進に資

    する次の各号に掲げる行為を行う者(当該行為の一部を行う者を含み、当該行為を政令で定める基準に従つて行う者に限 る。)は、公衆への提供等(公衆への提供又は提示をいい、送信可能化を含む。以下同じ。)が行われた著作物(以下この 条及び次条第二項第二号において「公衆提供等著作物」という。)(公表された著作物又は送信可能化された著作物に限 る。)について、当該各号に掲げる行為の目的上必要と認められる限度において、当該行為に付随して、いずれの方法によ るかを問わず、利用(当該公衆提供等著作物のうちその利用に供される部分の占める割合、その利用に供される部分の量、 その利用に供される際の表示の精度その他の要素に照らし軽微なものに限る。以下この条において「軽微利用」という。) を行うことができる。ただし、当該公衆提供等著作物に係る公衆への提供等が著作権を侵害するものであること(国外で行 われた公衆への提供等にあつては、国内で行われたとしたならば著作権の侵害となるべきものであること)を知りながら当 該軽微利用を行う場合その他当該公衆提供等著作物の種類及び用途並びに当該軽微利用の態様に照らし著作権者の利益を不 当に害することとなる場合は、この限りでない。 一 電子計算機を用いて、検索により求める情報(以下この号において「検索情報」という。)が記録された著作物の題号 又は著作者名、送信可能化された検索情報に係る送信元識別符号(自動公衆送信の送信元を識別するための文字、番号、記 号その他の符号をいう。第百十三条第二項及び第四項において同じ。)その他の検索情報の特定又は所在に関する情報を検 索し、及びその結果を提供すること。 二 電子計算機による情報解析を行い、及びその結果を提供すること。 三 前二号に掲げるもののほか、電子計算機による情報処理により、新たな知見又は情報を創出し、及びその結果を提供す る行為であつて、国民生活の利便性の向上に寄与するものとして政令で定めるもの 2 前項各号に掲げる行為の準備を行う者(当該行為の準備のための情報の収集、整理及び提供を政令で定める基準に従つ て行う者に限る。)は、公衆提供等著作物について、同項の規定による軽微利用の準備のために必要と認められる限度にお いて、複製若しくは公衆送信(自動公衆送信の場合にあつては、送信可能化を含む。以下この項及び次条第二項第二号にお いて同じ。)を行い、又はその複製物による頒布を行うことができる。ただし、当該公衆提供等著作物の種類及び用途並び に当該複製又は頒布の部数及び当該複製、公衆送信又は頒布の態様に照らし著作権者の利益を不当に害することとなる場合 は、この限りでない。
  27. 4 検討フロー 🄫Storialaw.jp All rights reserved. 34 ▼ 30条の4と47条の5第1項・第2項の関係性 情報解析等に必要な

    (「前」の) 著作物利用行為 情報解析等の結果提供に 必要な(「後」の) 著作物利用行為 30条の4 47条の5 2項 1項
  28. 4 検討フロー 🄫Storialaw.jp All rights reserved. 35 ▼ 検討の視点 (1)

    検索や情報解析の一連のプロセスの中に、 ・ 「情報解析」(30条の4第2号) ・ 「著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機によ る情報処理の過程における利用その他の利用に供する場合」(同第3号) ・ 「電子計算機を用いた検索及びその結果提供」(47条の5第1項第1号) ・ 「電子計算機を用いた情報解析及びその結果提供」(同2号) のいずれか(以下「情報解析等」という)が存在し、 (2) 当該情報解析等に必要な著作物の利用行為、あるいは当該情報解析等の結果提供のために 必要な著作物の利用行為であれば、 (4) 30条の4または47条の5の適用可能 *30条の4の方が47条の5より適用要件が緩いので、まず30条の4を検討し、NGであれば47条の5 を検討
  29. 5 パターン1 🄫Storialaw.jp All rights reserved. 39 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  30. 5 パターン1 🄫Storialaw.jp All rights reserved. 41 情報解析 著作物利用行為① 対象著作物

    の享受 パターン1の場合、検索結果提供に伴って、検索対象文書が全部表示されている →著作物利用行為①に既存著作物の享受目的が併存しているため、著作物利用行為①につ いて30条の4適用なし (1) 30条の4
  31. 5 パターン1 🄫Storialaw.jp All rights reserved. 42 ▼ 素案P4は、生成 AI

    に関して、享受目的が併存すると評価される(その結果30条の4が適用さ れない)具体的な例の1つとして以下の例を挙げている。 AI 学習のために用いた学習データを出力させる意図は有していないが、既存のデータベースや Web 上に掲載されたデータの全部又は一部を、生成 AI を用いて出力させることを目的として、 著作物の内容をベクトルに変換したデータベースを作成する等の、著作物の複製等を行う場合。 (例)以下のような検索拡張生成(RAG)のうち、生成に際して著作物の一部を出力させることを 目的としたもの(なお、RAG については後掲(1)ウも参照) ・ インターネット検索エンジンであって、単語や文章の形で入力された検索クエリをもとにイ ンターネット上の情報を検索し、その結果をもとに文章の形で回答を生成するもの ・ 企業・団体等が、単語や文章の形で入力された検索クエリをもとに企業・団体等の内部で蓄積 されたデータを検索できるシステムを構築し、当該システムが、検索の結果をもとに文章の形で回 答を生成するもの →本セミナーで説明するパターン1、及びパターン2がまさに「既存のデータベースや Web 上に掲 載されたデータの全部又は一部を、生成 AI を用いて出力させることを目的」としている場合に該 当する。 →30条の4は適用されない。
  32. 5 パターン1 🄫Storialaw.jp All rights reserved. 43 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  33. 5 パターン1 🄫Storialaw.jp All rights reserved. 45 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  34. ▪ 47条の5の構造 🄫Storialaw.jp All rights reserved. 46 情報解析等に必要な (「前」の) 著作物利用行為

    情報解析等の結果提供に 必要な(「後」の) 著作物利用行為 47条の5 2項 1項
  35. ▪ 47条の5の構造 🄫Storialaw.jp All rights reserved. 47 ▼ 47条の5第2項の要件 1

    47条の5第1項の要件 ① 「(・・・当該行為を政令で定める基準に従って行う者に限る。)」 (ア) 47条の5第2項により作成された著作物等の複製物を使用する場合に、当該複製物に係る情 報の漏えいの防止のために必要な措置を講じること(施行令7条の4第1項2号) (イ) 要件の解釈を記載した書類の閲覧、学識経験者への相談等(施行令7条の4第1項3号及び施 行規則4条の5第1号) (ウ) 問合せを受けるための連絡先等の情報の明示(施行令7条の4第1項3号及び施行規則4条の 5第2号) ② 「当該行為に付随して」 ③ 「軽微利用」 ④ 「当該各号に掲げる行為の目的上必要と認められる限度において」 ⑤ 1項ただし書に該当しない 2 「前項各号に掲げる行為の準備を行う者(当該行為の準備のための情報の収集、整理及び提供を 政令で定める基準に従って行う者に限る。)」 3 同項の規定による軽微利用の準備のために必要と認められる限度において 4 2項ただし書に該当しない *47条の5第2項が適用されるためには、47条の5第1項の要件を満たす必要がある
  36. 5 パターン1 🄫Storialaw.jp All rights reserved. 48 著作物利用行為① 検索結果提供 ・

    著作物利用行為①は、検索結果提供の準備行為に該当する。 ・ しかし、パターン1では⑥で既存著作物が全部表示されているので⑥部分について、検 索結果提供に際しての1項要件「軽微利用」の要件を満たさない →その準備段階である著作物利用行為①について47条の5第2項の適用なし (2) 47条の5
  37. 5 パターン1 🄫Storialaw.jp All rights reserved. 49 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  38. 5 パターン1 🄫Storialaw.jp All rights reserved. 50 検索結果提供 著作物利用行為② ・

    著作物利用行為②は、検索結果提供に必要な限度で行われている。 ・ しかし、パターン1では⑥で既存著作物が全部表示されているので「軽微利用」の要件 を満たさない →著作物利用行為②について47条の5第1項の適用なし (2) 47条の5
  39. 5 パターン1 🄫Storialaw.jp All rights reserved. 51 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  40. 5 パターン1 🄫Storialaw.jp All rights reserved. 52 著作物利用行為① 著作物利用行為② ・

    著作物利用行為①②いずれも30条の4及び47条の5の要件を満たさない。 →他の権利制限規定の適用がなければ著作権侵害 (3) まとめ
  41. 6 パターン2 🄫Storialaw.jp All rights reserved. 55 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  42. 6 パターン2 🄫Storialaw.jp All rights reserved. 57 情報解析 著作物利用行為① 対象著作物

    の享受 パターン2の場合、⑥の検索結果提供に伴って、検索対象文書が一部表示されている →著作物利用行為①に既存著作物の享受目的が併存しているため、著作物利用行為①につ いて30条の4適用なし (1) 30条の4
  43. 6 パターン2 🄫Storialaw.jp All rights reserved. 58 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  44. 6 パターン2 🄫Storialaw.jp All rights reserved. 60 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  45. 6 パターン2 🄫Storialaw.jp All rights reserved. 61 著作物利用行為① 検索結果提供 ・

    著作物利用行為①は、⑥の検索結果提供の準備行為に該当する。 ・ パターン2では、⑥で既存著作物が一部表示されているにすぎないので、⑥について、 「軽微利用」「付随性」を満たせば、⑥について47条の5第1項の適用あり →47条5項2項のその他の要件を満たせば、著作物利用行為①について47条の5第2項の 適用あり (2) 47条の5
  46. 6 パターン2 🄫Storialaw.jp All rights reserved. 62 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  47. 6 パターン2 🄫Storialaw.jp All rights reserved. 63 検索結果提供 著作物利用行為② ・

    著作物利用行為②は、検索結果提供に必要な限度で行われている。 ・ パターン2では既存著作物が一部表示にとどまっているので「軽微利用」「付随性」の 要件を満たせば著作物利用行為②について47条の5第1項の適用があり適法 (2) 47条の5
  48. 6 パターン2 🄫Storialaw.jp All rights reserved. 64 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  49. 6 パターン2 🄫Storialaw.jp All rights reserved. 65 著作物利用行為① 著作物利用行為② ・

    著作物利用行為①②いずれも47条の5の要件を満たす可能性がある。 →要件を満たせば適法 ・ 著作権法30条の4と同様、第三者のために学習行為や学習に必要な著作物利用行為を行 う場合(例:受託開発)や、第三者に当該行為を行わせる場合(例:自炊業者の利用)でも 47条の5は適用されると思われる。
  50. 7 パターン3 🄫Storialaw.jp All rights reserved. 69 情報解析 著作物利用行為① パターン3の場合、検索結果提供に伴って、検索対象文書が表示されていない。

    →パターン1、パターン2と異なり、著作物利用行為①に既存著作物の享受目的が併存し ていない →著作物利用行為①について30条の4適用があり適法(47条の5検討不要) (1) 30条の4
  51. 7 パターン3 🄫Storialaw.jp All rights reserved. 70 ▼ 素案P16 【その他の論点】

    ク 生成指示のための生成 AI への著作物の入力について〔骨子案:(2)カ〕 ◦ 生成 AI に対して生成の指示をする際は、プロンプトと呼ばれる複数の単語又は 文章や、画像 等を生成 AI に入力する場合があり、入力に当たっては、著作物の複製等が生じる場合がある。 ◦ この生成 AI に対する入力は、生成物の生成のため、入力されたプロンプトを情報解析するもの であるため、これに伴う著作物の複製等については、法第 30 条の4の適用が考えられる。 ◦ ただし、生成 AI に対する入力に用いた既存の著作物と類似する生成物を生成させる目的で当該 著作物を入力する行為は、生成 AI による情報解析に用いる目的の他、入力した著作物に表現され た思想又は感情を享受する目的も併存すると考えられるため、法第30条の4は適用されないと考え られる。 →上記素案は「AI生成物を生成するためのプロンプト入力に際しての著作物利用行為」についての 記述 →もっとも、30条の4の文言は「情報解析」であり、セマンテック検索における「ベクトルDB内を 検索し、既存情報ベクトルと質問文ベクトルのマッチング」も「情報解析」に該当すると考える。 →上記素案の考え方は、セマンティック検索におけるパターン3にも適用可能と考える。
  52. 7 パターン3 🄫Storialaw.jp All rights reserved. 71 ▼ 「基本的な考え方」問16(P14) 問

    16 書籍や資料などの全文をキーワード検索して,キーワードが用いられている書籍や資料のタ イトルや著者名・作成者名などの検索結果を表示するために書籍や資料などを複製する行為は,権 利制限の対象となるか。 【回答】 書籍や資料などの文章中にキーワードが存在するか否かを検索する行為は,当該著作物の視聴等 を通じて,視聴者等の知的・精神的欲求を満たすという効用を得ることに向けられた行為ではない ものと考えられることから,キーワード検索を行うために書籍や資料などを複製する行為は,著作 物に表現された思想又は感情の享受を目的としない行為として,権利制限の対象となるものと考え られる。 一方で,キーワードが用いられている書籍や資料のタイトルや著者名・作成者名などの検索結果 とともに,キーワードを含む本文の一部分(著作物)を併せて提供する場合に,当該提供される本 文の一部分(著作物)の提供は,当該著作物の視聴等を通じて,視聴者等の知的・精神的欲求を満 たすという効用を得ることに向けられた行為であると考えられることから,そのような利用に供す る目的で書籍や資料などを複製する行為は,著作物に表現された思想又は感情の享受を目的とする 行為として,法第30条の4の権利制限の対象とはならないものと考えられる。このような行為につ いては,軽微性等の要件を満たせば,第47条の5第1項の準備のための行為として,第47条の5 第2項における権利制限の対象となるものと考えられる。 この回答の前半部分はパターン3のことを指し、後半部分はパターン1または2のことを指している。
  53. ▪ 目次 🄫Storialaw.jp All rights reserved. 72 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  54. 1 In-Context Learningとは 🄫Storialaw.jp All rights reserved. 73 ・ LLMへ入力するプロンプトとして、①

    指示文(質問文)と共に、② 出力生成の際に参考に させたいデータや、理想的な入出力例のデータを同時に追加入力することで、出力精度を上げる手 法 ・ そのような追加データを全く入力しない手法をZero-shot Learning、1つだけ与える手法を One-shot Learning、いくつか与える手法をFew-shot Learningと言う。 ・ たとえばLLMへの入力プロンプトとして「・・・について説明して下さい。その際には以下の 資料を参考にして下さい。#資料1#資料2」のように、指示文と共に、正確な出力生成に必要な文 書等のデータ(以下「同時入力文書」といいます)を同時に入力する方法
  55. 2 In-Context Learningのフロー 🄫Storialaw.jp All rights reserved. 74 ① 同時入力文書の準備(複製等)

    ② 指示文(プロンプト)と①の同時入力文書をLLMに入力 ③ LLM内で指示文(プロンプト)と同時入力文書を解析 ④ 出力生成
  56. 3 In-Context Learningの3つのパターン 🄫Storialaw.jp All rights reserved. 75 ▼ パターン1

    出力結果として新たに生成された出力と同時入力文書の全部が表示される ▼ パターン2 出力結果として新たに生成された出力と、同時入力文書の一部が表示される ▼ パターン3 出力結果として新たに生成された出力のみが表示され同時入力文書の内容が一切表示されない
  57. 3 In-Context Learningの3つのパターン 🄫Storialaw.jp All rights reserved. 76 ▼ パターン1

    出力結果として新たに生成された出力と同時入力文書の全部が表示される
  58. 3 In-Context Learningの3つのパターン 🄫Storialaw.jp All rights reserved. 77 ▼ パターン2

    出力結果として新たに生成された出力と、同時入力文書の一部が表示される
  59. 3 In-Context Learningの3つのパターン 🄫Storialaw.jp All rights reserved. 78 ▼ パターン3

    出力結果として新たに生成された出力のみが表示され同時入力文書の内容が一切表示されない
  60. 4 パターン1 🄫Storialaw.jp All rights reserved. 81 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  61. 4 パターン1 🄫Storialaw.jp All rights reserved. 82 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  62. 4 パターン1 🄫Storialaw.jp All rights reserved. 83 情報解析 著作物利用行為① ICLにおけるプロンプトと同時入力文書の「③

    解析行為」は「情報解析」(30条の4第 2号)に該当する(素案P16) (1) 30条の4
  63. 4 パターン1 🄫Storialaw.jp All rights reserved. 84 情報解析 著作物利用行為① パターン1の場合、最終的な「④

    出力生成」に伴って、同時入力文書が全部表示されて いる。 →著作物利用行為①に既存著作物の享受目的が併存しているため、著作物利用行為①につ いて30条の4適用なし →ファインチューニングによる学習行為の際には、通常享受目的が併存することはないが、 ICLの場合、やろうと思えば容易に同時入力文書を表示することが可能であり、その場合に は享受目的が存在することになる。 (1) 30条の4 対象著作物 の享受
  64. 4 パターン1 🄫Storialaw.jp All rights reserved. 85 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  65. 4 パターン1 🄫Storialaw.jp All rights reserved. 87 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  66. 4 パターン1 🄫Storialaw.jp All rights reserved. 88 ・ 著作物利用行為①は、④の情報解析結果提供の準備行為に該当する。 ・

    しかし、パターン1では④で既存著作物が全部表示されているので④部分について、情 報解析結果提供に際しての1項要件「軽微利用」の要件を満たさない →その準備段階である著作物利用行為①について47条の5第2項の適用なし 情報解析 の結果提供 著作物利用行為① (2) 47条の5
  67. 4 パターン1 🄫Storialaw.jp All rights reserved. 89 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  68. 4 パターン1 🄫Storialaw.jp All rights reserved. 90 ・ 著作物利用行為②は、情報解析結果提供に必要な限度で行われている。 ・

    しかし、パターン1では④で既存著作物が全部表示されているので「軽微利用」の要件 を満たさない →著作物利用行為②について47条の5第1項の適用なし 著作物利用行為② 情報解析 の結果提供 (2) 47条の5
  69. 4 パターン1 🄫Storialaw.jp All rights reserved. 91 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  70. 5 パターン2 🄫Storialaw.jp All rights reserved. 95 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  71. 5 パターン2 🄫Storialaw.jp All rights reserved. 96 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  72. 5 パターン2 🄫Storialaw.jp All rights reserved. 97 情報解析 著作物利用行為① ICLにおけるプロンプトと同時入力文書の「③

    解析行為」は「情報解析」(30条の4第 2号)に該当する(素案P16) (1) 30条の4
  73. 5 パターン2 🄫Storialaw.jp All rights reserved. 98 情報解析 著作物利用行為① パターン2の場合、④の情報解析結果提供に伴って、検索対象文書が一部表示されている

    →著作物利用行為①に既存著作物の享受目的が併存しているため、著作物利用行為①につ いて30条の4適用なし (1) 30条の4 対象著作物 の享受
  74. 5 パターン2 🄫Storialaw.jp All rights reserved. 99 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  75. 5 パターン2 🄫Storialaw.jp All rights reserved. 101 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  76. 5 パターン2 🄫Storialaw.jp All rights reserved. 102 ・ 著作物利用行為①は、④の情報解析結果提供の準備行為に該当する。 ・

    パターン2では、④で既存著作物が一部表示されているにすぎないので、④について、 「軽微利用」「付随性」を満たせば、④について47条の5第1項の適用あり →47条5項2項のその他の要件を満たせば、著作物利用行為①について47条の5第2項の 適用あり 情報解析 の結果提供 著作物利用行為① (2) 47条の5
  77. 5 パターン2 🄫Storialaw.jp All rights reserved. 103 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  78. 5 パターン2 🄫Storialaw.jp All rights reserved. 104 ・ 著作物利用行為②は、情報解析結果提供に必要な限度で行われている。 ・

    パターン2では既存著作物が一部表示にとどまっているので「軽微利用」「付随性」の 要件を満たせば著作物利用行為②について47条の5第1項の適用があり適法 著作物利用行為② 情報解析 の結果提供 (2) 47条の5
  79. 5 パターン2 🄫Storialaw.jp All rights reserved. 105 (1) 30条の4適用検討 ①

    著作物利用行為① ② 著作物利用行為② (2) 47条の5適用検討 ① 著作物利用行為① ② 著作物利用行為② (3) まとめ
  80. 5 パターン2 🄫Storialaw.jp All rights reserved. 106 著作物利用行為① 著作物利用行為② ・

    著作物利用行為①②いずれも47条の5の要件を満たす可能性がある。 →要件を満たせば適法
  81. 7 パターン3 🄫Storialaw.jp All rights reserved. 109 情報解析 著作物利用行為① ・

    ICLにおけるプロンプトと同時入力文書の「③ 解析行為」は「情報解析」(30条の4 第2号)に該当する(素案P16) →パターン3の場合、情報解析結果提供に伴って、検索対象文書が表示されていない。 →パターン1、パターン2と異なり、著作物利用行為①に既存著作物の享受目的が併存し ていない →著作物利用行為①について30条の4適用があり適法(47条の5検討不要) (1) 30条の4
  82. 7 パターン3 🄫Storialaw.jp All rights reserved. 110 ▼ 素案P16 【その他の論点】

    ク 生成指示のための生成 AI への著作物の入力について〔骨子案:(2)カ〕 ◦ 生成 AI に対して生成の指示をする際は、プロンプトと呼ばれる複数の単語又は 文章や、画像 等を生成 AI に入力する場合があり、入力に当たっては、著作物の複 製等が生じる場合がある。 ◦ この生成 AI に対する入力は、生成物の生成のため、入力されたプロンプトを情報解析するもの であるため、これに伴う著作物の複製等については、法第 30 条の4の適用が考えられる。 ◦ ただし、生成 AI に対する入力に用いた既存の著作物と類似する生成物を生成させる目的で当該 著作物を入力する行為は、生成 AI による情報解析に用いる目的の他、入力した著作物に表現され た思想又は感情を享受する目的も併存すると考え られるため、法第30条の4は適用されないと考 えられる。 →上記素案は「AI生成物を生成するためのプロンプト入力に際しての著作物利用行為」についての 記述であり、ICLのパターン3に直接当てはまる。
  83. ▪ 目次 🄫Storialaw.jp All rights reserved. 111 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  84. 1 RAG(Retrieval Augmented Generation、拡張検索)とは 🄫Storialaw.jp All rights reserved. 112 あらかじめ社内文書や書籍、ウェブページなどの外部データをデータベース(DB)として準備し

    ておき、ユーザからの質問がなされた場合には、当該質問と関連性が高い外部データを検索し、そ の外部データを質問文に付加してLLMに入力することで、精度が高い、かつ実際の外部データに紐 付いた回答を生成することができるシステム
  85. 2 RAGのフロー 🄫Storialaw.jp All rights reserved. 113 ① 同時入力文書とそのベクトルをベクトルDB内に蓄積 ②

    ユーザーによる質問クエリ(プロンプト)の入力 ③ 質問クエリ(プロンプト)のベクトル化 ④ 質問文ベクトルと同時入力文書をマッチング ⑤ 質問文ベクトルと関連性が高い同時入力文書を抽出 ⑥ 質問文(プロンプト)と⑤の同時入力文書をLLMに入力 ⑦ LLM内で質問文(プロンプト)と同時入力文書を解析 ⑧ 出力生成 ⑨ 出力利用
  86. 2 RAGのフロー 🄫Storialaw.jp All rights reserved. 114 ① 同時入力文書とそのベクトルをベクトルDB内に蓄積 ②

    ユーザーによる質問クエリ(プロンプト)の入力 ③ 質問クエリ(プロンプト)のベクトル化 ④ 質問文ベクトルと同時入力文書をマッチング ⑤ 質問文ベクトルと関連性が高い同時入力文書を抽出 ⑥ 質問文(プロンプト)と⑤の同時入力文書をLLMに入力 ⑦ LLM内で質問文(プロンプト)と同時入力文書を解析 ⑧ 出力生成 ⑨ 出力利用 (セマンテック)検索部分
  87. 2 RAGのフロー 🄫Storialaw.jp All rights reserved. 115 ① 同時入力文書とそのベクトルをベクトルDB内に蓄積 ②

    ユーザーによる質問クエリ(プロンプト)の入力 ③ 質問クエリ(プロンプト)のベクトル化 ④ 質問文ベクトルと同時入力文書をマッチング ⑤ 質問文ベクトルと関連性が高い同時入力文書を抽出 ⑥ 質問文(プロンプト)と⑤の同時入力文書をLLMに入力 ⑦ LLM内で質問文(プロンプト)と同時入力文書を解析 ⑧ 出力生成 ⑨ 出力利用 ICL部分
  88. 3 RAGの3つのパターン 🄫Storialaw.jp All rights reserved. 116 ▼ パターン1 出力結果として新たな生成結果及び同時入力文書の全部が表示される

    ▼ パターン2 出力結果として新たな生成結果及び同時入力文書の一部が表示される ▼ パターン3 出力結果として新たな生成結果のみが表示され同時入力文書の内容が一切表示されない
  89. 4 パターン1 🄫Storialaw.jp All rights reserved. 121 著作物利用行為① 著作物利用行為② 情報解析

    ▼ 30条の4 ① 著作物利用行為①:享受目的あるので適用なし ② 著作物利用行為②:情報解析「後」の行為なので適用なし (1) 30条の4
  90. 4 パターン1 🄫Storialaw.jp All rights reserved. 122 著作物利用行為① 著作物利用行為② 情報解析

    結果提供 ▼ 47条の5 ① 著作物利用行為①:利用行為②が1項に該当しないので2項適用なし ② 著作物利用行為②:1項の「軽微利用」等の要件満たさないので適用なし (2) 47条の5
  91. 5 パターン2 🄫Storialaw.jp All rights reserved. 124 著作物利用行為① 著作物利用行為② 情報解析

    ▼ 30条の4 ① 著作物利用行為①:最終的に一部表示されており享受目的あるので適用なし ② 著作物利用行為②:情報解析「後」の行為なので適用なし。 (1) 30条の4
  92. 5 パターン2 🄫Storialaw.jp All rights reserved. 125 著作物利用行為① 著作物利用行為② 情報解析

    結果提供 ▼ 47条の5 ① 著作物利用行為①:利用行為②が1項に該当し、2項の他の要件満たせば2項適用あり ② 著作物利用行為②:1項の「軽微利用」等の要件満たせば1項適用あり (2) 47条の5
  93. 6 パターン3 🄫Storialaw.jp All rights reserved. 127 著作物利用行為① ▼ 30条の4

    ① 利用行為①:享受目的ないので適用あり(47条の5の適用検討不要) (2) 47条の5
  94. ▪ 目次 🄫Storialaw.jp All rights reserved. 128 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  95. 第6 著作権侵害にならないシステム設計とは 🄫Storialaw.jp All rights reserved. 129 ▼ ここまでの説明内容をざっくりまとめると ①

    利用対象となった著作物が、検索結果や生成結果として全部表示されている場合は、学習も、 LLMへの入力もNG ② 検索結果や生成結果表示における著作物の利用が「軽微利用」に該当し、その他47条の5の要 件満たせば、47条の5によりOK ③ 利用対象となった著作物が、検索結果や生成結果として全く表示されていなければ30条の4に よりOK →結局「利用対象となった著作物が検索結果や生成結果として全部・一部表示されている」かど うかが、著作権侵害になるかどうかの分かれ目となる。 ▼ 具体的には 利用対象となる既存著作物に含まれている具体的表現と、検索結果や生成結果に含まれている具 体的表現を比較した場合において、後者が前者の「複製」「翻案」に該当するかの問題。 →文章の場合「既存の著作物に依拠して創作された著作物が、思想、感情若しくはアイデア、事 実若しくは事件など表現それ自体でない部分又は表現上の創作性がない部分において、既存の著作 物と同一性を有するにすぎない場合には、翻案には当たらないと解するのが相当である。」(江差 追分事件(最一小判平成13年6月28日民集55巻4号837頁)「要旨2」)とされている。
  96. 第6 著作権侵害にならないシステム設計とは 🄫Storialaw.jp All rights reserved. 132 ▼ 以上を踏まえたシステム設計ポイント 検索結果や生成結果を生成・表示する際に、利用対象となった著作物の「表現上の本質的な特

    徴」ではなく、当該著作物のうち「思想、感情若しくはアイデア、事実若しくは事件など表現それ 自体でない部分」や「表現上の創作性がない部分」のみを利用するように設計すれば良い →たとえば、技術的・法律的な質問に回答するQAシステムの場合、回答において、利用対象著 作物(例:書籍やウェブページ)の「表現上の本質的な特徴」ではなく、利用対象著作物内の「法 令、告示、通達、判決や決定等」(著作権法13条1ないし3号参照)「著者の見解を普通の表現で 論じた部分」「一般的な見解」「法令・通達内容や法令又は判例・学説によって当然に導かれる事 項」のみを表示するようにすれば「翻案」等に該当しない ① 入力時点でのコントロール 入力するプロンプト(システムプロンプト・クエリ拡張等)を工夫することで、利用対象著作物 の「表現上の本質的な特徴」が出力・生成されないようにコントロールする。 ② モデル(LLM)の選定 学習や入力に利用した対象著作物がそのまま出力されないようなモデル(LLM)選定が必要。 ③ 出力時点でのコントロール 利用対象著作物(RAGであればDB内の著作物)と出力を比較して、一定以上の表現の類似性が ある場合には出力をストップ・修正するなどの技術的工夫。 *後述の「参考(素案P15)」も参照
  97. ▪ 目次 🄫Storialaw.jp All rights reserved. 133 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  98. 第7 誰が著作権侵害の責任を負うのか 🄫Storialaw.jp All rights reserved. 134 ユーザー サービサー 【具体例】

    ① サービサー側が、ある特定のジャンル の既存著作物(書籍やWEBページ)の収 集やDB化、システム構築を行う ② ユーザーが質問文や検索文を同サービ スに入力する ③ 出力結果が生成される ④ ユーザーが同出力結果を利用する
  99. 第7 誰が著作権侵害の責任を負うのか 🄫Storialaw.jp All rights reserved. 135 1 ユーザーが著作権侵害の責任を負う場合 ▼

    ユーザーの行っている行為 ②質問文・同時入力著作物の入力行為、③出力結果の生成、④出力結果の利用行為 ▼ 類似性・依拠性 前図の場合、LLMに既存著作物が入力され、当該既存著作物の一部または全部が出力された場合、 著作権侵害の要件である「依拠性」は確実に満たす。 ▼ 権利制限規定 ・ 出力結果の中に同時入力著作物が一部含まれていても、それが「軽微利用」の範囲であれば、 ユーザーは出力結果を、検索結果や情報解析結果として提供する目的内であれば利用可能(著作権 法47条の5及び47条の7)。 ・ 「軽微利用」の範囲外であったり、検索結果や情報解析結果として提供する目的がない場合 であっても、「引用」(著作権法32条)などの別の権利制限規定の要件を満たせば利用可能 →出力結果の中に同時入力著作物が含まれており、かつそれが「軽微利用」の範囲を超えており、 他の権利制限規定の適用もない場合、ユーザーが出力結果を利用(公衆に提供等)すると、当該利 用行為はユーザーの著作権侵害に該当
  100. 第7 誰が著作権侵害の責任を負うのか 🄫Storialaw.jp All rights reserved. 136 1 サービサーが著作権侵害の責任を負う場合 (1)

    ユーザーの著作権侵害行為の幇助者としての責任を負う場合 ユーザーが著作権侵害行為を行った場合において、サービサーがその「幇助」者としての責任を 負うかの問題。 【検討】 ・ なんらかの技術的な工夫により、「ユーザーがどのような質問をしても、出力結果に「軽微利 用」を超える同時入力著作物が含まれない」(つまりパターン2またはパターン3しかありえない) ような厳格な仕組みになっている場合 →「軽微利用」部分を目的外利用しているのはもっぱらユーザー側によってなされている行為で すので、サービサーのサービス提供行為はユーザーの著作権侵害の幇助行為とは言えない ・ そのような仕組みを備えず、場合によっては「軽微利用」を超える出力結果が容易に生成され るような場合 →そのようなサービス提供は著作権侵害の幇助行為に該当するし、ユーザーの著作権侵害行為に 対するサービサーの故意過失もあり、サービサーも共同不法行為責任を負う可能性がある。
  101. 第7 誰が著作権侵害の責任を負うのか 🄫Storialaw.jp All rights reserved. 137 1 サービサーが著作権侵害の責任を負う場合 (2)

    サービサー自身が著作権侵害主体としての責任を負う場合 ユーザーが著作権侵害行為を行ったか否かに関わらず、サービサー自身が著作権侵害主体とし ての責任を負うかの問題。 →従来の裁判例上、物理的な侵害行為を行っていない主体も、一定の場合に侵害主体として責任 を負う場合がある(規範的責任論) 【検討】 ユーザーの質問内容に関わらず、必ず「軽微利用」を超える出力を生成するようなサービスの場 合(本セミナーにおけるパターン1) →サービサー自身が同時入力著作物を蓄積した上でユーザーに対して公衆送信していることにな るため、サービサー自身が著作権侵害主体としての責任を負うことになる。
  102. 第7 誰が著作権侵害の責任を負うのか 🄫Storialaw.jp All rights reserved. 138 ▪ 参考(素案P15)(青字部分は柿沼) 【侵害行為の責任主体について】

    キ 侵害行為の責任主体について〔骨子案:(2)オ〕 ◦ 従来の裁判例上、著作権侵害の主体としては、物理的に侵害行為を行った者が主体となる場合のほか、 一定の場合に、物理的な行為主体以外の者が、規範的な行為主体として著作権侵害の責任を負う場合があ る(いわゆる規範的責任論)。 ◦ そこで、AI 生成物の生成・利用が著作権侵害となる場合の侵害の主体の判断においても、物理的な行 為主体である AI 利用者のみならず、生成 AI の開発や、生成 AI を用いたサービス提供を行う事業者が、 著作権侵害の行為主体として責任を負う場合があると考えられる。 ◦ この点に関して、具体的には、以下のように考えられる。 ① ある特定の生成 AI を用いた場合、侵害物が高頻度で生成される場合は、事業者が侵害主体と評価され る可能性が高まるものと考えられる。 ② 事業者が、生成 AI の開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成する可能性を認 識しているにも関わらず、当該類似物の生成を抑止する技術的な手段を施していない場合、事業者が侵害 主体と評価される可能性が高まるものと考えられる。 ③ 事業者が、生成 AI の開発・提供に当たり、当該生成 AI が既存の著作物の類似物を生成することを防止 する技術的な手段を施している場合、事業者が侵害主体と評価される可能性は低くなるものと考えられる。 ④ 当該生成 AI が、事業者により上記の(2)キ③の手段を施されたものであるなど侵害物が高頻度で生 成されるようなものでない場合においては、たとえ、AI 利用者が既存の著作物の類似物の生成を意図して 生成 AI にプロンプト入力するなどの指示を行い、侵害物が生成されたとしても、事業者が侵害主体と評 価される可能性は低くなるものと考えられる
  103. ▪ まとめ 🄫Storialaw.jp All rights reserved. 139 第1 はじめに 第2

    ファインチューニング 第3 セマンティック検索 第4 In-Context Learning 第5 RAG 第6 著作権侵害にならないシステム設計とは 第7 誰が著作権侵害の責任を負うのか
  104. 140