【図解】大規模言語モデル基礎① ファインチューニングとRAGの違いと使い分け

⾮エンジニアのための LLMの基本① LLM（⼤規模⾔語モデル）とは LLMに追加でデータを学習させる⽅法

LLM（⼤規模⾔語モデル）とは 2

LLM（⼤規模⾔語モデル）とは LLM（⼤規模⾔語モデル）とは、⼤量のテキストデータを学習させた深層学習モデル。精度と効率良く”次単語予測”が可能で、要約や翻訳、⽂章の分析、⾃然な⽂の⽣成ができる⼤量のテキストデータ Wikipedia, ニュース記事, ブログなど LLM （⼤規模⾔語モデル）
学習⽂章を⽣成 ChatGPTなどの⽣成AIアプリ 3

LLM（⼤規模⾔語モデル）の仕組み 4

LLM（⼤規模⾔語モデル）の仕組み吾輩は猫である。名前は LLM（⼤規模⾔語モデル）
LLM（⼤規模⾔語モデル）は、⼤量の⽂章から”次単語予測”を効率的に⾏なっているミケ 25% まだ 50% 佐藤 10% 夏⽬ 5.0% 彼 2.0% … ⽂脈（コンテクスト）から、もっとも確率が⾼い次の単語を計算して出⼒する。これを繰り返して⽂章を⽣成する。⽂脈（コンテクスト）： 5

LLMに出来ること・出来ないこと 6

◯ ⼀般常識については回答できる ✖ 最新情報や専⾨的な情報については回答できない LLM（⼤規模⾔語モデル）はその仕組み上、学習時のデータセットに含まれていない情報や計算問題については回答できない出来ること出来ないこと • ⼀般知識に基づく回答
• ⼀般的なプログラムコードの⽣成 • 要約、翻訳、校正 • データ整形、抽出 • 最新情報 • 企業内情報や専⾨的な情報など、学習していない情報 • 記号や数字についての処理 • 完全に独創的なアイディア出し 7

LLMに追加でデータを学習させる⽅法 8

RAG 読み⽅: ラグ vs fine-tuning 読み⽅: ファインチューニング社内データなど、追加でデータを学習させる⼿法には⼤きくﬁne-tuningとRAGと呼ばれる⼆つの⼿法がある LLMに追加でデータを学習させる2つの⽅法 9

fine-tuingとは 10

追加したい情報 fine-tuningはモデル⾃体を追加学習させる⼿法既存のLLMに追加データを学習させること。LLMのパラメータの⼀部を変更・追加している⼤量のデータを学習させる元のLLM ⼤量のデータによってパラメータが決定されている fine-tuning済LLM 追加したデータについても答えられるようになる
※fine-tuningには、”破壊的忘却”（元々答えられた内容が答えられなくなること）が起こるリスクがあります 11

RAGとは 12

RAG（Retrieval-Augmented Generation）は外部データを参照する⼿法 LLMが知らない知識や最新情報を”参照”して回答する⼿法。社内専⽤データを検索したりインターネット上を検索したりできる LLM ⼤規模⾔語モデルデータベース等ユーザー ② 検索する
③ 検索結果を返す 13

社内情報を回答させるには fine-tuning vs RAG どちらが良いか 14

fine-tuning RAG 開発コスト低め対話形式に整形したデータをアップロードするだけで完了する低い〜高い DB開発や検索アルゴリズムの実装など精度向上に際限はない回答の正確さ
低め追加データが少ないと正しく回答できない。破壊的忘却によってLLM自体の精度が低下する高め生成時に正しい情報を参照するため複雑な文構造でない限り正しく回答できる回答スピード速い LLM単体で完結するため高速遅い検索処理によって遅くなる Web検索をする場合はネットワークの遅延も影響する利用例・口調や出力形式を調整したいケース・電話など回答速度が必要なケース・大量のデータを参照したいケース・精度や出典明記が必要なケース RAG vs fine-tuning → 正確な回答が期待できるRAGが有効多くの場合、RAGの⽅が直接データを読んで回答するので内容が正確。ただし速度が重要な場⾯などではfine-tuningが採⽤されることもあります ↑ 多くの場⾯で有効 15

まとめ LLMに社内データを回答させるにはRAGが有効次回は RAG について、詳しく解説します本スライドについてのお問い合わせはこちら: [email protected] 16

【図解】大規模言語モデル基礎① ファインチューニングとRAGの違いと使い分け

【図解】大規模言語モデル基礎① ファインチューニングとRAGの違いと使い分け

IZAI Inc.

Featured

Transcript

⾮エンジニアのための LLMの基本① LLM（⼤規模⾔語モデル）とは LLMに追加でデータを学習させる⽅法

LLM（⼤規模⾔語モデル）とは 2

LLM（⼤規模⾔語モデル）の仕組み 4

LLM（⼤規模⾔語モデル）の仕組み吾輩は猫である。名前は LLM（⼤規模⾔語モデル）

LLMに出来ること・出来ないこと 6

LLMに追加でデータを学習させる⽅法 8

RAG 読み⽅: ラグ vs fine-tuning 読み⽅: ファインチューニング社内データなど、追加でデータを学習させる⼿法には⼤きくﬁne-tuningとRAGと呼ばれる⼆つの⼿法がある LLMに追加でデータを学習させる2つの⽅法 9

fine-tuingとは 10

RAGとは 12

社内情報を回答させるには fine-tuning vs RAG どちらが良いか 14

fine-tuning RAG 開発コスト低め対話形式に整形したデータをアップロードするだけで完了する低い〜高い DB開発や検索アルゴリズムの実装など精度向上に際限はない回答の正確さ

まとめ LLMに社内データを回答させるにはRAGが有効次回は RAG について、詳しく解説します本スライドについてのお問い合わせはこちら: [email protected] 16