エンプラRAG構築の最適解！Oracle AI Vector Searchによる明日からできるRAG！

Slide 1

Slide 1 text

エンプラRAG構築の最適解！ Oracle AI Vector Searchによる明日からできるRAG！ db tech showcase 2024 2024/7/11

Slide 2

Slide 2 text

本日お話ししたいこと Oracle AI Vector Searchは、うまい！安い！早い！

Slide 3

Slide 3 text

最上隆史アドバンストテクノロジー部ディレクターウルシステムズ株式会社 2024年 Oracle DevelperDays登壇。GenerativeAI Japan登壇。DBTechShowcase登壇。 2023年 ScrumMaster(CSM)取得。 2020年 DBTechShowcase登壇。[RDS脳なあなたにKVSモデリングのノウハウを公開！KVS設計はこうしよう] 2019年 ChainerUserGroupにJOIN、DLLABにて一般向け講師、執筆等でChainer普及活動に貢献。 2019年 AWS DeepRacer日本選抜。ウルシステムズ歴20年。アーキテクト、業務/データモデリング、AIを中心とした技術コンサルティングおよび開発業務を展開。システム構築に関するグランドデザイン策定から要件定義、アーキテクチャ策定、概念モデリング、設計、開発、運用、パフォーマンスチューニングまで幅広く支援。 SLAM(自己位置推定)系、ロボティクス系も好き。現在は蓄積された業務知識を武器に生成AIを使ったビジネスユースケースへの適用を複数の企業と展開。

Slide 4

Slide 4 text

◼ LLMを業務活用して、もっと便利に使いたい。 ◼ でも、その業務をLLMが知らない。教えたい！？生成AI＋RAGが求められるようになった背景 LLMだけでは業務活用に十分ではありません。効果的な業務活用のためには、新卒教育のようにLLMに業務知識を教える必要があります。 LLMモデルに業務全体を記憶させる LLMに回答に必要な業務情報を都度教える FineTuning RAG

Slide 5

Slide 5 text

生成AI＋RAGが求められるようになった背景 RAGは、うまい！安い！早い！ LLMモデルに業務全体を記憶させる回答に必要な業務を検索して LLMに都度与える FineTuning RAG • 精度が高い。のか?? Pros Cons • 検証までに時間がかかる • お金もかかる • ハルシネーション問題 • すぐに検証できる • さほどお金はかからない • 検証精度が高いと十分使える • ハルシネーション対策 • ハルシネーション問題 Fine-Tuning or Retrieval? Comparing Knowledge Injection in LLMs(https://arxiv.org/pdf/2312.05934) 結果として、ファインチューニングは一部の改善を提供しますが、RAGは既存の知識や新しい知識の注入において一貫して優れた性能を示した。特に、LLMがファインチューニングで新しい事実を学ぶのは困難であることが明らかになりました。

Slide 6

Slide 6 text

生成AI＋RAGが適用できる業務領域複数のデータセットが複数のエリアに対して業務改善ができる。カスタマサポート過去の問い合わせログ製品マニュアル業界トレンド/ 市場調査 R&D、製品企画マーケティング人事部門、採用 • 回答の正確性と一貫性が向上 • 新入社員の教育時間短 • 縮顧客満足度の向上 • イノベーションの加速 • 競合分析の効率化 • 新製品アイデアの創出 • ターゲット顧客の深い理解 • パーソナライズされたキャンペーン作成 • トレンド予測の精度向上 • 適切な人材のマッチング精度向上 • 採用プロセスの効率化 • 従業員のキャリア開発支援履歴書/評価データベース技術論文特許情報

Slide 7

Slide 7 text

◼ ベクトル検索は「意味が近い」データを検索できるおいしくするタレは、ベクトル検索にあるエンプラデータ（社内文書、社内データ）が、なぜRAGを使うと活用できるようになるのか。彼は公園でジョギングをしている彼女は公園を走っている私は夏休みにビーチに行くのが好きです彼女は夏にビーチを訪れるのが好きだ似てる似てない似てるベクトルデータのイメージ d1 d2

Slide 8

Slide 8 text

ベクトル化の重要性テキストの意味的な特徴を数学的に高次元のベクトルで表現することで、意味が近い・遠いが数字でわかる ✓ ハルシネーション問題に対処ができる ✓ 社内情報/データを使って、より優れた回答を生み出す ✓ LLMトークンの制限を超えないようにできる • 猫は魚が好きだ • ネコは魚を食べるのが好きだ • 猫は魚料理を喜んで食べる • フェリーヌは魚介類を好む • 数学は難しい • 数式を理解するのは大変だ • 数学の問題を解くのは骨が折れる • 複雑な計算は頭を悩ませる • 動物の学習能力は驚くべきものだ • 猫の問題解決能力を研究している • 動物の知能を数値化するのは難しい • 猫の空間認識能力は高度だ意味が近い(0.1) 意味が近い(0.1) 意味が近い(0.1) 意味が微妙に近い (0.3) 意味が遠い (0.9) 意味が微妙に近い (0.4)

Slide 9

Slide 9 text

ベクトル化技術の発展初期の単純なモデルから現代の複雑で文脈を理解するモデルまで、半世紀以上にわたる進化の歴史 1960s ベクトル空間モデル 1990s 潜在意味解析 2003s トピックモデル(LDA) 2013s Word2Vec 2018-現在 BERT,GPT等の大規模言語モデルテキストを数値ベクトルとして表現する基本的なアイデアが誕生。しかし、当時は計算能力の制限により、実用化は限定的。単語の共起関係を利用して、潜在的な意味を捉えようとした。テキストの意味的類似性をより良く表現できるようになる。文書をトピックの確率分布として表現する手法が開発。テキストの意味構造をより深く理解できるようになる。単語レベルでの効率的なベクトル表現が可能。大規模なテキストから学習し、単語間の意味的関係をより精密に捉えることができた。、多くの自然言語処理タスクの性能を大幅に向上させる。 2018年以降、BERT、 GPTシリーズなどの大規模言語モデルが次々と登場。自然言語処理タスクの性能を飛躍的に向上させ、文脈を考慮したより深い言語理解と生成が可能になった。

Slide 10

Slide 10 text

生成AI＋RAGの代表的アーキテクチャとは生成AI＋RAGのデータの流れ【質問】猫の寿命は？【LLM統合プロセス】 • 一般的な寿命範囲の特定 • 品種による差異の認識 • 環境要因の影響の考慮 • ケアの重要性の強調 • 個体差への言及【検索結果１】家猫の平均寿命は12〜18 年程度です。適切なケアで20年以上生きる猫もいます。【検索結果２】猫の品種によって寿命は異なります。シャム猫は 15〜20年、メインクーンは12〜15年程度です。【検索結果３】屋内で飼育される猫は屋外の猫よりも長生きします。平均で13〜17年の寿命があります。【LLMが生成する回答】猫の平均寿命は一般的に12〜18年程度ですが、様々な要因によって変動します。品種による差異があり、例えばシャム猫は 15〜20年、メインクーンは12〜15年程度の寿命があります。環境も重要な要素で、屋内で飼育される猫は13〜17年程度の寿命がある一方、屋外猫は3〜10年と短くなる傾向があります。これは、屋外の様々な危険から守られているためです。適切なケアと栄養管理を行えば、20年以上生きる猫もいます。猫の寿命は、遺伝的要因、環境、健康管理など、多くの要素に影響されます。したがって、猫の寿命を最大限に延ばすには、適切な栄養、定期的な獣医のチェック、安全な屋内環境の提供が重要です。ただし、個体差があるため、これらはあくまで平均的な数値であることに注意してください。 Retriever LLM

Slide 11

Slide 11 text

生成AI＋RAGの代表的アーキテクチャとはどのクラウドを使っても構成は一緒 Online Application Vector Store Database LLM Batch Application

Slide 12

Slide 12 text

RAGという技術が熱いらしい！5,000万で導入しろ！は、はい... ～3ヶ月後～あのラグタイムの進捗は？ RAGです...結果は... おお！素晴らしいんだろう？実は...イマイチで... 何！？5,000万かけて何してた？構築に4500万、検証に500万使って... 検証？何を検証した？えーと...GPT-4との比較でF1スコアを... で？すみません...でも、学びはたくさんあって... へぇ、5000万の学びか。高い授業料だったな！次は100万くらいで... （突然笑う）「面白い！承認だ。今度こそ結果を出せよ！話はかわりますが・・・こういうことってありますよね？パート１ RAG導入の珍道中

Slide 13

Slide 13 text

◼ いまは構築はしたくないなー。ちょっと試してみたいだけなんだけどなぁ。 ◼ WEBマニュアルに詳しく書いてあるけど、読みたくないなー。いま、どうしたらいいのか教えて欲しいんだけどぉー。というか構築はどうでもいいんだけどぉ。 ◼ あーなんか聞いたことのないクラウドリソース名がでてきた。いやだなー。 ◼ あ、権限エラーか・・・あ、IPアドレス制限か。うーん。つながらないなー。ポートかなー。で、３日がすぎる。話はかわりますが。。。こういうことってありますよね？パート２構築が最初のハードル。あ、権限が、あ、ポートが。。。うーん。立ち上がらない・・・

Slide 14

Slide 14 text

➢ alter table employee add column SKILL_VECTOR VECTOR; ➢ insert/update employee XXXX ➢ select VECTOR_DISTANCE(A, B) from employee それ、いつもあなたのそばにあるOracleデータベースが解決します！ alter add columnで始まる、Oracleデータベース上でのベクトル検索

Slide 15

Slide 15 text

代表的アーキテクチャと一線を画すOracleデータベースベクトル検索のために、エンプラデータ（社内情報/社内データ）を別のVector Storeにレプリケートするよりも、ベクトル化を追加する方が簡単である Online Application Vector Store Database LLM Batch Application Online Application Oracle Database23ai LLM Batch Application Vector Store 一般的なRAGアーキテクチャ Oracleを使ったRAGアーキテクチャ

Slide 16

Slide 16 text

◼ 新規にVECTORデータ型を構成 Oracle AI Vector Searchの基本あなたの得意な、普通のSQLにびっくり！！これだけ知っていれば十分使える。 CREATE TABLE employee( id number, name varchar2(128) skill varchar2(1024) skill_vector VECTOR );

Slide 17

Slide 17 text

◼ 行制限(FETCH)句の新しいAPPROXIMATEキーワードは、類似度検索を示す。 skill_vectorを使用し、類似度で上位５の社員を検索 Oracle AI Vector Searchの基本あなたの得意な、普通のSQLにびっくり！！これだけ知っていれば十分うまい。 SELECT id, name, skill FROM employee ORDER BY VECTOR_DISTANCE(skill_vector, :QUERY_VEC) FETCH APPROXIMATE FIRST 5 ROWS ONLY;

Slide 18

Slide 18 text

◼ ベクトル演算子より類似性の高い同士の方が、ベクトル間の距離が短くなる。 Oracle AI Vector Searchの基本もうちょっとだけ、深堀り① VECTOR_DISTANCE(猫, 魚) < VECTOR_DISTANCE(猫, 数学)

Slide 19

Slide 19 text

◼ テーブル結合ベクトルストアのみでは業務データとの結合は実現できない。私たちが知っている多様なSQLが使える。もちろんPL/SQLも！トランザクションも！インデックスによる高速化も！ Oracle AI Vector Searchの基本もうちょっとだけ、深堀り② SELECT id,name FROM employee e, project_assign ps WHERE e.id = ps.employee_id ORDER BY VECTOR_DISTANCE(e.skill_vector, :QUERY_VEC) FETCH APPROXIMATE FIRST 5 ROWS ONLY;

Slide 20

Slide 20 text

Oracle AI Vector Searchの基本もうちょっとだけ、深堀り③ 関数説明 UTL_TO_TEXT テキストをチャンクに分割する関数。文書を扱いやすい小さな単位に分割するのに役立つ。 UTL_TO_CHUNKS 大きなテキストドキュメントを小さなチャンク（断片）に分割する。 UTL_TO_EMBED テキストをベクトル埋め込みに変換する関数。単一のテキストから埋め込みベクトルを生成できる。 LOAD_ONNX_MODEL ONNXモデルをデータベースにロードする関数。外部で学習したモデルをDBに取り込める UTL_TO_SUMMARY テキストから短い要約を生成します。その他もりだくさん https://docs.oracle.com/en/database/oracle/oracle-database/23/vecse/oracle-ai-vector-search-users-guide.pdf

Slide 21

Slide 21 text

Oracle AI Vector Searchの基本 OracleDeveloperDay2024 https://www.youtube.com/watch?v=5ONkZ8Zgwu0

Slide 22

Slide 22 text

生成AI+RAGアプリケーションを作るタレントマネジメントシステム構想

Slide 23

Slide 23 text

◼ 設計・開発の課題 • スキルの設計方式（マスタ化？add column？）がいつも悩む。 • 案件紹介時点では、そもそもスキルが明確にならない。 • 密接な関係にあるはずの社内評価システムとの連携ができない。 →物理的な問題ではなく、連携できる項目がない。目標？結果？ ◼ 運用の課題 • 個人別スキルを、誰が・どう・いつ・メンテナンスするのか？ • スキル名って名寄せが必要。 • プロジェクトはスキルだけでは成り立たない。その人の人となり。人と人との関係性も正否を分ける。これらの情報は誰かが知っている。私のタレントマネジメントシステム構想本来必要なはずのタレントマネジメントシステムが、嫌われる理由を考えてみた。

Slide 24

Slide 24 text

タレントマネジメントシステムの構想タレントマネジメントシステムは、自然言語で検索できるべき。 600人の社員生成AIを使って携帯ショップの窓口をサポートし、最適な料金プランを提案するシステムの構築を要求されている。理由はわかんないけど、Aベンダーからの引継ぎなので、我々には計画性が問われているかと。アーキテクチャ・設計センスも必要、あとはお客様をリードできれば・・・ Lv3を2人、Lv4が1人かな。期間は9月から空いている人で。 “ ” スコア案件紹介技術管理業務要求スキル抽出 Aさん Bさん Cさん Dさんスコア算出

Slide 25

Slide 25 text

タレントマネジメントシステムのデータ構造ベクターカラムを追加するだけ！社員関係性 ◆ 社員ID ◆ 社員ID 関係性 Vector_関係性社員 ◆ 社員ID 氏名性別ジョブランクスキル_IT スキル_マネジメントスキル_ビジネスストレングス vector_スキル_IT Vector_マネジメント Vector_ビジネス Vector_ストレングスプロジェクト ◆ プロジェクトID プロジェクト名業界/業務利用技術どのくらい燃えたか vector_業界/業務 vector_利用技術 Vector_どのくらい燃えたかプロジェクトメンバ ◆ プロジェクトID ◆ 社員ID 役割計画工数実績工数経験値、実績 vector_経験値、実績いままでは「関係性」「スキル」「利用技術」等のデータを検索しやすいように、事前に人間が定義した項目別に前処理する必要があった。→ それ、自然言語のままでいけます！プロジェクト評価目標設定/評価 vector_目標設定/評価

Slide 26

Slide 26 text

技術、管理、業務の単位別に類似度を算出しアンサンブルするタレントマネジメントシステムのクエリ SQL拡張をおぼえるだけ SELECT id, name, ( VECTOR_DISTANCE(skill_it, :required_skill_it) + VECTOR_DISTANCE(skill_mng, :required_skill_mng) + VECTOR_DISTANCE(skill_biz, :required_skill_biz) / 3 ) as score FROM employee ORDER BY score FETCH APPROXIMATE FIRST 5 ROWS ONLY;

Slide 27

Slide 27 text

普通のWEBアプリと同じ構成じゃん！！おお、これなら１日で作れそう。依頼文候補メンバー INSERTと同時に Embedding Webアプリアサイン担当 OCI Computing Instance Oracle 23c with Vector Search LLM Embedding Embed v3 “embed-multilingual-v3.0” ＋社員データ Query 類似度

Slide 28

Slide 28 text

できたぞ、近未来のタレントマネジメントシステム

Slide 29

Slide 29 text

成功したチームをお手本に、成功率の高いチームを作る。ここもベクトル検索を使える。タレントマネジメントシステムの次の構想組織としては、成功率の高いプロジェクト体制のスケールアウトが大事。クラスタからピックアップ成功したチーム体制成功するかもしれないチーム体制

Slide 30

Slide 30 text

◼ SQLが書ける人は、「今すぐ」「簡単に」RAGを検証できる ◼ オンプレ環境にもRAGが導入できる ◼ 特別なソフトウェアの導入が不要（Oracleだけあればいい） ◼ ベクトルのバージョン管理ができる ◼ Oracleの管理ノウハウがそのまま活かせる（学習コストが低い） ◼ 闇雲にチューニング沼には入らない ➢ ブラックボックスの組み合わせ RAG沼は危険 Oracle AI VectorSearchについて Oracle AI Vector Search を使った感触 OracleDeveloperDay2024 https://www.youtube.com/watch?v=5ONkZ8Zgwu0

Slide 31

Slide 31 text

1. 構築が１、検証が９であること。 • 事前検証にかける時間の割合を間違えてはいけない。構築は検証が終わった後に実施する。 2. OracleDatabase(23c以降)は、生成AI＋RAGに向いている。 • 既にそこにあるOracleDatabaseであれば、alter table add columnするだけ。構築不要。 • そこには、すでに検証するためのエンプラデータ（社内情報、社内データ）がある。使える。 3. 生成AI＋RAGの適用範囲として、いままで実現が難しかったエリアを再考しよう！ • その一つとして、タレントマネジメントシステムの可能性について触れた。 • データ項目設計が難解であった部位が使えるデータに代わる。システム構成のゲームチェンジャーである。 4. 私は予測する！ • すべてのI/Fは自然言語に置き代わる時がある。そう、APIもSDKもすべて。 • ローカル言語（英語、日本語、ドイツ語、中国語・・・）は単なるビューでしかない時がくる。 • その時に向けて、今、準備を始める必要があります。さあ、一緒に取り組みましょう！まとめ

Slide 32

Slide 32 text

ウルシステムズサービス紹介 PoCだけでは終わりにさせない。生成AIビジネスユースケース実践適用を推進！生成AI導入コンサルティング精度向上施策の適用コンサルティング運用サポートと技術支援コンサルティング • 現状分析：現業務フローおよびシステム構成の分析。 • 生成AIに関するユースケース、トレンドおよび技術情報の提供：業界別ユースケース（製造業、金融業、医療業界など）、特定のビジネスシナリオでのAI活用事例を提供。 • ソリューション提案：貴社のビジネスニーズに合った具体的なソリューションを提案。 • 要件整理、効果測定：後続の要件定義のための準備。 • 計画策定：グラインドデザイン策定、段階的な導入計画の策定と実行スケジュールの明確化 • New!! Dify導入コンサルティングサービス • トランスファーラーニング：基礎モデルを微調整し、特定のタスクやドメインに対する精度を向上施策。 • プロンプトエンジニアリング: プロンプトを再設計することで、生成AIモデルの出力精度の向上施策。 • フィードバックループ: ユーザーからのフィードバックに対する検討・検証・施策実行。 • ユーザー教育：モデルの利用方法、設定、カスタマイズについてのテクニカルトランスファーセッションの開催。 • 技術サポート：モデル運用中のトラブルシューティングと技術支援を24/7で提供およびドキュメント作成支援。 • メンテナンスとアップデート：定期的なモデルの調整と最適化、及び各クラウドサービスのアップデート対応。