Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【Oracle Cloud ウェビナー】Oracle DatabaseがAIに進化!マルチモー...

【Oracle Cloud ウェビナー】Oracle DatabaseがAIに進化!マルチモーダルと生成AI RAGに対応した最先端のデータ基盤テクノロジーを解説

Oracle Cloud ウェビナーシリーズ情報: https://oracle.com/goto/ocws-jp
セッション動画: https://go.oracle.com/ocws-jp-ondemand

oracle4engineer

May 30, 2024
Tweet

More Decks by oracle4engineer

Other Decks in Technology

Transcript

  1. 本日の内容 Oracle DatabaseがAIに進化! マルチモーダルと生成AI RAGに対応した最先端のデータ基盤テクノロジーを解説 Copyright © 2024, Oracle and/or

    its affiliates 2 1. 生成AIが普及。課題は “拡張” 生成AIはあらゆる業務で活用が検討~利用に至っている。 課題として、大規模言語モデルLLMにない情報への対応が挙げられる。 RAGと呼ばれる、データベースなどから情報を追加”拡張” することで、より正し い、企業内部情報も含めた対応がはじまっている。 2. データベースでの対応。類似検索が “拡張” をサポート ベクトル検索が注目。マルチモーダルな情報(ドキュメントや画像、音声など)を 数値列で抽象化して検索できる仕組みにより、「問い」に関連する情報を類 似している順に返すことが可能になった。 Oracle Databaseの場合は、既存の情報をそのまま活かして簡単に実装がで きるうえ、既存の投資を活かすことができることが利点となる。 3. 企業内情報の集約や、フロントアプリケーションの開発も視野に (ご提案) 企業内の各システムデータとの連携や、フロントアプリケーションのプロトタイピン グが、簡単に、素早くできることが社内利用を広めるカギになります。 加えて、SQLの生成を支援する「Select AI」のご利用も可能な Autonomous Databaseのご利用をご検討いただければ幸いです。
  2. Copyright © 2024, Oracle and/or its affiliates 3 本日のAgenda 1.

    新たなAI活用シーンと課題 2. Oracle Database 23ai発表! 実利用に向けたアプローチ Oracle DatabaseがAIに進化! マルチモーダルと生成AI RAGに対応した 最先端のデータ基盤テクノロジーを解説
  3. 生成AI市場 生成AIの利用ニーズは急速に拡大、市場は2030年に現在の 15 倍となる 1.8 兆円に アプリケーションでの組込みや専門分野向けの生成 AI 活用ニーズが拡大 Copyright

    © 2024, Oracle and/or its affiliates 4 JEITA 生成AI市場の世界需要額見通しプレスリリース https://www.jeita.or.jp/japanese/topics/2023/1221-2.pdf を基に弊社加工 0 5000 10000 15000 20000 2023年 2025年 2030年 生成AI関連ソリューションサービス 生成AI関連アプリケーション 生成AI基盤モデル 507 439 320 253 184 180 98 51 78 0 200 400 製造 金融 通信・放送 流通 医療・介護 社会インフラ 公共 教育 その他産業 生成AI市場の需要額見通し(日本) (単位: 億円) 利活用分野別 需要額見通し(世界) (単位: 億ドル) 年率 約50%成長 1200億円 1.8兆円
  4. ナレッジとLLM 利用シーン アンケートや顧客 対応ログから需要 を要約 商品説明、利用 ガイドを生成 広告の生成 他社商品状況の 要約

    さまざまな局面で文章生成の提案・本格的な実証実験や、本番採用が始まっている Copyright © 2024, Oracle and/or its affiliates 5 企画・開発 営業対応 契約 財務 人事 IT 商品説明を顧客 状況に沿って生成 商品問合せの回 答案を生成 顧客・販売店から の問合せと回答の 要約 提案アプローチを 成功ケースから要 約 提案構成の類似 構成を確認~事 前準備や留意点 の確認 関連する契約条 項の確認(重複/ 相違) 見積もり/構成の 社内FAQ確認 決算資料案の生 成 各種開示資料案 の生成 人材募集要項の 生成 AI面接 スタッフのプロファイ ル(志向、経験)と 部門の要項のマッ チング 社内業務改善メ モの要約・気づき 発信により労務費 削減 スタッフのプロファイ ル(志向、経験)と プロジェクトの要項 のマッチング プロジェクト計画 案の生成 アプリコードの生成
  5. 「AI」と「生成AI」 : 比較イメージ 主な目的 - 予測、例外検出、お勧め 主な用途 - 需要予測と在庫最適化 -

    ECのリコメンド - クーポン発行による送客と売上最大化 - 営業生産性改善 (次に買いそうな見込客) - 辞めそうな学生・社員の見込みと対応 - 不良品検知~歩留まり改善 アプローチ - 教師データ(ケースと回答)を使いモデル化 生成AIにより、これまでコンピュータが対応してこなかった、 文章や映像の生成が可能になった。 Copyright © 2024, Oracle and/or its affiliates 6 A I 生 成 A I 主な目的 - 文章や画像の生成 主な用途 ‐ コールセンター お客様質問対応 ‐ 適当な文章の作成 (メール、イベントタイトルなど) - 資料のまとめ (会議議事録、報告書など) - プレゼンテーションの作成 - イメージ画像の作成 - アプリケーション・コードの作成 アプローチ - 膨大な一般情報(インターネット上等)を使いモデル化
  6. ◼ 生成AIでは、一つのAIモデルで表データ、文書、画 像など様々なデータを扱える(マルチモーダル)。 ◼ そのため、データベースにも様々な種類のデータを扱 え、高い性能/精度で検索できることが求められる。 求められる機能 • 文書、画像などの様々な非構造化データの格納 •

    非構造化データを検索するためのベクトル検索 • 大量データに対する高速なベクトル処理 • 負荷の高いベクトル検索を同時多数で行うための、 スケーラビリティ • AI関連ツールへの対応、AIアプリケーションからのアクセ スのしやすさ 生成AIによって変わるデータベースの役割 – マルチモーダル / ベクトル検索 Copyright © 2024, Oracle and/or its affiliates 9 生成AI データベース • 表データ • グラフ • 文書 • JSON • 画像 • 動画 • 音声 {JSON} 通常の検索 + ベクトル検索 マルチモーダル(様々なデータ型)
  7. RAGに関連するOracleの生成AIサービス Copyright © 2024, Oracle and/or its affiliates 10 OCI

    Generative AI Agent (生成AI、データベース・アクセスなど RAG含め全体をコーディネイト) OCI Generative AI Oracle Database 23ai {JSON} 問い合わせ • API • コンソール • OCI Generative AI: 生成AIのフルマネージド・サービス。CohereおよびMetaのモデルをAPIから使用可能。 • OCI Generative AI Agent: 生成AIおよびデータベースと連携して、RAG処理全体を実行。ユーザーからはAPIまたは コンソール経由でアクセス可能。 Beta提供中
  8. Oracle AI Copyright © 2024, Oracle and/or its affiliates 11

    データ プラットフォーム アプリケーション データ Fusion Applications NetSuite Industry Applications 3rd Party Applications Embedded Generative and Classic AI OCI Data Science ML in Oracle database AI インフラストラクチャー Compute bare metal instances and VMs with NVIDIA GPUs OCI Supercluster with RDMA networking Block, object, and file storage; HPC filesystems AI サービス Generative AI Digital Assistant Speech Language Vision Document Understanding AI Agents OCI Data Labeling MySQL Heatwave AutoML Fusion Analytics Oracle Database Vector Search and Select AI MySQL HeatWave Vector Store and GenAI データを中心に、インフラからビジネス・アプリケーションまで包括的にAIを提供
  9. Copyright © 2024, Oracle and/or its affiliates 12 Oracle DatabaseがAIに進化!

    マルチモーダルと生成AI RAGに対応した 最先端のデータ基盤テクノロジーを解説 本日のAgenda 1. 新たなAI活用シーンと課題 2. Oracle Database 23ai発表! 実利用に向けたアプローチ
  10. ビジョンの実現 すべてのデータ管理ニーズに対応する完全かつシンプルなプラットフォーム Copyright © 2024, Oracle and/or its affiliates 15

    統合型(コンバージド)データベース 完全: 最新のあらゆるデータ型、ワークロード、開発スタイルに対応 シンプル: 最新のアプリケーションのニーズをサポートするデータベースを 追加するのではなく、SQL文を追加するだけ Autonomous Database で稼働 強力: Exadata上で、統合データベースのすべてのメリットを享受 シンプル: 完全管理型のクラウド・サービス
  11. 1つの基盤で様々な要件に対応 ▪専用データベースを組み合わせて構築 アプリケーションの要件ごとにデータベースを選択 エンタープライズ規模のデータ活用ではデータの重複・一貫性が課題に Oracle Databaseはデータ基盤上であらゆる最新の要件・状況に対応 Copyright © 2024, Oracle

    and/or its affiliates 16 ▪統合型データベース データ基盤上であらゆる要件に対応 ドキュメント 空間 リレーショナル { JSON } テキスト グラフ レイクハウス データ ウェアハウス 機械学習 地理的に 分散 マイクロ・ サービス ブロック チェーン IoT
  12. Oracle Database 23ai 次世代の統合型(コンバージド)データベース 17 Copyright © 2024, Oracle and/or

    its affiliates 300を超える重要な新機能と数千の拡張 Oracleのフラグシップ・データベースの 最新長期サポート・リリース Oracle Database 23aiの主な焦点 • データ志向のAI • 新たなアプリ開発~運用を簡単に • 新たなミッション・クリティカルを支援 「AIベクトル検索」などの極めて画期的・ 革新的な機能がすべてのエディションで 追加費用無しに利用可能
  13. データ志向のAIをアーキテクチャ的にシンプルかつスケーラブルに 開発者中心のデータとトランザクション Copyright © 2024, Oracle and/or its affiliates 18

    すべてのAI機能は、 一貫性、スケーラビリティ、可用性、およびセキュリティに対応する磐石な基盤上で稼働 アルゴリズムAIモデルを 標準のSQLで簡単に構築・適用 ベクトル検索はビジネス・データ検索と 組み合せ可能 生成AIを拡張し細部まで対応 プライベートなビジネス・コンテンツも 企業全体に渡るベクトル検索を GoldenGateでデプロイ あらゆる規模のミッションクリティカル なAIをExadataがサポート あらゆるアプリケーションでのAI利用 をAIツールで簡単に (詳細はこちら)
  14. 新たなアプリケーション開発~運用を簡単に アーキテクチャ的にシンプルかつスケーラブルに 開発者中心のデータとトランザクション Copyright © 2024, Oracle and/or its affiliates

    19 JSONとリレーショナルの 統合 グラフとリレーショナルの 統合 JavaScript ストアド・プロシージャ データ目的 言語 ロックフリーの一貫した更新、 長時間実行トランザクション マイクロサービスの トランザクション管理 (詳細はこちら)
  15. 新たなミッション・クリティカルを支援 アーキテクチャ的にシンプルかつスケーラブルに 開発者中心のデータとトランザクション Copyright © 2024, Oracle and/or its affiliates

    20 グローバル規模の分散データベースの RAFTレプリケーション True Cache データベース内 SQLファイアウォール リアルタイムSQL計画管理 RAC、Exadata、Data Guard シンプルさとスケーラビリティ 優先順位 トランザクション (詳細はこちら)
  16. ベクトル検索に対応した最新版データベース Oracle Database 23ai All in Oneの統合型(コンバージド)データベース あらゆる規模・あらゆるデータに対応する最先端のデータ基盤テクノロジー Copyright ©

    2024, Oracle and/or its affiliates 21 AIベクトル検索機能をOracle Database 23aiでサポート 使いやすく、わかりやすい設計 • 新しいVECTORデータ型にベクトル埋込みを格納 • Create table docs (doc_id NUMBER, doc_vec VECTOR(768, FLOAT32));; • 新しいSQL構文および関数で、類似性検索を簡単に • Select id from docs order by vector_distance(doc_vec, :query_vec) fetch approximate first 10 rows only; • 新しい近似検索索引がパッケージ化・チューニングされ 高性能・高品質に • Create vector index doc_idx on docs(doc_vec) organization inmemory neighbor graph
  17. ベクトル・データとは 画像やドキュメントのビット列で「一致」を判定する代わりに、 特徴を数値列(ベクトル)で表現、類似性を判断 Copyright © 2024, Oracle and/or its affiliates

    22 AIでは、ベクトルは画像、ドキュメント、動画などの非構造化データを エンコードするために使用されています ベクトルは、ディメンションと呼ばれる数値の羅列 で、データの重要な特徴を捉えるために使用さ れます。 ベクトルは、ドキュメントの実際の単語や画像の ピクセルではなく、データのセマンティック・コンテン ツを表します ベクトル 33 42 16 21 50
  18. 類似している、とは? 画像やドキュメントの特徴を数値列で表現、”抽象化”し 類似性を判断 似た特徴を持つほど距離は近くなる Copyright © 2024, Oracle and/or its

    affiliates 23 33 42 16 21 50 EV用モーターの開発者として応募 山田 太郎 [email protected] • ABC大学大学院工学科博士課程 • 勤務15年 XYZ自動車 • 資格:自動車電気装置整備士、... • リファレンス: XYZ自動車 鈴木 花子 各ディメンション(数値)は、 履歴書の異なる特徴を 表します ※実際のAIモデルによって決定される特徴は、 ここに示すほど単純ではありません 目的 教育 経歴 スキル リファレンス 33 42 16 21 50 21 49 32 28 48 距離(ユークリッド距離) = 平方根((33-21)2+(42-49)2+(16-32)2+(21-28)2+…) ※ 距離の式はいくつかあります 2つの非構造化エンティティが 似ているほど、 ベクトル間の距離が小さくなる
  19. 人事検索のケース 数値列で抽象化することで、類似した画像やドキュメントをすぐ探し出すことが可能に ~ベクトル検索 Copyright © 2024, Oracle and/or its affiliates

    24 ソフトウェア エンジニアの求人で、 その職務内容と履歴書の関連性が高い 上位3人を探す AI/MLで開発者として応募 Jane Doe [email protected] • ABCカレッジでコンピュータサイエンスの 学士号取得 DEF大学でデータサイエンス修士号 • 勤務5年 XYZ.com • 言語: Python、Java、C++ Gitリポジトリのメンテナンス • リファレンス: John Smith、XYZ.com [求人] メンバー・テクニカル・スタッフ、AI/ML運用 コンピュータサイエンスの学士号または関連分野の学士号以上で、実務経験が4 年以上あり、PythonとJavaに堪能で、Githubリポジトリでの実務経験がある方 を求めています。最低2件の業界リファレンスが必要です。 33 42 16 21 50 31 51 19 20 49
  20. 「欲しい商品(説明)」から、商品の説明文を基に類似検索で探せるようにします! 例えば… 「パーティーで役立つグッズはないかしら…」 ベクトル検索 はじめかた Copyright © 2024, Oracle and/or

    its affiliates 25 1. 商品表にベクトル列を 追加します 2. 商品の説明文をベクトル 変換してベクトル列を更新 します 3. 「欲しい商品(説明)」に近い 商品を検索します。
  21. 「欲しい商品(説明)」から、商品の説明文を基に類似検索で探せるようにします! 1. 商品表にベクトル列を追加します ベクトル検索 はじめかた Copyright © 2024, Oracle and/or

    its affiliates 26 alter table PRODUCTS add (details_v vector (300, float64)) ; 新規に、別な表を作成してベクトルを保持するのでも構いません create table PRODUCT_PROFILES (prod_id varchar2(30) primary_key, details_v vector (300, float64)) ; ここで、300はベクトル次元数、float64は数値の型です
  22. 「欲しい商品(説明)」から、商品の説明文を基に類似検索で探せるようにします! 2. 商品の説明文をベクトル変換してベクトル列を更新します ベクトル検索 はじめかた Copyright © 2024, Oracle and/or

    its affiliates 27 update table PRODUCTS set details_v = vector_embedding(doc_model USING description as data) ; ここで、商品の説明文(description列) をベクトル変換して ベクトル列 details_v に格納 - vector_embedding は、ベクトル変換の関数 - doc_model は、事前に定義したベクトル変換用のモデル名 (注: アプリ側で変換したベクトルデータを、アプリから直接更新することも可能) 応用! ベクトル変換用のモデルは、[1]データベース内変換 [2]外部呼出しによる変換 のいずれにも対応 [1] データベース内変換の場合は、ONNX標準のモデルを定義 [2] 外部呼出しの場合は、呼び出し先API の credential と URLを定義 ドキュメントのほか、画像や音声に対応するモデルも活用可能
  23. 「欲しい商品(説明)」から、商品の説明文を基に類似検索で探せるようにします! 3. 「欲しい商品(説明)」に近い商品を検索します。 例えば… 「パーティーで役立つグッズはないかしら…」 ベクトル検索 はじめかた Copyright © 2024,

    Oracle and/or its affiliates 28 select prod_id, prod_name, description from PRODUCTS order by vector_distance(detail_v, vector_embedding(doc_model USING :input as data) ) FETCH FIRST 10 ROWS ONLY; ここで、問い入力 :input をベクトル化し、近いものから順に10件、 商品ID(prod_id)、商品名(prod_name)、説明(description) を取得 vector_distance は、2つのベクトル間の距離を返す関数で、 類似しているほど近く(小さく)なる 応用! ‐ リレーショナルとの統合メリットを活かす 絞込みも可能 – 例えば「金額500円以内で」は、 where price <= 500 を追加するだけ! 更に、少しの工夫で「在庫がある商品だけを提示する」ことも!
  24. チャンク化、ベクトル索引 精度の向上と、レスポンスの向上 例えば… 「パーティーで役立つグッズはないかしら…」 [応用] ベクトル検索 実用化のテクニック Copyright © 2024,

    Oracle and/or its affiliates 29 チャンク化 – 精度を上げる pdfやMS WordなどのファイルでもOK!! テキストを抽出する関数と、長文を センテンス単位など小さなまとまりに分ける関数を用意 それぞれ毎ベクトル化し類似検索することで、問いに近い文節を発見しやすくなる ベクトル索引 – 性能を上げる 予め索引を作成することで、全件検索よりも早く答えを返す仕組み
  25. ベクトル索引作成のSQL構文 [応用] ベクトル検索 実用化のテクニック レスポンスの向上 Copyright © 2024, Oracle and/or

    its affiliates 30 商品の説明文に対するベクトル列に、索引を追加します CREATE VECTOR INDEX product_idx ON product(details_v) ORGANIZATION [INMEMORY NEIGHBOR GRAPH | NEIGHBOR PARTITIONS] DISTANCE EUCLIDEAN | COSINE_SIMILARITY | HAMMING ... ▪索引のORGANIZATIONの選択は • 索引データがインメモリーに収まる場合は、INMEMORY NEIGHBOR GRAPHの使用がお薦め • それ以外の場合はNEIGHBOR PARTITIONSを使用 ▪DISTANCE関数句はオプション (デフォルトはユークリッド距離) ▪距離関数は、ベクトルの生成に使用される埋込みモデルに基づいて選択
  26. マルチレイヤーのインメモリー・グラフ索引 (ご参考)グラフ・ベクトル索引 Copyright © 2024, Oracle and/or its affiliates 32

    速度と正確性を考慮したインメモリー索引 「ベクトル用B+ツリー索引」 ▪構築 • グラフの最下位レイヤーにすべてのベクトルがある • 上位の層はベクトルの割合を減少 • ベクトルは類似性に基づいて接続 ▪検索 • 検索は最上位レイヤーから開始 - 最も近いベクトルが 見つかった場合、検索は下のレイヤーで続行 • 問合せベクトルに最も近い上位Kベクトルが見つかった 場合、検索は最下位レイヤーで完了 エントリ・ポイント レイヤー3 レイヤー2 レイヤー1 レイヤー0 問合せ ベクトル 最も近い 隣人を見つけ、 レイヤーを下に移動 最も近い 隣人を見つけ、 レイヤーを下に移動 最も近い 隣人を見つけ、 レイヤーを下に移動 貪欲法で最寄りの Kネイバーを検出
  27. (ご参考)ネイバー・パーティション・ベクトル索引- 検索 Copyright © 2024, Oracle and/or its affiliates 33

    X軸 Y軸 # 1 # 2 # 3 # 4 # 5 問合せベクトル 1. Oracle Machine Learning の K-means クラスタリング・アルゴリズムを使用して、ベクトル をパーティションにグループ化 (K = 5)。 2. 問合せベクトルから各パーティションの重心 までの距離を計算 3. 最も近い2つのパーティションを特定 4. 問合せベクトルからクラスタ#1および#3の すべてのポイントまでの距離を計算し、 最も近い上位5件(赤で表示)を検索 2次元データ・セット
  28. ベクトル問合せの利用 - approximate句 [応用] ベクトル検索 実用化のテクニック レスポンスの向上 Copyright © 2024,

    Oracle and/or its affiliates 34 行制限(FETCH)句の新しいAPPROXIMATEキーワードは、索引利用の類似度検索を示す select prod_id, prod_name, description from PRODUCTS order by vector_distance(detail_v, vector_embedding(doc_model USING :input as data) ) FETCH APPROXIMATE FIRST 10 ROWS ONLY; 「欲しい商品(説明)」に近い商品を検索します。 例えば… 「パーティーで役立つグッズはないかしら…」
  29. 実装のまとめ – データベース内で様々なベクトル処理が可能に Copyright © 2024, Oracle and/or its affiliates

    35 モデルをDBにアップロード テキスト化 チャンキング ベクトル化 ベクトル化 表 ベクトル 索引 特徴 • 高いデータの一貫性 ~構造データとベクトル (商品情報など) • データベース内のモデルにより 低遅延でベクトル化 • 外部にデータが出ないため、 高いセキュリティ • 1つのSQLで既存データとベクトル・ データを組み合わせて検索 • アプリケーションでベクトル処理を 実装するコストを削減 PDF、Word、 Powerpoint.... 反映 “説明文” ベクトル検索 利用の流れ
  30. 金融業 a社 - 社内ITのサポートリクエスト - 過去の対応ケースがあれば、 人手を介さず対応することで 労力を削減 - 社内向けFAQ対応

    - 商品・サービスの詳細につい て、ドキュメントを検索し回答 小売業 b社 [EC通販] • 商品お勧め • あらゆる情報をベクトル化 • 商品写真、商品説明、 レビュー、ユーザープロファイル など • マッチングにより嗜好に沿った 商品を提案 小売業 c社 [アパレル] • 商品お勧め • 同類の商品を探して提案 • 商品企画 • 新デザインをする • 口コミ、投稿写真から生成 さまざまなお客様で社内外向けアプリケーションをご検討 Copyright © 2024, Oracle and/or its affiliates 37
  31. Oracle Database 23ai 国内外のお客様によるさまざまなご評価*・ご活用も (ご参考/ご紹介) ▪EnterpriseZine セッションレポート 生成AIの企業活用 ソニーグループの生成AI活用が本格化──内製 「Enterprise

    LLM」とベクトルDBによる独自の 環境構築 「Oracle CloudWorld Tour Tokyo」:ソニーグループセッションレポート ソニーグループにおけるRAG精度向上のPoC検証のお取組みについてご発表頂いた 内容の記事となります 38 Copyright © 2024, Oracle and/or its affiliates Source: 「ソニーグループの生成AI活用が本格化──内製「Enterprise LLM」とベクトルDBによる独自の環境構築 | EnterpriseZine」 https://enterprisezine.jp/article/detail/19610 *) 先行リリース版による エンタープライズ規模の本格LLM/RAG活用 Oracle AIベクトル検索 コア・データベース機能とのシームレスな統合を実現、 エンタープライズ規模の比類ないパフォーマンス性能や信頼性、セキュリティに対応 Copyright © 2024, Oracle and/or its affiliates 44 RAC シャーディング パーティション化 パラレル実行 トランザクション 分析 Exadata セキュリティ
  32. 実現の選択肢として、クラウド上でのプロビジョニング、設定、バックアップ・リカバリ、 チューニングなど自律的運用を支援する Autonomous Databaseがおすすめ すべてのデータ管理ニーズに対応する完全かつシンプルなプラットフォーム Copyright © 2024, Oracle and/or

    its affiliates 39 統合型(コンバージド)データベース 完全: 最新のあらゆるデータ型、ワークロード、開発スタイルに対応 シンプル: 最新のアプリケーションのニーズをサポートするデータベースを 追加するのではなく、SQL文を追加するだけ Autonomous Database で稼働 強力: Exadata上で、統合データベースのすべてのメリットを享受 シンプル: 完全管理型のクラウド・サービス
  33. Oracle Autonomous Databaseのビジョン データ分析におけるプロセスを自動化・自律化を推進しより素早く、使いやすく Copyright © 2024, Oracle and/or its

    affiliates 40 Data Load Machine Learning Data Insights Low-Code AppDev Graph Analysis Spatial Analysis Business Modeling Transform データベース 運用・チューニングの自動化 データ連携の自動化 データ活用の自動化 容易なアプリケーション 開発
  34. 最新データ・プラットフォームの主な構成要素 41 セキュアな オブジェクト・ ストア・アクセス データ 仮想化 OCI データ カタログ

    Amazon Glue データ カタログ データレイク ファイル形式 データ統合 ソース データ 共有 100以上の組込み データ・ソース・コネクタ Oracle以外のデータ ベースへの直接接続 他のデータベース、データ分析ツール、 オープンソース・プラットフォームと共有 データレイク・ ファイル形式へのアクセス Copyright © 2024, Oracle and/or its affiliates
  35. 1枚のスライドでは掲載しきれないため、詳細はマニュアルを参照 ビルトインのデータ変換ツールが対応しているデータ・ソース 42 Autonomous Data Warehouse Autonomous Transaction Processing ATP

    Exadata Cloud Any on-premises Oracle DB 11.2.0.4+ Any GoldenGate on-premises OCI MySQL DB Service OCI Streaming Autonomous JSON DB OCI Object Storage ADW Stage-Merge w/Obj Store Any on-premises Oracle DB 11.2.0.4+ OCI GoldenGate Deployments OCI Object Storage Real-time Sources/Targets Real-time Targets Bulk Data Transforms Sources & Targets Copyright © 2024, Oracle and/or its affiliates
  36. LLMの力で利用者を支援 - 自然言語問合せ S e l e c t A

    I Movie Stream社 「2022年の合計売上金額が 一番高かった国はどこですか」 SQL を書いてください。 表は5つ、列は全部で70あります 43 Copyright © 2024, Oracle and/or its affiliates 顧客 映画 俳優 ジャンル 視聴歴
  37. LLMの力で利用者を支援 - 自然言語問合せ S e l e c t A

    I Movie Stream社 「2022年の合計売上金額が 一番高かった国はどこですか」 SQL を書いてください。 表は5つ、列は全部で70あります 44 Copyright © 2024, Oracle and/or its affiliates 顧客 映画 俳優 SQL> SELECT AI '2022年の合計売上金額が一番高かった国はどこですか'; COUNTRY TOTAL_SALES ------------------------------ ----------- United States 654045.11 SELECT COUNTRY, SUM(SALES) AS TOTAL_SALES FROM MOVIESTREAM.STREAMS JOIN MOVIESTREAM.V_CUSTOMER ON STREAMS.CUST_ID = V_CUSTOMER.CUST_ID WHERE EXTRACT(YEAR FROM DAY_ID) = 2022 GROUP BY COUNTRY ORDER BY TOTAL_SALES DESC FETCH FIRST 1 ROW ONLY; どこ 表情報 大規模 言語モデル プロンプト 生成 SQL LLM 開発者・分析担当者の工数削減!! ジャンル 視聴歴
  38. アプリケーション開発を簡素化する Copyright © 2024, Oracle and/or its affiliates 45 世界クラスの機能を持った、

    スケーラブルでセキュアなエンタープライズ・アプリケーションを、 20倍高速かつ100分の1のコード量で構築可能 Oracle APEXはクラウドとオンプレミスを含む、あらゆる場所に、 モバイル、Web、デスクトップ・アプリケーションの 開発およびデプロイするための最も生産的な方法を提供
  39. 47

  40. まとめ Oracle DatabaseがAIに進化! マルチモーダルと生成AI RAGに対応した最先端のデータ基盤テクノロジーを解説 Copyright © 2024, Oracle and/or

    its affiliates 48 1. 生成AIが普及。課題は “拡張” 生成AIはあらゆる業務で活用が検討~利用に至っている。 課題として、大規模言語モデルLLMにない情報への対応が挙げられる。 RAGと呼ばれる、データベースなどから情報を追加”拡張” することで、より正し い、企業内部情報も含めた対応がはじまっている。 2. データベースでの対応。類似検索が “拡張” をサポート ベクトル検索が注目。マルチモーダルな情報(ドキュメントや画像、音声など)を 数値列で抽象化して検索できる仕組みにより、「問い」に関連する情報を類 似している順に返すことが可能になった。 Oracle Databaseの場合は、既存の情報・セキュリティをそのまま活かし、簡 単に実装ができるうえ、既存の投資を活かすことができることが利点となる。 3. 企業内情報の集約や、フロントアプリケーションの開発も視野に (ご提案) 企業内の各システムデータとの連携や、フロントアプリケーションのプロトタイピン グが、簡単に、素早くできることが社内利用を広めるカギになる。 加えて、SQLの生成を支援する「Select AI」のご利用も可能な Autonomous Databaseをご利用いただくのが実現の最適解と考える。
  41. クラウドと開発者向けからリリース Oracle Database 23ai Copyright © 2024, Oracle and/or its

    affiliates 50 Oracle Database 23ai ・Exadata Database Service ・Base Database Service リレーショナルに加え、最新のマイ クロサービス、グラフ、ドキュメント 対応のアプリケーションの構築に向 けたOracle Cloud Infrastructure (OCI)で提供され るマネージドデータベース Always Free Autonomous Database 23ai Free 期間の制限なく無償で利用でき るOCIでのAutonomous Database。APEXなどのWeb ツールも付属し開発が容易に Oracle Database 23ai Free 無償で利用できる開発者向け Oracle Database 23ai。 開発がシンプルにできることを確認す るのに最適 Autonomous Database Free Container Image 23ai 無償で利用できるAutonomous Databaseのコンテナイメージ。 APEXなどのWebツールも付属し開 発が容易に
  42. 発表! Oracle Database 23ai 新機能セミナー(仮称) まもなく登録開始 Copyright © 2024, Oracle

    and/or its affiliates 51 新機能の特長、使い方やTipsを2日に渡り解説する 技術セッション! アプリケーション開発や分析をより簡単にする機能を実装し、 ビジネス要件の変化に誰もが迅速かつ柔軟に対応できるよう DXやデータ活用のお取り組みを強力に支援します。その支えと なる新機能の特長、使い方やTipsなどをお届けします。 最新情報をまとめてお伝えする機会は他にありません。ぜひ、 この機会にご参加ください。 [開催日] 2024年 6月 27日~28日 実施時間/アジェンダのご案内は 今しばらくお待ちください
  43. Q&A Copyright © 2024, Oracle and/or its affiliates 52 #

    質問 回答 1 おそれいります。御質問いたします。 個人情報保護法等の日本国法令もありますが、クラウドのサーバーが海外にある場合、個人情報の他国、第三国への送 信、保管等もありえると存じますが、日本国の個人情報保護法、不正競争防止法、経済安全保障法令等のコンプライア ンス上、どのような配慮が必要でしょうか?日本国の個人情報保護法、不正競争防止法、経済安全保障法令等のコン プライアンス上、配慮は不要なのでしょうか? 頂いたご質問につきましては「米国クラウド法: 質問および回答」(以下の公開情報)を御参考下さい。 また、具体的な案件に関する御相談内容につきましては、貴社担当の営業担当者に御相談頂けると幸いです。 https://blogs.oracle.com/oracle4engineer/post/ja-us-cloud-act-and-oracle-cloud 2 補足し、申し上げます。 なお、不正競争防止法、経済安全保障法令等のコンプライアンスについては、個人情報に限りません。 個人情報保護法等の日本国法令もありますが、クラウドのサーバーが海外にある場合、個人情報、営業秘密等の他国、 第三国への送信、保管等もありえると存じますが、日本国の個人情報保護法、不正競争防止法、経済安全保障法令 等のコンプライアンス上、どのような配慮が必要でしょうか?日本国の個人情報保護法、不正競争防止法、経済安全保 障法令等のコンプライアンス上、配慮は不要なのでしょうか? 頂いたご質問につきましては「米国クラウド法: 質問および回答」(以下の公開情報)を御参考下さい。 また、具体的な案件に関する御相談内容につきましては、貴社担当の営業担当者に御相談頂けると幸いです。 https://blogs.oracle.com/oracle4engineer/post/ja-us-cloud-act-and-oracle-cloud 3 以前、御社の担当にvector_distanceをorder byの条件ではなく、SELECTの結果として取得できないかを確認した際 に、できないと聞いた記憶があります。SELECTでは取得できないでしょうか? ライブ中継で回答済み 5 ▼質問1 "パーティーに役立つグッズ"で検索したときに、"クラッカー"がHITする仕組みがよくわかりませんでした。 P31を見ると、似たような単語の場合にはHITするということはわかったのですが、全く違う単語(パーティー、クラッカー)で HITする仕組みが知りたいです。 (ここでAIが使用されているということでしょうか。) ▼質問2 "パーティーに役立つグッズ"のベクトルデータが18であり、"クラッカー"のベクトルデータが15のため、 クラッカーがHITするイメージかとおもいます。 この時"大きな音が出るグッズ"についてもクラッカーと近しい要素のため、ベクトルデータが16とかになるイメージを持ちました。 このとき、"パーティーに役立つグッズ"と"大きな音が出るグッズ"に関係性は無いですが、 それぞれのベクトルデータが近くなってしまうように思いますが、イメージは合っていますでしょうか。 1つのアイテムに対してベクトルデータを複数持っているのでしょうか? 質問1について、 単語をベクトル化することによって、近い意味の単語が近い値のベクトルになります。そのため、ベク トルでキーワードに近いデータを検索すると、異なる単語でも、意味が近ければ検索が可能です。このベクトル化のと ころでAIが使用されます。 質問2について、検索にヒットする可能性はあります。ただし、より近い内容の文章があれば、そちらの方が先にヒット します。 実際のベクトル検索では文章をベクトル化することが多いため、文章全体での意味に近いデータがより検索されやす くなります。 6チャンク化の単位次第で検索結果のクォリティーがことなるものでしょうか?PDF全体やPDFのChapterやSectionなど。 はい。チャンク化によってより関連性の高い部分が検索されるため、より質問の意図に近い回答が可能になります。 7 2つのクラッカーの登録、1つは"パーティに役立つ"と説明があり、もう一つはその記述がない場合、"パーティに役立つもの" をAI検索した場合は両方ともヒットしますか? その場合は、パーティに役立つと記載があった方が、意味的に近いため、先に検索がヒットします。(よりDistance が小さい結果として得られます) 8 ベクトル変換の内部的な仕組みは公開される予定はありますでしょうか? (欲しい情報がHITしない、といった質問が増えることが想定されるため) ベクトル変換は使用するモデルによります。 モデルは公開されているモデルも使えるため、その場合は、仕様を確認することは可能です。