Oracle AI Vector Search 新機能アップデート

Slide 1

Slide 1 text

Oracle AI Vector Search 新機能アップデート日本オラクル株式会社クラウド・エンジニアリング統括 COE本部山田恭平 2024年12月04日

Slide 2

Slide 2 text

AI Vector Search User’s Guide What’s New for Oracle AI Vector Search - July 2024, Release Update 23.5 • Binary Vectors • LangChain Integration • Optimizer Plans for Vector Indexes（ドキュメントの拡充） • Documentation Map to GenAI Prompts（ドキュメントの拡充） July 2024, Release Update 23.5 Copyright © 2024, Oracle and/or its affiliates 2

Slide 3

Slide 3 text

VECTORデータ型データの形式を厳密に定義したい場合、次元数や数値データの形式は制約的に働くため次元や数値の形式を指定することにメリットがある次元数など指定せずにVECTORとして指定も可スキーマ定義やDDLの普遍性を重視する場合、こちらは次元数の指定がないため、次元数が変化した場合にもスキーマ定義の変更は不要ベクトル・データ型 CREATE TABLE my_images ( id number, image BLOB, img_vec VECTOR(768, FLOAT32)); 次元数 (任意) 数値の形式 (任意) CREATE TABLE my_images ( id number, image BLOB, img_vec VECTOR); 指定可能な数値形式 FLOAT32, FLOAT64, INT8, BINARY ※例えば、embedding APIのバージョンアップで次元数が変更された場合でも、スキーマ定義書の更新が不要になる →運用上の選択肢が１つ増える Copyright © 2024, Oracle and/or its affiliates 3

Slide 4

Slide 4 text

• ベクトルデータ型を定義する際にBINARY数値形式を指定可能 • パフォーマンスの向上やストレージ使用量を減らすことと引き換えに精度を多少犠牲にする数値形式 • メリット（FLOAT32とBINARYとを比較した場合） • 距離計算が40倍高速に可能 • ストレージの使用量を32分の1に削減 • デメリット（FLOAT32とBINARYとを比較した場合） • 精度が低くなる可能性があり、参考値としてFLOAT32に比べて90%程度の精度となる • BINARYは次元値が0より大きければ1、次元値が0以下の場合0となり、この0,1の配列をバイト表現に変換したものを1 次元値のデータとして格納することになる • INT8の場合 [25, 11, -99, -114, 13, -17, -59, 44]と表現される • BINARYの場合 [1, 1, 0, 0, 1, 0, 0, 1]と表現されるこの11001001をバイト表現すると201となり、BINARYとして格納されるのは[201, ~~~~~]となるこの数値の丸め込みが計算の高速化とストレージ使用料の削減に寄与するバイナリ・ベクトル Copyright © 2024, Oracle and/or its affiliates 4

Slide 5

Slide 5 text

• LangchainやはLLMを活用したアプリケーション開発を支援するオープンソースのフレームワーク • LangchainにOracle Database用のコードが追加 • 埋め込み機能、ベクトルデータストアとしての活用インデックスの作成と検索、RAGパイプライン統合などOracle Databaseを活用するためのコード群が充実 • Oracle Databaseのベクトル検索機能をシンプルに実装可能 Langchainとの統合 Copyright © 2024, Oracle and/or its affiliates 5

Slide 6

Slide 6 text

AI Vector Search User’s Guide What’s New for Oracle AI Vector Search - October 2024, Release Update 23.6 • Hybrid Search using Hybrid Vector Indexes • Updated AI Vector Search Workflow（ドキュメントの拡充） • Updated Documentation Map to GenAI Prompts（ドキュメントの拡充） • Extended SQL Quick Start（ドキュメントの拡充） • Support for Ollama • Support for SPARSE Vectors • Integration with LlamaIndex • Jaccard Distance • Hamming Distance • Transaction Support for HNSW Indexes • HNSW Index Duplication and Reload October 2024, Release Update 23.6 (1/2) Copyright © 2024, Oracle and/or its affiliates 6

Slide 7

Slide 7 text

AI Vector Search User’s Guide What’s New for Oracle AI Vector Search - October 2024, Release Update 23.6 • Update to the default for VECTOR_INDEX_NEIGHBOR_GRAPH_RELOAD • Global and Local Partitioning for IVF Indexes • GET_INDEX_STATUS, ENABLE_CHECKPOINT, DISABLE_CHECKPOINT, and INDEX_VECTOR_MEMORY_ADVISOR Procedures • VECSYS.VECTOR$INDEX$CHECKPOINTS View • Relational Data Vectorization • Document Reranking • BLOB Support for UTL_TO_GENERATE_TEXT() • BLOB Support for UTL_TO_EMBEDDING() • List of REST Endpoints October 2024, Release Update 23.6 (2/2) Copyright © 2024, Oracle and/or its affiliates 7

Slide 8

Slide 8 text

• ベクトルとキーワードを組み合わせて検索する、ハイブリッド検索のために作成する索引 • Oracle Databaseのベクトル索引とテキスト索引の組み合わせにより実現 • キーワードベースのテキスト検索とベクトルベースの類似性検索を統合することで、より精度の高い検索が可能にハイブリッド・ベクトル索引 Vectorizer Tokenizer abc データストアファイルフィルタベクトル索引テキスト索引 Copyright © 2024, Oracle and/or its affiliates 8

Slide 9

Slide 9 text

作成方法基本的な索引作成構文ハイブリッド・ベクトル索引 CREATE HYBRID VECTOR INDEX MY_HYBRID_INDEX ON SUPPORT_INCIDENTS (INCIDENT_TEXT) PARAMETERS (...); "embed_model" :"ALL_MINILM_L12_V2" "chunk_by" : "WORDS" "index_type" : "HNSW" "vector_distance": "COSINE" "vector_accuracy": "95" "datastore" :"network_datastore" "filter" : "auto_filter" "lexer" : "auto_lexer" "sectioner" : "basic_sectioner" "stoplist" : "default_stop_list" ベクトル索引パラメータテキスト索引パラメータ Copyright © 2024, Oracle and/or its affiliates 9

Slide 10

Slide 10 text

検索方法 • DBMS_HYBRID_VECTOR.SEARCHを使用 • ハイブリッド・ベクトル索引の名前、結果の融合方法、スコアリング方法などを指定して検索ハイブリッド検索 SELECT DBMS_HYBRID_VECTOR.SEARCH( JSON('{"hybrid_index_name": "MY_HYBRID_IDX", "search_text" : "ORA-600, Incomplete Recovery", "search_fusion" : "INTERSECT", "search_scorer" : "RRF" }')) FROM DUAL; Copyright © 2024, Oracle and/or its affiliates 10

Slide 11

Slide 11 text

検索結果検索結果には結果のテキストだけではなく、スコアなども表示されるハイブリッド検索 { "rowid" : "AK37pKAAkAAAACVAAA", "score" : 96.95, "vector_score" : 94.50, "text_score" : 92.40, "vector_rank" : 1, "text_rank" : 1, "chunk_text" : "ABCD_ATP1(133):Incomplete Recovery applied until change 41787149790615 time 08/20/2024 15:03:53. ORA-00600: internal error code, arguments: [kdsgrp_LOST_piece], [11], [830411452], [0], []", ... } Copyright © 2024, Oracle and/or its affiliates 11

Slide 12

Slide 12 text

制限と注意事項 • 索引作成時に指定する埋め込みモデルはデータベース内のONNXモデルのみ（インポート可能なONNXモデルには1GB以内のサイズ制限あり） • DBMS_HYBRID_VECTOR.SEARCHの使用について • ベクトル検索とテキスト検索に使用するクエリテキストをそれぞれ指定可能 • テキスト検索に設定するクエリは、形態素解析は行われず、CONTAINS句を使いながら手動で設定が必要 • ハイブリッド・ベクトル索引のメンテナンスについて • DMLが頻繁に発行されるようなテーブルの場合は、定期的に索引のメンテナンスが必要 • 索引作成時にメンテナンスをAUTOで行うか、MANUALで行うかを指定可能 • AUTOを設定した場合、索引はバックグラウンドで自動的に同期される • メンテナンスについての詳細はドキュメントを参照 • その他の制限や注意事項については下記ドキュメントを参照 • AI Vector Search User‘s Guide - Guidelines and Restrictions for Hybrid Vector Indexes ハイブリッド・ベクトル索引 Copyright © 2024, Oracle and/or its affiliates 12

Slide 13

Slide 13 text

Copyright © 2024, Oracle and/or its affiliates 13 • ローカル環境でLLMを実行するための手段として、Oracle DatabaseでオープンソースソフトウェアのOllamaをサポート • Ollamaをインストールし、Ollamaコマンドを実行することでLLMをダウンロードしてローカル実行可能 • Oracle Databaseからは以下のDBMS_VECTORパッケージにてOllamaを指定することでそれぞれの処理をローカルに完結して実行可能 • UTL_TO_EMBEDDING • UTL_TO_SUMMARY • UTL_TO_GENERATE_TEXT • レイテンシの低減、セキュリティ向上、モデルのカスタマイズなどがメリット Ollamaのサポート

Slide 14

Slide 14 text

Copyright © 2024, Oracle and/or its affiliates 14 • ベクトル・データ型を定義する際にSPARSEベクトルが指定可能に • デフォルトではどのデータ型もDENSEベクトルで格納されるが、SPARSEベクトルの指定が可能になった • SPARSEベクトルはベクトル要素の大部分が0であり、0以外の少数の実数値のみが物理的に格納される • 情報量がDENSEベクトルに比べて削減されるため、要素に0の多いようなデータを格納する際に使用することでストレージ容量の削減、メモリ使用量の削減、距離計算コストの低下などのメリットが得られる SPARSE ベクトルのサポート CREATE TABLE my_images ( id number, image BLOB, img_vec VECTOR(768, FLOAT32, SPARSE));

Slide 15

Slide 15 text

• LlamaIndexはLLMを活用したアプリケーション開発を支援するオープンソースのフレームワーク • LlamaIndexにOracle Database用のコードが追加 • 埋め込み機能、ベクトルデータストアとしての活用インデックスの作成と検索、RAGパイプライン統合などOracle Databaseを活用するためのコード群が充実 • Oracle Databaseのベクトル検索機能をシンプルに実装可能 LlamaIndexとの統合 Copyright © 2024, Oracle and/or its affiliates 15

Slide 16

Slide 16 text

ベクトル同士の類似性は、ベクトル間の距離計算結果で判断される対象が似ているほど、ベクトル間の距離が短くなる。例えば：トラとライオンのベクトルはトラとリンゴのベクトルよりも距離が短い VECTOR_DISTANCE(, ) < VECTOR_DISTANCE(, ) VECTOR_DISTANCEで指定する距離メトリックはエンベッディングモデルで使用された距離メトリックと同一にする VECTOR_DISTANCE関数 Copyright © 2024, Oracle and/or its affiliates 16 VECTOR_DISTANCE(VECTOR1, VECTOR2, ) 距離メトリック省略形 COSINE(デフォルト) / COSINE_DISTANCE <=> DOT / INNER_PRODUCT <#> EUCLIDEAN / L2_DISTANCE <-> EUCLIDEAN_SQUARED / L2_SQUARED HAMMING / HAMMING_DISTANCE MANHATTAN / L1_DISTANCE JACCARD / JACCARD_DISTANCE VECTOR_DISTANCE(VECTOR1, VECTOR2, COSINE) COSINE_DISTANCE(VECTOR1, VECTOR2) VECTOR1 <=> VECTOR2 以下は全て同じ結果が得られる

Slide 17

Slide 17 text

HAMMING_DISTANCE関数の追加 • Oracle Database23.6にてHAMMING_DISTANCE関数が追加 • 23.6では二つの方法で距離計算が可能にハミング距離 Copyright © 2024, Oracle and/or its affiliates 17 VECTOR_DISTANCE(VECTOR1, VECTOR2, HAMMING) HAMMING_DISTANCE(VECTOR1, VECTOR2) ← New in 23.6

Slide 18

Slide 18 text

ジャッカード距離 Copyright © 2024, Oracle and/or its affiliates 18 ジャッカード距離は二つのベクトルがどれくらい異なっているかを表す。 0〜1の範囲に正規化され、1に近づくほど異なっていることを意味する。バイナリ・ベクトルにおいて、ベクトルAとBにおけるAND演算の結果を OR演算の結果で割ったものがジャッカード類似度となる。このジャッカード類似度は各ベクトルがどれくらい似ているかという類似度を示す。ジャッカード距離は二つのベクトルの非類似度を示すため 1 – ジャッカード類似度がジャッカード距離となる

Slide 19

Slide 19 text

• 近傍グラフ・ベクトル索引(HNSW) がトランザクションに対応し、クエリのレイテンシを一定に保つことが可能に • 近傍グラフ・ベクトル索引を作成するとトランザクション・ジャーナルにDMLの変更を記録する • アクティブなトランザクションの変更はイン・メモリ上のプライベート・ジャーナルへ • トランザクションコミット時にディスク上のシェアード・ジャーナルにフラッシュされる • クエリーが発行されるとHNSWグラフと共にジャーナルを参照し、トランザクションの一貫性を保つ近傍グラフ・ベクトル索引のトランザクション対応 Copyright © 2024, Oracle and/or its affiliates 19

Slide 20

Slide 20 text

ジャーナルの利用によるパフォーマンス懸念について • ジャーナルに変更が蓄積されるほど、 HNSW索引走査時のパフォーマンスは劣化する • そのため、DMLが一定の閾値まで発行されるとHNSW グラフは自動的に再作成され、クエリのレイテンシを抑える • 再作成中にも索引にアクセスできるよう、新たにメモリ領域を確保しながら再作成を行うそのため、再作成中はメモリを通常時の倍以上消費することになるため注意 • HNSW索引が作成、再作成されるたびにフルチェックポイントとROW IDとVIDとのマッピングテーブルがディスク上に作成され、索引の複製やリロードに利用される近傍グラフ・ベクトル索引のトランザクション対応 Copyright © 2024, Oracle and/or its affiliates 20

Slide 21

Slide 21 text

• 近傍グラフ・ベクトル索引において、再作成、インスタンスの再起動、RAC環境での索引作成のために索引の複製とリロード機能のどちらかが利用される • HNSW索引が作成、再作成されるたびにROW IDと VIDのマッピングテーブルと、メモリにあるグラフとほぼ同じ情報を持ったフルチェックポイントがディスク上に作成される • 複製、リロードは以下の情報を用いて行われる • マッピングテーブルからグラフを再作成する場合は複製 • フルチェックポイントからグラフを読み込む場合はリロード近傍グラフ・ベクトル索引の複製とリロード Copyright © 2024, Oracle and/or its affiliates 21

Slide 22

Slide 22 text

• RAC環境ではマッピングテーブルを元データとして各インスタンスがそれぞれ独自のグラフを複製する • マッピングテーブルからの再作成となるため、各インスタンス間でグラフが異なる可能性がある • 同じクエリでも、どのインスタンスに到達するかによって異なる結果が得られる可能性がある RAC環境における近傍グラフ・ベクトル索引の複製 Copyright © 2024, Oracle and/or its affiliates 22

Slide 23

Slide 23 text

• フルチェックポイントには、インスタンスのメモリ上にあるHNSWグラフとほぼ同じ情報が保持される • インスタンス再起動時やノード追加時にはフルチェックポイントからグラフをリロードすることで、マッピングテーブルからの再作成よりも高速にグラフをリロード可能 • フルチェックポイントからリロードされるかは以下の条件によって決まる • フルチェックポイントが存在する • VECTOR_INDEX_NEIGHBOR_GRAPH_RELOADパラメータがRESTART（デフォルト）に設定されている • フルチェックポイントが現在のSCNと比較して差が大きくない • リロードされない場合はマッピングテーブルからの複製を実行する • フルチェックポイントの作成は索引の作成、再作時に行われるが、無効/有効の切り替えが可能（デフォルト有効）インスタンス再起動時やノード追加時の近傍グラフ・ベクトル索引のリロード Copyright © 2024, Oracle and/or its affiliates 23 DBMS_VECTOR.DISABLE_CHECKPOINT( [, ]) DBMS_VECTOR.ENABLE_CHECKPOINT( [, ] [, ])

Slide 24

Slide 24 text

• DBMS_VECTOR.INDEX_VECTOR_MEMORY_ADVISORを利用してベクトル索引に必要なメモリサイズをシミュレート可能に • 既存テーブル列を指定しての実行や、ベクトル数とディメンション数を指定する形でも実行可能索引に必要なメモリサイズのシミュレート Copyright © 2024, Oracle and/or its affiliates 24 SQL> exec DBMS_VECTOR.INDEX_VECTOR_MEMORY_ADVISOR( 'VECTOR_USER’, 'VECTAB', 'DATA_VECTOR', 'HNSW', RESPONSE_JSON=>:response_json); Using default accuracy: 90% Suggested vector memory pool size: 76396251 Bytes

Slide 25

Slide 25 text

• Oracle Machine Learning (OML)の特徴抽出アルゴリズムとベクトル検索機能を組み合わせることができる • リレーショナル・データを特徴抽出モデルでベクトル化することで、類似検索が可能になる • ベクトル化することで、重要な情報を保持しながらもデータセットが簡略化される • 大規模なデータセットを対象にする場合でも、データの相関関係、冗長性の分析が容易になる特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 25

Slide 26

Slide 26 text

検索対象のリレーショナル・データ実行イメージ特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 26 COLUMN_NAME DATA_TYPE -------------------- -------------------- AGE NUMBER CAMPAIGN NUMBER CONS_CONF_IDX NUMBER CONS_PRICE_IDX NUMBER DURATION NUMBER EMP_VAR_RATE NUMBER EURIBOR3M NUMBER ID NUMBER NR_EMPLOYED NUMBER PDAYS NUMBER PREVIOUS NUMBER CONTACT VARCHAR2 CREDIT_DEFAULT VARCHAR2 DAY_OF_WEEK VARCHAR2 EDUCATION VARCHAR2 HOUSING VARCHAR2 JOB VARCHAR2 LOAN VARCHAR2 MARITAL VARCHAR2 MONTH VARCHAR2 POUTCOME VARCHAR2 Y VARCHAR2 -- 対象となる表 BANKテーブル SELECT column_name, data_type FROM user_tab_columns WHERE table_name = 'BANK' ORDER BY data_type, column_name;

Slide 27

Slide 27 text

実行イメージ OMLモデル作成のために、設定テーブルを作成特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 27 CREATE TABLE mod_sett( setting_name VARCHAR2(30), setting_value VARCHAR2(30) ); -- テーブルに設定したいパラメータをINSERTする BEGIN INSERT INTO mod_sett (setting_name, setting_value) VALUES (dbms_data_mining.algo_name, dbms_data_mining.algo_singular_value_decomp); -- 特徴抽出アルゴリズムalgo_singular_value_decompを指定 INSERT INTO mod_sett (setting_name, setting_value) VALUES (dbms_data_mining.prep_auto, dbms_data_mining.prep_auto_on); -- データ準備の自動化をオンオンにするとモデルはヒューリスティックを使用してビルドデータを変換する INSERT INTO mod_sett (setting_name, setting_value) VALUES (dbms_data_mining.svds_scoring_mode, dbms_data_mining.svds_scoring_pca);-- ビルドデータのスコアリングモードをPCAに設定投影がU行列とS行列の積になる INSERT INTO mod_sett (setting_name, setting_value) VALUES (dbms_data_mining.feat_num_features, 5); -- 抽出される特徴の数を5に設定 commit; END; /

Slide 28

Slide 28 text

実行イメージ設定テーブルを指定して、bankテーブルに対する特徴抽出のモデルを作成する特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 28 BEGIN DBMS_DATA_MINING.CREATE_MODEL( model_name => 'pcamod‘, -- モデルの名前 mining_function => dbms_data_mining.feature_extraction, -- マイニング機能の設定ここでは特徴抽出モデルを指定 data_table_name => ‘bank‘, -- 対象テーブルの指定 case_id_column_name => ‘id’, -- キーとなる列 settings_table_name => 'mod_sett'); -- 設定テーブルの名前 END; /

Slide 29

Slide 29 text

実行イメージ作成したモデルpcamodを使用して、bankテーブルのID＝10000をベクトル化特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 29 SELECT id, vector_embedding(pcamod USING *) embedding FROM bank WHERE id=10000; ID EMBEDDING -------------- -------------------------------------------------- 10000 [-2.3551013972411354E+002,2.8160084506788273E+001, 5.2821278275005774E+001,-1.8960922352439308E-002, -2.5441143639048378E+000]

Slide 30

Slide 30 text

実行イメージ作成したモデルpcamodを使用して、bankテーブルのベクトルデータをテーブルへ IVFのベクトル索引を作成特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 30 CREATE TABLE pca_output AS (SELECT id, vector_embedding(pcamod USING *) embedding FROM bank); CREATE VECTOR INDEX my_ivf_idx ON pca_output(embedding) ORGANIZATION NEIGHBOR PARTITIONS DISTANCE COSINE WITH TARGET ACCURACY 95;

Slide 31

Slide 31 text

実行イメージ feature_details関数で作成したモデルを指定して、ID=10000の特徴量が大きい列を確認できる特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 31 SELECT feature_details(pcamod, 5 USING *) features FROM bank WHERE id=10000; FEATURES -----------------------------------------------------------------------------------------------

Slide 32

Slide 32 text

実行イメージ bankテーブルの中からID=10000と似ているレコードをベクトル検索特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 32 SELECT p.id id, b.PDAYS PDAYS, b.EURIBOR3M EURIBOR3M, b.CONTACT CONTACT, b.EMP_VAR_RATE EMP_VAR_RATE, b.DAY_OF_WEEK DAY_OF_WEEK FROM pca_output p, bank b WHERE p.id <> 10000 AND p.id=b.id ORDER BY VECTOR_DISTANCE(embedding, (select embedding from pca_output where id=10000), COSINE) FETCH APPROXIMATE FIRST 3 ROWS ONLY; ID PDAYS EURIBOR3M CONTACT EMP_VAR_RATE DAY_OF_WEEK ---------- ---------- ---------- --------- ------------ ----------- 9416 999 4.967 telephone 1.4 fri 13485 999 4.963 telephone 1.4 thu 9800 999 4.959 telephone 1.4 wed

Slide 33

Slide 33 text

実行イメージベクトル検索の結果が特徴量の大きなレコードを取得できていたか確認するために、平均や標準偏差などを確認特徴抽出アルゴリズムによるリレーショナル・データのベクトル化と相関分析 Copyright © 2024, Oracle and/or its affiliates 33 SELECT avg(PDAYS) avg, stddev(PDAYS) std, min(PDAYS) min, max(PDAYS) max FROM bank; AVG STD MIN MAX ---------- ---------- ---------- ---------- 962.475454 186.910907 0 999

Slide 34

Slide 34 text

• DBMS_VECTOR_CHAIN.RERANKファンクションを利用してリランクモデルをコールし、ドキュメントのリランキングが可能 • ベクトル検索、ハイブリッド検索後にリランキングを活用することで精度が向上する可能性がある • 構文 • 出力例 DBMS_VECTOR_CHAIN.RERANK Copyright © 2024, Oracle and/or its affiliates 34 DBMS_VECTOR.RERANK( QUERY IN CLOB, DOCUMENTS IN JSON, PARAMS IN JSON default NULL ) return JSON; { "index" : "1", "score" : "0.99", "content" : "Jupiter boasts an impressive system of 95 known moons." }

Slide 35

Slide 35 text

実行イメージ • クエリとリランク対象のドキュメントを設定 DBMS_VECTOR_CHAIN.RERANK Copyright © 2024, Oracle and/or its affiliates 35 set echo on set serveroutput on var query clob; var initial_retrieval_docs clob; exec :query := 'What are some interesting characteristics of the Jovian satellites?'; begin :initial_retrieval_docs := ' { "documents": [ "Jupiter boasts an impressive system of 95 known moons, including the four largest Galilean satellites.", "Jupiter's immense mass, 318 times that of Earth, significantly influences the orbits of other bodies in the Solar System.", "Io, one of Jupiter's Galilean moons, is the most volcanically active body in our solar system.", "The gas giant completes one orbit around the Sun in just under 12 years, traveling at an average speed of 13 kilometers per second.", "Jupiter's composition is similar to that of the Sun, and it could have become a brown dwarf if its mass had been 80 times greater." ] }'; end; /

Slide 36

Slide 36 text

実行イメージ • dbms_vector_chain.rerankの引数にクエリ、ドキュメント、パラメータ(モデル指定)を指定して実行 DBMS_VECTOR_CHAIN.RERANK Copyright © 2024, Oracle and/or its affiliates 36 declare params clob; reranked_output json; begin params := '{ "provider": "cohere", "credential_name": "COHERE_CRED", "url": "https://api.cohere.com/v1/rerank", "model": "rerank-english-v3.0", “return_documents”: true, “top_n”: 3 }'; reranked_output := dbms_vector_chain.rerank(:query, json(:initial_retrieval_docs), json(params)); dbms_output.put_line(json_serialize(reranked_output)); end; /

Slide 37

Slide 37 text

実行結果 • 以下のような出力となる DBMS_VECTOR_CHAIN.RERANK Copyright © 2024, Oracle and/or its affiliates 37 [ { "index" : "0", "score" : "0.059319142", "content" : "Jupiter boasts an impressive system of 95 known moons, including the four largest Galilean satellites." }, { "index" : "2", "score" : "0.04352814", "content" : "Io, one of Jupiter's Galilean moons, is the most volcanically active body in our solar system." }, { "index" : "4", "score" : "0.04138472", "content" : "Jupiter's composition is similar to that of the Sun, and it could have become a brown dwarf if its mass had been 80 times greater." } ]

Slide 38

Slide 38 text

• UTL_TO_GENERATE_TEXTの入力値としてBLOBがサポート • マルチモーダルLLMを使用することで画像に関する情報をテキスト化することが可能 • ファンクションがサポートするエンドポイントは以下ドキュメントに記載 https://docs.oracle.com/en/database/oracle/oracle-database/23/vecse/supported-third-party-provider- operations-and-endpoints.html 対応するエンドポイントのマルチモーダルLLMを使用する BLOB Support for UTL_TO_GENERATE_TEXT() Copyright © 2024, Oracle and/or its affiliates 38 DBMS_VECTOR_CHAIN.UTL_TO_GENERATE_TEXT( TEXT_DATA IN CLOB, MEDIA_DATA IN BLOB, MEDIA_TYPE IN VARCHAR2 default 'image/jpeg', PARAMS IN JSON default NULL ) return CLOB;

Slide 39

Slide 39 text

• UTL_TO_EMBEDDING/UTL_TO_EMBEDDINGSの入力値としてBLOBがサポート • マルチモーダル埋め込みモデルを使用することで、マルチモーダルでのベクトル検索が可能に • ファンクションがサポートするエンドポイントは以下ドキュメントに記載 https://docs.oracle.com/en/database/oracle/oracle-database/23/vecse/supported-third-party-provider- operations-and-endpoints.html 対応するエンドポイントのマルチモーダル埋め込みモデルを使用する BLOB Support for UTL_TO_EMBEDDING() Copyright © 2024, Oracle and/or its affiliates 39 DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING ( DATA IN BLOB, MODALITY IN VARCHAR2, PARAMS IN JSON default NULL ) return VECTOR;

Slide 40

Slide 40 text

• AI Vector Search User‘s Guide - Supported Third- Party Provider Operations and Endpointsにて確認可能 • https://docs.oracle.com/en/database/oracle/oracle -database/23/vecse/supported-third-party- provider-operations-and-endpoints.html 対応する3rdパーティ製品やエンドポイントについて Copyright © 2024, Oracle and/or its affiliates 40