Slide 1

Slide 1 text

Vertex AIとBigQueryでつくる 簡単ベクトル検索&テキスト分析システム 2024年2⽉21⽇(⽔) クラスメソッド株式会社 鈴⽊ 那由太 1 クラスメソッド × G-gen LT 祭り︕

Slide 2

Slide 2 text

名前:鈴木 那由太(スズキ ナユタ) 所属:クラスメソッド株式会社 データアナリティクス事業本部 インテグレーション部 機械学習チーム 現在の業務: 機械学習用途のデータ分析基盤構築 機械学習システム構築 X:@nayuyu_ns ※今日の発表の詳しい内容はブログに記載しているので、 リンクをポストしておきました。 ひとこと:生まれて初めて渋谷に来ました。 2 自己紹介 Osaka

Slide 3

Slide 3 text

3 発表のポイント • Vertex AIとBigQueryを使うと、テーブルに格納されているテキストデータを簡単に⽣成AI (特にPaLM2)でエンべディング&分析できる。 Google Cloudでの⽣成AI利⽤を⼿軽にシステム化できる︕ ※プレビュー

Slide 4

Slide 4 text

4 こんなユースケースに使えるかも あるホテルでのお困りごと • スタッフ対応に関するアンケート結果が、 2022年に悪い時期があった。 • 2023年に⼊って改善施策を実施したが、効果を確認したい。 スプレッドシートで年⽉ごとの件数推移を確認。 2023年に⼊ってポジティブなレビューが 増えていることがわかる。 「スタッフの対応」というテキストと、BigQuery内の レビューの距離の計算例

Slide 5

Slide 5 text

5 BigQueryによる⽣成AI活⽤ • BigQueryのリモート接続およびリモートモデルにより、リージョン・モデルを指定してVertex AIの PaLM2 APIにリクエストを送信する。 • ML.GENERATE_TEXT関数でテキスト⽣成を⾏う。 • text_bisonモデルを利⽤ • ML.GENERATE_TEXT_EMBEDDING関数(プレビュー)で⽇本語向けの埋め込みベクトル⽣成できる。 • textembedding-gecko-multilingualモデルを利⽤ • ⼀般提供の機能を使う場合はリモート関数により、Cloud Functionsなどを間に挟むことを想定する。 • ベクトル間の距離はML.DISTANCE関数で計算できるので、近いテキストを検索できる。

Slide 6

Slide 6 text

6 Vertex AIパイプライン • kubeflowパイプラインを実⾏できるマネージドサービス。 • 定期実⾏およびノードの結果のキャッシュ機能もある。 • Google Cloud パイプライン コンポーネントを使ってBigQueryでSQLを実⾏する。 • Vertex AIメタデータより、結果のテーブルと実⾏を紐付けた履歴管理もできる。

Slide 7

Slide 7 text

7 ⽣成AIをどんどん活⽤していこう︕

Slide 8

Slide 8 text

8