Slide 1

Slide 1 text

初心者でも分かる BigQuery ML入門 Presented by Yukiringo

Slide 2

Slide 2 text

雪林檎 新卒エンジニア! 学生時代にクラウド/バック/フロント/デザインと幅広く経験しつつ、 現在は自社サービスのアジャイル開発で企画~開発に携わる。 将来の目標は大好きなエンタメ×ITで多くの人に感動を届けること! 自己紹介

Slide 3

Slide 3 text

やりたいこと:音声ファイル→文字起こし→要約 → BigQuery MLというものが便利らしい → BigQuery ML初めて!勉強してみよう! → せっかくならLT発表もしてみたい! 雪林檎 自己紹介

Slide 4

Slide 4 text

BigQuery MLとは SQLを使って 機械学習モデルを作成、訓練、評価、予測& LLMとCloud AI APIにアクセスしてAIタスクを実行 出来る機能 通常は... 大規模なデータセットで ML や AI を実行するには、 ML フレームワークに対するコーディングスキル&知識が必要 →BigQuery MLにより...    データアナリストやデータサイエンティストが コーディングスキルの差を気にすることなく、   機械学習を利用できるようになる! 参考:BigQuery MLの概要

Slide 5

Slide 5 text

BigQuery MLで サポートされているモデル 内部トレーニングモデル 線形回帰 ロジスティック回帰 K 平均法クラスタリング など 外部トレーニングモデル:Vertex AIによるトレーニング DNN AutoML など インポートされたモデル:カスタムモデルをインポート Open Neural Network Exchange TensorFlow など リモートモデル:Vertex AIにデプロイされたモデルを使用 参考:BigQuery MLの概要

Slide 6

Slide 6 text

BigQuery MLで サポートされているモデル リモートモデル → BigQuery ML から   LLM などのAI リソースにアクセス可能 Vertex AI text-bison    (自然言語基盤モデルのいずれか) Vertex AI textembedding-gecko    (テキスト エンベディング基盤モデルの     いずれか) Cloud Natural Language API Cloud Translation API Document AI API Speech-to-Text API Cloud Vision API 参考:BigQuery MLの概要

Slide 7

Slide 7 text

やりたいこと ① 音声→文字起こし Speech-to-Text API 関数:ML.TRANSCRIBE ② 文字起こし→要約 Vertex AI text-bison 関数:ML.GENERATE_TEXT

Slide 8

Slide 8 text

やりたいこと ① 音声→文字起こし Speech-to-Text API 関数:ML.TRANSCRIBE ② 文字起こし→要約 Vertex AI text-bison 関数:ML.GENERATE_TEXT

Slide 9

Slide 9 text

①音声→文字起こし:ML.TRANSCRIBE 関数の使用 1. 認識機能の作成 2. 外部接続の作成 3. データセットの作成 4. モデルの作成 5. オブジェクトテーブルの作成 6. 音声ファイルの文字変換 参考:ML.TRANSCRIBE 関数を使用して音声ファイルを文字変換する

Slide 10

Slide 10 text

①音声→文字起こし:ML.TRANSCRIBE 関数の使用 1. 認識機能の作成 2. 外部接続の作成 3. データセットの作成 4. モデルの作成 5. オブジェクトテーブルの作成 6. 音声ファイルの文字変換 2024年2月22日現在 Enterprise, Enterprise Plus エディションのみ自動利用可能! → 宿題! 参考:ML.TRANSCRIBE 関数を使用して音声ファイルを文字変換する

Slide 11

Slide 11 text

やりたいこと ① 音声→文字起こし Speech-to-Text API 関数:ML.TRANSCRIBE 今日の メイン ② 文字起こし→要約 Vertex AI text-bison 関数:ML.GENERATE_TEXT

Slide 12

Slide 12 text

1. データセットの作成 2. データの準備 3. 外部接続の作成 4. リモートMLモデルの作成 5. テキスト要約 ②文字起こし→要約:ML.GENERATE_TEXT関数 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)    ML.GENERATE_TEXT 関数

Slide 13

Slide 13 text

Project-ID ②文字起こし→要約:ML.GENERATE_TEXT関数 1. データセットの作成 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost) ※任意のデータセットIDを入力 Project-ID

Slide 14

Slide 14 text

2. データの準備:テーブル作成→データ挿入 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost) ②文字起こし→要約:ML.GENERATE_TEXT関数 今回は生成AIに作成させた 書き起こしイメージ文章 (963文字、3分程度) ※任意のテーブル名を入力 Project-ID Project-ID

Slide 15

Slide 15 text

3. 外部接続の作成:サービスアカウントIDの保存 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost) ②文字起こし→要約:ML.GENERATE_TEXT関数 ※任意の接続IDを入力 Project-ID Project-ID

Slide 16

Slide 16 text

3. 外部接続の作成:IAMでサービスアカウントに権限付与 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost) ②文字起こし→要約:ML.GENERATE_TEXT関数 サービスアカウントIDを入力

Slide 17

Slide 17 text

4. リモートMLモデルの作成 CREATE MODELの構文 クエリ作成 ②文字起こし→要約:ML.GENERATE_TEXT関数 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)    The CREATE MODEL statement for remote models over LLMs

Slide 18

Slide 18 text

4. リモートMLモデルの作成 実行→作成された「llm_model」がリモート機能としてtext-bisonを活用 ②文字起こし→要約:ML.GENERATE_TEXT関数 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)    The CREATE MODEL statement for remote models over LLMs

Slide 19

Slide 19 text

5. テキスト要約 ML.GENERATE_TEXTの構文                    クエリ作成 ②文字起こし→要約:ML.GENERATE_TEXT関数 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)    ML.GENERATE_TEXT 関数 `ProjectID . VertexAI_Practice . SpeechtoTextExample` flatten_json_output: 生成されたテキストと 安全性属性の信頼スコアリングを 別々に出力するかどうか (デフォルトはFALSE) ※安全性属性についてはこちら

Slide 20

Slide 20 text

`ProjectID . VertexAI_Practice . SpeechtoTextExample` 5. テキスト要約 実行結果:flatten_json_outputがFALSEの場合(デフォルト) ②文字起こし→要約:ML.GENERATE_TEXT関数 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)    ML.GENERATE_TEXT 関数 ml_generate_text_result: 生成されたテキストは content 要素に、 安全性属性は safetyAttributes 要素に 格納される

Slide 21

Slide 21 text

`ProjectID . VertexAI_Practice . SpeechtoTextExample` 5. テキスト要約 実行結果:flatten_json_outputがTRUEの場合 ②文字起こし→要約:ML.GENERATE_TEXT関数 参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)    ML.GENERATE_TEXT 関数 ml_generate_text_llm_result : 生成されたテキスト ml_generate_text_rai_result : 安全性属性

Slide 22

Slide 22 text

やりたいこと ① 音声→文字起こし Speech-to-Text API 関数:ML.TRANSCRIBE 宿題 ② 文字起こし→要約 Vertex AI text-bison 関数:ML.GENERATE_TEXT

Slide 23

Slide 23 text

初心者でも分かる Big Query ML入門 Thank you for listening! Presented by Yukiringo