BigQuery MLで
サポートされているモデル
リモートモデル
→ BigQuery ML から
LLM などのAI リソースにアクセス可能
Vertex AI text-bison
(自然言語基盤モデルのいずれか)
Vertex AI textembedding-gecko
(テキスト エンベディング基盤モデルの
いずれか)
Cloud Natural Language API
Cloud Translation API
Document AI API
Speech-to-Text API
Cloud Vision API
参考:BigQuery MLの概要
Slide 7
Slide 7 text
やりたいこと
①
音声→文字起こし
Speech-to-Text API
関数:ML.TRANSCRIBE
②
文字起こし→要約
Vertex AI text-bison
関数:ML.GENERATE_TEXT
Slide 8
Slide 8 text
やりたいこと
①
音声→文字起こし
Speech-to-Text API
関数:ML.TRANSCRIBE
②
文字起こし→要約
Vertex AI text-bison
関数:ML.GENERATE_TEXT
やりたいこと
①
音声→文字起こし
Speech-to-Text API
関数:ML.TRANSCRIBE
今日の
メイン
②
文字起こし→要約
Vertex AI text-bison
関数:ML.GENERATE_TEXT
Slide 12
Slide 12 text
1. データセットの作成
2. データの準備
3. 外部接続の作成
4. リモートMLモデルの作成
5. テキスト要約
②文字起こし→要約:ML.GENERATE_TEXT関数
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
ML.GENERATE_TEXT 関数
Slide 13
Slide 13 text
Project-ID
②文字起こし→要約:ML.GENERATE_TEXT関数
1. データセットの作成
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
※任意のデータセットIDを入力
Project-ID
Slide 14
Slide 14 text
2. データの準備:テーブル作成→データ挿入
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
②文字起こし→要約:ML.GENERATE_TEXT関数
今回は生成AIに作成させた
書き起こしイメージ文章
(963文字、3分程度)
※任意のテーブル名を入力
Project-ID
Project-ID
Slide 15
Slide 15 text
3. 外部接続の作成:サービスアカウントIDの保存
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
②文字起こし→要約:ML.GENERATE_TEXT関数
※任意の接続IDを入力
Project-ID
Project-ID
Slide 16
Slide 16 text
3. 外部接続の作成:IAMでサービスアカウントに権限付与
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
②文字起こし→要約:ML.GENERATE_TEXT関数
サービスアカウントIDを入力
Slide 17
Slide 17 text
4. リモートMLモデルの作成
CREATE MODELの構文
クエリ作成
②文字起こし→要約:ML.GENERATE_TEXT関数
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
The CREATE MODEL statement for remote models over LLMs
Slide 18
Slide 18 text
4. リモートMLモデルの作成
実行→作成された「llm_model」がリモート機能としてtext-bisonを活用
②文字起こし→要約:ML.GENERATE_TEXT関数
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
The CREATE MODEL statement for remote models over LLMs
Slide 19
Slide 19 text
5. テキスト要約
ML.GENERATE_TEXTの構文
クエリ作成
②文字起こし→要約:ML.GENERATE_TEXT関数
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
ML.GENERATE_TEXT 関数
`ProjectID . VertexAI_Practice . SpeechtoTextExample`
flatten_json_output:
生成されたテキストと
安全性属性の信頼スコアリングを
別々に出力するかどうか
(デフォルトはFALSE)
※安全性属性についてはこちら
Slide 20
Slide 20 text
`ProjectID . VertexAI_Practice . SpeechtoTextExample`
5. テキスト要約
実行結果:flatten_json_outputがFALSEの場合(デフォルト)
②文字起こし→要約:ML.GENERATE_TEXT関数
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
ML.GENERATE_TEXT 関数
ml_generate_text_result:
生成されたテキストは
content 要素に、
安全性属性は
safetyAttributes 要素に
格納される
Slide 21
Slide 21 text
`ProjectID . VertexAI_Practice . SpeechtoTextExample`
5. テキスト要約
実行結果:flatten_json_outputがTRUEの場合
②文字起こし→要約:ML.GENERATE_TEXT関数
参考:Summarize Text using SQL and LLMs in BigQuery ML (Google Cloud skill boost)
ML.GENERATE_TEXT 関数
ml_generate_text_llm_result :
生成されたテキスト
ml_generate_text_rai_result :
安全性属性
Slide 22
Slide 22 text
やりたいこと
①
音声→文字起こし
Speech-to-Text API
関数:ML.TRANSCRIBE
宿題
②
文字起こし→要約
Vertex AI text-bison
関数:ML.GENERATE_TEXT
Slide 23
Slide 23 text
初心者でも分かる
Big Query ML入門
Thank you for listening!
Presented by Yukiringo