AI の活用における課題と現状、今後の期待

Slide 1

Slide 1 text

AI の活用における課題と現状、今後の期待 Asei Sugiyama

Slide 2

Slide 2 text

自己紹介杉山阿聖 (@K_Ryuichirou) Software Engineer @ Citadel AI Google Cloud Innovators Champion @ Cloud AI/ML MLSE 機械学習オペレーション WG mlops community 運営機械学習図鑑事例でわかる MLOps 共著決闘者 @ マスターデュエル

Slide 3

Slide 3 text

TOC AI の活用の現状 <- Agent AI ガバナンストレーニング

Slide 4

Slide 4 text

Eval-Centric AI

Slide 5

Slide 5 text

LLMOps の取り組み: 技術プロンプトエンジニアリング LLM-as-a-Judge 継続的な評価 RAG オズの魔法使いパターンユーザーテストトレースガードレールプロンプトのバージョン管理

Slide 6

Slide 6 text

LLMOps の取り組み: プロセス・文化事例共有会計測学習する文化セキュリティ Red Teaming AI ガバナンス

Slide 7

Slide 7 text

継続的な評価による継続的な改善

Slide 8

Slide 8 text

TOC AI の活用の現状 Agent <- AI ガバナンストレーニング

Slide 9

Slide 9 text

Agent とは画一的な定義がない Google Cloud のサービスとしてもだいぶ混乱気味 Vertex AI Agent Builder | Google Cloud https://cloud.google.com/products/agent-builder

Slide 10

Slide 10 text

整理が進行中 Vertex AI Agent Engine（旧称 LangChain on Vertex AI、Vertex AI Reasoning Engine）は、デベロッパーが本番環境で AI エージェントをデプロイ、管理、スケーリングできるようにするフルマネージドサービスです。 Google Cloud Agent Engine は、本番環境でエージェントをスケーリングするインフラストラクチャを処理するため、インテリジェントで効果的なアプリケーションの作成に集中できます。Vertex AI エージェントエンジンは、次の機能を提供します。 Vertex AI Agent Engine の概要 | Generative AI | Google Cloud https://cloud.google.com/vertex-ai/generative-ai/docs/agent-engine/overview

Slide 11

Slide 11 text

Vertex AI Agent Engine LangChain on Vertex AI (だった) 大力作のブログ記事 Gemini API / LangGraph / Agent Engine で LLM Agent を実装する https://zenn.dev/google_cloud_jp/articles/06cb259cc1d42d

Slide 12

Slide 12 text

Gen AI Evaluation Service ポイントワイズとペアワイズの評価を提供評価指標のカスタマイズも可能 Gen AI Evaluation Service の概要 | Generative AI | Google Cloud https://cloud.google.com/vertex-ai/generative-ai/docs/models/evaluation- overview

Slide 13

Slide 13 text

Next への期待 Agent への評価 Agent の開発に関する知見の共有マルチモーダル

Slide 14

Slide 14 text

Agent の評価 Gen AI Evaluation Service が対応しそうな雰囲気 Trace はもうちょっとなんとかなって欲しい Evaluate an agent | Generative AI | Google Cloud https://cloud.google.com/vertex-ai/generative-ai/docs/agent- engine/evaluate Trace an agent | Generative AI | Google Cloud https://cloud.google.com/vertex-ai/generative-ai/docs/agent- engine/manage/tracing

Slide 15

Slide 15 text

Agent の開発に関する知見の共有 "プロンプトエンジニアリング"がどんどん発展している現状、膨大な試行錯誤以外の解決方法がない試行錯誤を楽にする解決策に期待 Overview of prompting strategies | Generative AI | Google Cloud https://cloud.google.com/vertex-ai/generative- ai/docs/learn/prompts/prompt-design-strategies

Slide 16

Slide 16 text

マルチモーダル自然言語の評価が難しいことは広く知られるようになった生成された画像の評価や動画の評価が必要になる評価を含めた活用のベストプラクティスを期待 Gemini のマルチモーダル機能の 7 つの実例 - Google Developers Blog https://developers.googleblog.com/ja/7-examples-of-geminis-multimodal- capabilities-in-action/

Slide 17

Slide 17 text

TOC AI の活用の現状 Agent AI ガバナンス <- トレーニング

Slide 18

Slide 18 text

EU AI Act General-Purpose AI Code of Practice の third draft が発行着実に進んできている Third Draft of the General-Purpose AI Code of Practice published, written by independent experts | Shaping Europe’s digital future https://digital- strategy.ec.europa.eu/en/library/third-draft-general-purpose-ai-code- practice-published-written-independent-experts

Slide 19

Slide 19 text

ISO/IEC 42001:2023 マネジメント認証と呼ばれるもの Google Cloud, Google Workspace, Gemini などのサービスが認証を取得 Google Cloud の責任ある AI への取り組みが ISO/IEC 認証を取得 | Google Cloud 公式ブログ https://cloud.google.com/blog/ja/products/identity- security/google-clouds-commitment-to-responsible-ai-is-now-iso-iec- certified

Slide 20

Slide 20 text

Confirmation of certificate, Google LLC - IAF CertSearch https://www.iafcertsearch.org/certification/OeW1N2ZcriTbIoDbprECU97j

Slide 21

Slide 21 text

Secure AI Framework Google が公開した AI の安全性に関するフレームワークリスクアセスメントのためのチェックリストも公開している Secure AI Framework Approach A quick guide to implementing the Secure A Framework (SAIF) https://services.google.com/fh/files/blogs/google_secure_ai_framework_app

Slide 22

Slide 22 text

アジャイルガバナンス AI 事業者ガイドラインではアジャイルガバナンスを重要視リスクマネジメントに関するISO 標準 (ISO 31000:2018)でもアジャイルの考え方を取り入れている AI事業者ガイドライン（第1.0版）（METI/経済産業省） https://www.meti.go.jp/shingikai/mono_info_service/ai_shakai_jisso/2024041

Slide 23

Slide 23 text

Next への期待 AIガバナンスを進めるためのサービスやツールの拡充 ISO 42001:2023 の取得に関する詳細の共有アジャイルガバナンスの考え方を広めて欲しい Google Cloud の責任ある AI への取り組みが ISO/IEC 認証を取得 | Google Cloud 公式ブログ https://cloud.google.com/blog/ja/products/identity- security/google-clouds-commitment-to-responsible-ai-is-now-iso-iec- certified

Slide 24

Slide 24 text

TOC AI の活用の現状 Agent AI ガバナンストレーニング <-

Slide 25

Slide 25 text

Skills Boost かなりの数の生成AIに関するコースがある日本語で受けられる Skills Boost 生成 AI トレーニング : 日本語を無償公開 | Google Cloud 公式ブログ https://cloud.google.com/blog/ja/topics/training-certifications/skills- boost-generative-ai-training-japanese-version-released

Slide 26

Slide 26 text

Next への期待評価がない！ Gemini や Gemma の評価をどうしているのか知りたい MLOps の延長ではなく、機械学習モデルの訓練を前提としないコースが欲しい Gemma 3: Google’s new open model based on Gemini 2.0 https://blog.google/technology/developers/gemma-3/

Slide 27

Slide 27 text

まとめ生成 AI の活用にあたっては新たな取り組みが必要 Agent の開発にかかる莫大な試行錯誤を楽にする発表に期待 Google Cloud は AI ガバナンスにおいて先陣を切っているため、ノウハウの共有を期待生成 AI の活用では評価がとても大変なので、トレーニングやノウハウの共有を期待