Slide 1

Slide 1 text

AI事業本部 生成AIインテグレーション部 筧 剛彰 re:Invent 2025 ふりかえり 生成AI版

Slide 2

Slide 2 text

⾃⼰紹介 2 ● 2019年 クラスメソッドに⼊社 ● 2023年 ⽣成AI案件担当 ○ ⾃社サービス開発 ○ 技術コンサルティング ○ 開発プロダクト⽀援 ● 2025年 AI事業本部 ○ チームマネージャー ○ プロダクトマネージャー ● 部署 ○ AI事業本部 ● 役割 ○ マネージャー ● 名前 ○ 筧 剛彰(@takaakikakei) ‧Japan AWS Ambassadors 2025 ‧Japan AWS Top Engineers 2021 ~ 2023 ‧Japan AWS All Certifications Engineers 2022 ~ 2023 ‧書籍「ビジネスのためのChatGPT活⽤ガイド」

Slide 3

Slide 3 text

今年のre:Inventも⼤盛況でした! 3

Slide 4

Slide 4 text

今年のKeynoteもAI推し 4

Slide 5

Slide 5 text

re:Invent 2025のキーノートからみるAWSからのメッセージ 5 1. Agentic AI 2. コストと効率性 3. データ活⽤ Keynoteのメッセージから、「AWSが何を伝えようとしているのか(Why)」を考察し、「我々はどうすべきか(How)」を検 討していく

Slide 6

Slide 6 text

1. Agentic AI 6

Slide 7

Slide 7 text

「AIアシスタントは、エージェントへと道を譲り始めている」 7 アシスタント ● これまでの「対話」が中⼼のAI ● ツールとしての側⾯が強い エージェント ● ⾃律的に計画し⾏動するAI ● 「何をするか(Goal)」を指⽰すれば「ど うやるか(How)」を⾃律的に考え実⾏ ● 「ガードレール」や「評価」が本番導⼊に は必要 Matt Garman⽒のKeynoteでの発⾔ “AI assistants are starting to give way to AI agents that can perform tasks and automate on your behalf” https://www.gartner.co.jp/ja/newsroom/press-releases/pr- 20250514-ai-agent

Slide 8

Slide 8 text

Amazon Bedrock AgentCore 8 AWSが提供する、エージェントを展開‧運⽤するために最適なマネージドサービス https://ap-northeast-1.console.aws.amazon.com/bedrock-agentcore

Slide 9

Slide 9 text

re:Invent 2025で発表された新機能 9 本番導⼊には⽋かせない、「ガードレール」と「評価」の新機能が登場しました https://ap-northeast-1.console.aws.amazon.com/bedrock-agentcore

Slide 10

Slide 10 text

AgentCoreの新機能 10 AgentCore Policy(プレビュー) ● エージェントの⾏動を継続的に監視‧分析できる、 「ガードレール」の新機能 ○ エージェントの⾏動を細かく制御可能 ○ エージェントの外部で動作するので信頼性が⾼い ○ 作成したポリシーは、複数のエージェントに適⽤可能 AgentCore Evaluations (プレビュー) ● エージェントの⾏動を継続的に監視‧分析できる、 「評価」の新機能 ○ 正確性や有⽤性などの、組み込みの評価ツール ○ ビジネス固有の要件に合わせた、カスタム評価ツールも作成 可能 ○ 多⾓的な評価を定期的に⾏うことで、性能劣化をいち早く検 知 本番利⽤には⽋かせない「ガードレール」と「評価」の新機能が登場

Slide 11

Slide 11 text

その他のエージェント系アップデート 11 ● AgentCore Memoryのエピソード機能 ○ 新しい⻑期記憶戦略 ○ 過去の経験から学習し、その教訓を将来のやりとりに活⽤可能に ● AgentCore Runtimeの双⽅向ストリーミング機能 ○ WebSocket を使ったリアルタイムな双⽅向通信が可能に ○ ⾳声会話等のエージェントの体験向上に期待 ● Amazon Nova Act ○ ブラウザ操作の⾃動化 ● Frontier Agent ○ Kiro autonomous agent ○ AWS Security Agent ○ AWS DevOps Agent ● etc.. エージェントが実⾏できる機能を拡張するアップデートもありました

Slide 12

Slide 12 text

[付録1] AgentCoreの情報 12 AgentCoreの基礎から最新情報のキャッチアップまで、おすすめです! https://dev.classmethod.jp/author/yjinn/ https://speakerdeck.com/yuu551

Slide 13

Slide 13 text

2. コストと効率性 13

Slide 14

Slide 14 text

「AIは安くはない(AI ain't cheap)」 14 Peter DeSantis⽒のKeynoteでは、率直な現状認識から始まり、「コスト」と「効率化」について⾔及があった。 AIは、物理的なインフラと効率の上でしか成り⽴たないというメッセージ https://www.youtube.com/watch?v=JeUpUK0nhC0

Slide 15

Slide 15 text

インフラにおける「コスト」と「効率性」の向上 15 Trainium3 UltraServersが⼀般提供(GA) ● Trainiumは、AWSが開発するAIカスタムチップ ● UltraServerは、Trainiumチップを搭載したサーバー ● 最新世代のGAで、AIモデルを早く安くトレーニング および展開できるように Graviton5を発表 ● Gravitonは、AWSが独⾃に設計したARMベースの CPU(プロセッサ) ● EC2ユーザのTop 1,000をみると、98%がGravitonを 利⽤ ● 最新世代の発表で、⾼いコストパフォーマンスで、 アプリケーションを動作可能に AWSは、コストや物理的な制約を取り除くために、チップ(Trainium)や冷却技術(Nitro/Graviton)への「深い投資」を⾏っ ている https://www.youtube.com/watch?v=JeUpUK0nhC0

Slide 16

Slide 16 text

モデル利⽤の「コスト」と「効率性」の向上 16 オープンウェイトモデルが新たに18個追加 ● 公開されている事前学習済みのAIモデル ● GoogleやNVIDIAやOpenAIなどのモデルが追加 ● エージェント実⾏コスト削減に期待 Nova 2 シリーズの公開 ● コスト効率の⾼い新世代の登場 ● ⼀般提供(GA) ○ Nova 2 Lite(⽇常利⽤におすすめバランス型モデル) ○ Nova 2 Sonic(⾳声会話可能なAIモデル) ● プレビュー ○ Nova 2 Pro(複雑なタスクに適したパワフル型モデル) ○ Nova 2 Omni(テキストと画像出⼒が可能なモデル) 安価なモデルでエージェントはコストを削減。 https://aws.amazon.com/jp/blogs/aws/amazon-bedrock-ad ds-fully-managed-open-weight-models/

Slide 17

Slide 17 text

[付録2] Nova 2 Omniの情報 17 現時点では、承認されたユーザーのみが早期アクセス可能ですが、ワークショップのブログで使⽤感を確認できます。 https://dev.classmethod.jp/articles/reinvent2025-report-aim428/

Slide 18

Slide 18 text

3. データ活用 18

Slide 19

Slide 19 text

「データこそが差別化要因である」 19 Matt Garman⽒のKeynoteでは、 “your data is unique it's what differentiates you from the competition という発⾔ともに、 RAGや従来の微調整に対しての限界を指摘 汎⽤的モデル(LLM)だけでは差別化にならず、企業固有のデータが 競争⼒の源泉となる ● 汎⽤モデル ○ ⼀般常識と基礎学⼒を持った優秀な「新⼊社員」のイメージ ● RAG ○ 新⼊社員に分厚い「マニュアル」を渡し、「これを⾒ながら仕事をして」と指 ⽰するイメージ。答えを探せますが、内容は暗記していない。 ● 微調整(ファインチューニング) ○ 新⼊社員に数⽇間の「集中研修」を受けさせるイメージ。特定のタスクは上⼿ くなりますが、研修で習わなかった応⽤問題には弱いこともある。(事後学 習)

Slide 20

Slide 20 text

⾼度な微調整(ファインチューニング) 20 Amazon Nova Forgeが⼀般提供(GA) ● 企業が⾼度な⾃社仕様のモデルを構築しや すくする新サービス ● より早い学習段階から独⾃の知識やコンテ キストを⼊れることが可能に ● 学⽣時代からのインターンシップのような イメージ。⼊社前(学習完了前)から⾃社 の⽂化や専⾨知識の中で育てるため、その 知識が「直感」レベルで⾝についており、 応⽤⼒も⾼く、会社(⾃社ドメイン)の⾊ を持つ社員になる。 事前学習‧中間学習‧事後学習に相当するチェックポイントから開始でき、独⾃のデータを最適なタイミングで注⼊可能。 AmazonがNova向けに収集‧選別した学習データの活⽤で、過学習‧壊滅的な忘却‧データ準備の負担が軽減。

Slide 21

Slide 21 text

微調整(ファインチューニング)のおける選択肢の拡⼤ 21 Amazon BedrockがReinforcement Fine-tuningが⼀般提供(GA)。固有の要件にモデルの挙動を適応させるカスタマイズが簡単 に。事後学習の選択肢の幅が広がりました

Slide 22

Slide 22 text

[付録3] Gartnerの⾒解 22 微調整は今後トレンドになる可能性が⾼く、そろそろ⼩さく始めていきたい https://www.gartner.co.jp/ja/newsroom/press-releases/pr-20250410-ai-mo del

Slide 23

Slide 23 text

RAG構築基盤の充実 23 Amazon S3 Vectorsが⼀般提供(GA) ● Amazon S3にベクトル検索機能を追加した、ベクトルスト レージサービス ● 他の⼀般的なソリューションと⽐較して最⼤90%のコストを 削減 ● ベクトル仕様やパフォーマンスの機能強化 ● 東京リージョン対応も Amazon Bedrock Knowledge Basesのマルチモーダル検索が⼀般 提供(GA) ● RAG構築をマネージドに提供する機能 ● マルチモーダル検索をサポート ● 画像や動画や⾳声などを応答させることが可能に ● 現時点では海外リージョンのみ対応 Amazon S3 VectorsとKnowledge Basesのマルチモーダル検索の組み合わせれば、コスト削減しながら効率的にRAG構築可能に https://dev.classmethod.jp/articles/kb-multimodal-retrieva l-reinvent2025

Slide 24

Slide 24 text

まとめ 24

Slide 25

Slide 25 text

まとめ 25 1. Agentic AI ○ AgentCoreを活⽤して、本番環境で価値を⽣む出すフェーズへ移⾏。 2. コストと効率性 ○ 充実したインフラ‧モデル‧検索基盤を活⽤して、コスパよく構築。 3. データ活⽤ ○ データこそが差別化要因。 ○ RAGはコスト削減やマルチモーダル性の向上で、活⽤幅がさらに増加。 ○ 微調整は今後トレンドになる可能性が⾼く、そろそろ⼩さく始めていきたい。

Slide 26

Slide 26 text

No content