Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Nova Sonic 入門
Search
miura
October 30, 2025
Programming
0
130
Amazon Nova Sonic 入門
JAWS-UG青森2025登壇資料
miura
October 30, 2025
Tweet
Share
More Decks by miura
See All by miura
CSV登録をAWSサーバーレスで実装
miuratoya
0
14
Other Decks in Programming
See All in Programming
[PHPerKaigi 2026]PHPerKaigi2025の企画CodeGolfが最高すぎて社内で内製して半年運営して得た内製と運営の知見
ikezoemakoto
0
310
OTP を自動で入力する裏技
megabitsenmzq
0
130
条件判定に名前、つけてますか? #phperkaigi #c
77web
2
870
AWS×クラウドネイティブソフトウェア設計 / AWS x Cloud-Native Software Design
nrslib
16
3.5k
Tamach-sre-3_ANDPAD-shimaison93
mane12yurks38
0
200
安いハードウェアでVulkan
fadis
1
850
Codex CLIのSubagentsによる並列API実装 / Parallel API Implementation with Codex CLI Subagents
takatty
2
720
Codexに役割を持たせる 他のAIエージェントと組み合わせる実務Tips
o8n
4
1.4k
それはエンジニアリングの糧である:AI開発のためにAIのOSSを開発する現場より / It serves as fuel for engineering: insights from the field of developing open-source AI for AI development.
nrslib
1
680
一度始めたらやめられない開発効率向上術 / Findy あなたのdotfilesを教えて!
k0kubun
3
2.5k
PHPで TLSのプロトコルを実装してみる
higaki_program
0
590
Mastering Event Sourcing: Your Parents Holidayed in Yugoslavia
super_marek
0
130
Featured
See All Featured
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
95
Navigating the Design Leadership Dip - Product Design Week Design Leaders+ Conference 2024
apolaine
0
250
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
160
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Between Models and Reality
mayunak
2
250
Done Done
chrislema
186
16k
RailsConf 2023
tenderlove
30
1.4k
Context Engineering - Making Every Token Count
addyosmani
9
780
Building a Scalable Design System with Sketch
lauravandoore
463
34k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.5k
Visualization
eitanlees
150
17k
Designing for Timeless Needs
cassininazir
0
180
Transcript
Amazon Nova Sonic 入門 アイレット株式会社 三浦 登哉
・年齢 26歳 ・出身 青森県弘前市出身 ・所属 アイレット株式会社 第一開発事業部 ・業務 開発エンジニア(フロント、主にバックエンド) 三浦
登哉 自己紹介
System Integrator(SIer) クラウドの設計、構築からシステム開発、デザイン設計 運用保守までトータルサポート 弊社のサービス
本日お話すること ・Nova Sonicでできること ・音声アシスタントを実装してみた
Amazon Nova Sonic
2025年4月に発表されたリアルタイム音声対話を実現 する次世代のSpeech-to-Speechモデル Amazon Bedrockを通じて利用可能で、人間らしい自 然な音声会話が可能
ここがスゴイ
従来の音声AIシステムでは以下の要素を実現するために複数サービス でパイプラインを組む必要があった - Speech-to-Text (音声認識) - LLM (言語理解・生成) - Text-to-Speech
(音声合成) = Lex、Bedrock、Pollyなどのサービスを組み合わせる Nova Sonicで完結 音声理解と生成の統合アーキテクチャ
従来の複雑なオーケストレーションは不要に ロジックやエージェントの開発に集中できる
・音声認識・生成・出力を同時並行で処理 ・処理完了を待たず、できた部分から順次応答を返す ・ユーザーの割り込み(barge-in)にも対応し、柔軟に応答を修正す る 双方向ストリーミングで“待ち”のない応答を実現
人間同士の会話に近い対話が可能に 待たせない応答でユーザー体験が向上
音声アシスタント実装してみた
音声アシスタント
インフラ構成
・Nova Sonicとはイベント(JSON)でやり 取りする ・「会話を始める」「音声を送る」「音声を 返す」など、すべてイベントとして送受信 入力イベント https://docs.aws.amazon.com/ja_jp/nova/latest/userguide /input-events.html 出力イベント https://docs.aws.amazon.com/ja_jp/nova/latest/userguide
/output-events.html イベント
・テキスト出力イベント 音声の文字起こし。チャットUIで活用。 ・音声出力イベント base64エンコードされた音声データ。 順次再生することでリアルタイムな音声が流れる。 ・ツール使用要求のイベント 外部APIやRAGを呼び出す必要がある場合に届く。 Nova Sonicからのイベント種別
・外部の知識や機能を利用できる ・発話内容から「RAG検索」「API実行」などを 自動で判断(Nova Sonicが直接実行するわけではなく あくまで判断) ・ツールの実行結果をNova Sonicに渡すと自然な音声で 返してくれる ツール連携
会話開始時にツール定義を渡す description:ツールの説明 inputSchema: Nova Sonicがスキーマに沿っ てAPIパラメータやRAGクエリ を自動生成
処理フロー
音声AIはハードル高そう→ハンズオン充実してます ・ハンズオン https://docs.aws.amazon.com/ja_jp/nova/latest/us erguide/speech-code-examples.html ・サンプルコード https://github.com/aws-samples/amazon-nova- samples/tree/main/speech-to-speech
結論
「音声認識や LLM などの構成をどうつなぎあわせるか」 音声AIで何を実現するか 音声AI開発時の議論がより本質的なところに置けるにようになる
※ 現時点(2025/11/01)では日本語非対応なので国内での 実用化はまだ先になりそう