deep dive to voice rag - Speaker Deck

Slide 1

Slide 1 text

VoiceRAGへDeepDive .NETラボ11月 YUSUKE SATAKE

Slide 16

Slide 16 text

© 2023 Microsoft Corporation. All rights reserved APIの処理内容へDeepDive – response編 - 応答 type 説明セッション session.created セッション接続が正常に確立されるとすぐに送信されます。デバッグやログ記録に役立つ接続固有の ID を提供します。 session.updated セッションイベントへの応答として送信されsession.update、セッション構成に加えられた変更を反映します。発信者アイテム確認 conversation.item.created 発信者アイテム確認新しい会話項目が会話に挿入されたことを通知します。 conversation.item.deleted 発信者アイテム確認既存の会話項目が会話から削除されたことを通知します。 conversation.item.truncated 発信者アイテム確認会話内の既存の項目が切り捨てられたことを通知します。応答フロー response.created 応答フロー会話に対して新しい応答が開始されたことを通知します。 response.done 応答フロー会話の応答生成が完了したことを通知します。 rate_limits.updated 応答フロー直後に送信されresponse.done、終了したばかりの応答の消費後の更新されたステータスを反映した現在のレート制限情報を提供します。レスポンス内のアイテムフロー response.output_item.added レスポンス内のアイテムフローサーバーによって生成された新しい会話アイテムが作成されていることを通知します。 response.output_item.done レスポンス内のアイテムフロー新しい会話アイテムが会話への追加を完了したことを通知します。回答項目内のコンテンツフロー response.content_part.added 回答項目内のコンテンツフロー進行中の応答の会話項目内に新しいコンテンツ部分が作成されていることを通知します。 response.content_part.done 回答項目内のコンテンツフロー新しく作成されたコンテンツ部分が完了したことを通知します。 response.audio.delta 回答項目内のコンテンツフローモデルによって生成されたバイナリオーディオデータコンテンツ部分に増分更新を提供します。 response.audio.done 回答項目内のコンテンツフローオーディオコンテンツ部分の増分更新が完了したことを通知します。 response.audio_transcript.delta 回答項目内のコンテンツフローモデルによって生成された出力オーディオコンテンツに関連付けられたオーディオトランスクリプションの増分更新を提供します。 response.audio_transcript.done 回答項目内のコンテンツフロー出力オーディオの音声転写の増分更新が完了したことを通知します。 response.text.delta 回答項目内のコンテンツフロー会話メッセージ項目内のテキストコンテンツ部分に増分更新を提供します。 response.text.done 回答項目内のコンテンツフローテキストコンテンツ部分への増分更新が完了したことを通知します。 response.function_call_arguments.delta 回答項目内のコンテンツフロー会話内の項目内で表される関数呼び出しの引数に増分更新を提供します。 response.function_call_arguments.done 回答項目内のコンテンツフロー増分関数呼び出し引数が完了し、累積された引数全体を使用できるようになったことを通知します。ユーザー入力音声 input_audio_buffer.speech_started ユーザー入力音声ユーザーの音声の開始が検出されたことを通知します。 input_audio_buffer.speech_stopped ユーザー入力音声ユーザーの音声の終了が検出されたことを通知します。 conversation.item.input_audio_transcription. completed ユーザー入力音声ユーザーの入力オーディオバッファの補足的な書き起こしが利用可能であることを通知します。 conversation.item.input_audio_transcription. failed ユーザー入力音声入力音声の文字起こしに失敗したことを通知します。 input_audio_buffer.committed ユーザー入力音声ユーザーのオーディオ入力バッファの現在の状態がサブスクライブされた会話に送信されたことの確認を提供します。 input_audio_buffer.cleared ユーザー入力音声保留中のユーザーオーディオ入力バッファがクリアされたことを通知します。その他 error その他セッションでデータを処理中に問題が発生したことを示します。error追加の詳細を示すメッセージが含まれます。

Slide 1

Slide 1 text

Slide 2

Slide 2 text

Slide 3

Slide 3 text

Slide 4

Slide 4 text

Slide 5

Slide 5 text

Slide 6

Slide 6 text

Slide 7

Slide 7 text

Slide 8

Slide 8 text

Slide 9

Slide 9 text

Slide 10

Slide 10 text

Slide 11

Slide 11 text

Slide 12

Slide 12 text

Slide 13

Slide 13 text

Slide 14

Slide 14 text

Slide 15

Slide 15 text

Slide 16

Slide 16 text

Slide 17

Slide 17 text

Slide 18

Slide 18 text

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Slide 21

Slide 21 text