Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2023夏NAHハッカソン_音声ケビンチーム

koichi222
July 20, 2023
1.8k

 2023夏NAHハッカソン_音声ケビンチーム

koichi222

July 20, 2023
Tweet

Transcript

  1. 構成 App Web Speech API (SpeechRecognition) カーテン開けて(音声) 呼ぶべきAPI(の呼び出し関数) を判断 音声をテキスト化

    function: operateCurtain params: {is_open: true} スマートホームAPI カーテン開けました(音声) テキストを音声化
  2. 課題2: レスポンスのパフォーマンス • 発話終了から機器の動作まで7〜9秒程度 ◦ ChatGPT APIの呼び出しに3〜5秒 対応策 • 相槌、インタラクションのアニメーションによる心理的な待ち時間の軽減

    • GPT3 turboの利用(ただしfuntion callingの精度↓) • ChatGPT Steam APIの利用 • Azure環境でのChatGPT AI API利用 • ローカルLLMでのfunction calling • そもそもLLMに依存しない?