Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2023夏NAHハッカソン_音声ケビンチーム
Search
koichi222
July 20, 2023
3k
0
Share
2023夏NAHハッカソン_音声ケビンチーム
koichi222
July 20, 2023
More Decks by koichi222
See All by koichi222
NOT A HOTELでのデータ・AI活用
koichi222
0
1.6k
IoT企業におけるWebエンジニアの役割 / web-engineer-of-IoT-company
koichi222
0
1.3k
Featured
See All Featured
職位にかかわらず全員がリーダーシップを発揮するチーム作り / Building a team where everyone can demonstrate leadership regardless of position
madoxten
62
54k
Accessibility Awareness
sabderemane
1
120
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
390
Ten Tips & Tricks for a 🌱 transition
stuffmc
0
110
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
130
Docker and Python
trallard
47
3.8k
B2B Lead Gen: Tactics, Traps & Triumph
marketingsoph
0
120
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
The SEO Collaboration Effect
kristinabergwall1
1
450
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
1
120
It's Worth the Effort
3n
188
29k
How Software Deployment tools have changed in the past 20 years
geshan
0
34k
Transcript
音声ケビンチーム 〜声で全ての家電を操作する〜
スマートホーム API 繋ぎこみ インタフェース繋ぎこ み(ChatGPT API部 分) Special Thanks 音声認識
音声で家電を操作する • リモコンに触れずに操作したい ◦ ベッド横にタブレットがあるので寝転がりながら 操作ができない • たまに AI と会話したい時もある
今回の位置づけ • UXのPoC • ありものの技術のつなぎ込みに留める • ↑の構成での限界値、改善点と改善可能性をよりク リアにする
構成 App Web Speech API (SpeechRecognition) カーテン開けて(音声) 呼ぶべきAPI(の呼び出し関数) を判断 音声をテキスト化
function: operateCurtain params: {is_open: true} スマートホームAPI カーテン開けました(音声) テキストを音声化
ChatVRMをフロント部分に利用
デモ
UIデモ
実機デモ
実機デモ動画
ChatGPT(function calling)を利用した アプリケーションについての所感 入力側の多言語対応が容易 会話の文脈からの判断力が高い
課題1: 確率的出力をする挙動をどう制御するか 対応策 • 最終実行前にユーザの同意を取るフロー? • プログラムロジック側での制御?
課題2: レスポンスのパフォーマンス • 発話終了から機器の動作まで7〜9秒程度 ◦ ChatGPT APIの呼び出しに3〜5秒 対応策 • 相槌、インタラクションのアニメーションによる心理的な待ち時間の軽減
• GPT3 turboの利用(ただしfuntion callingの精度↓) • ChatGPT Steam APIの利用 • Azure環境でのChatGPT AI API利用 • ローカルLLMでのfunction calling • そもそもLLMに依存しない?