Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2023夏NAHハッカソン_音声ケビンチーム
Search
koichi222
July 20, 2023
0
1.8k
2023夏NAHハッカソン_音声ケビンチーム
koichi222
July 20, 2023
Tweet
Share
More Decks by koichi222
See All by koichi222
NOT A HOTELでのデータ・AI活用
koichi222
0
1.4k
IoT企業におけるWebエンジニアの役割 / web-engineer-of-IoT-company
koichi222
0
1.1k
Featured
See All Featured
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
245
20k
Side Projects
sachag
451
41k
Agile that works and the tools we love
rasmusluckow
325
20k
Into the Great Unknown - MozCon
thekraken
14
1k
10 Git Anti Patterns You Should be Aware of
lemiorhan
649
58k
Unsuck your backbone
ammeep
663
57k
We Have a Design System, Now What?
morganepeng
44
6.8k
It's Worth the Effort
3n
180
27k
Imperfection Machines: The Place of Print at Facebook
scottboms
261
12k
Faster Mobile Websites
deanohume
300
30k
Done Done
chrislema
178
15k
A better future with KSS
kneath
231
16k
Transcript
音声ケビンチーム 〜声で全ての家電を操作する〜
スマートホーム API 繋ぎこみ インタフェース繋ぎこ み(ChatGPT API部 分) Special Thanks 音声認識
音声で家電を操作する • リモコンに触れずに操作したい ◦ ベッド横にタブレットがあるので寝転がりながら 操作ができない • たまに AI と会話したい時もある
今回の位置づけ • UXのPoC • ありものの技術のつなぎ込みに留める • ↑の構成での限界値、改善点と改善可能性をよりク リアにする
構成 App Web Speech API (SpeechRecognition) カーテン開けて(音声) 呼ぶべきAPI(の呼び出し関数) を判断 音声をテキスト化
function: operateCurtain params: {is_open: true} スマートホームAPI カーテン開けました(音声) テキストを音声化
ChatVRMをフロント部分に利用
デモ
UIデモ
実機デモ
実機デモ動画
ChatGPT(function calling)を利用した アプリケーションについての所感 入力側の多言語対応が容易 会話の文脈からの判断力が高い
課題1: 確率的出力をする挙動をどう制御するか 対応策 • 最終実行前にユーザの同意を取るフロー? • プログラムロジック側での制御?
課題2: レスポンスのパフォーマンス • 発話終了から機器の動作まで7〜9秒程度 ◦ ChatGPT APIの呼び出しに3〜5秒 対応策 • 相槌、インタラクションのアニメーションによる心理的な待ち時間の軽減
• GPT3 turboの利用(ただしfuntion callingの精度↓) • ChatGPT Steam APIの利用 • Azure環境でのChatGPT AI API利用 • ローカルLLMでのfunction calling • そもそもLLMに依存しない?