Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2023夏NAHハッカソン_音声ケビンチーム
Search
koichi222
July 20, 2023
0
2.3k
2023夏NAHハッカソン_音声ケビンチーム
koichi222
July 20, 2023
Tweet
Share
More Decks by koichi222
See All by koichi222
NOT A HOTELでのデータ・AI活用
koichi222
0
1.5k
IoT企業におけるWebエンジニアの役割 / web-engineer-of-IoT-company
koichi222
0
1.2k
Featured
See All Featured
It's Worth the Effort
3n
183
27k
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
Adopting Sorbet at Scale
ufuk
73
9.1k
Optimising Largest Contentful Paint
csswizardry
33
2.9k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
131
33k
Build your cross-platform service in a week with App Engine
jlugia
229
18k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
31
2.7k
Docker and Python
trallard
40
3.1k
GitHub's CSS Performance
jonrohan
1030
460k
For a Future-Friendly Web
brad_frost
175
9.4k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
191
16k
Transcript
音声ケビンチーム 〜声で全ての家電を操作する〜
スマートホーム API 繋ぎこみ インタフェース繋ぎこ み(ChatGPT API部 分) Special Thanks 音声認識
音声で家電を操作する • リモコンに触れずに操作したい ◦ ベッド横にタブレットがあるので寝転がりながら 操作ができない • たまに AI と会話したい時もある
今回の位置づけ • UXのPoC • ありものの技術のつなぎ込みに留める • ↑の構成での限界値、改善点と改善可能性をよりク リアにする
構成 App Web Speech API (SpeechRecognition) カーテン開けて(音声) 呼ぶべきAPI(の呼び出し関数) を判断 音声をテキスト化
function: operateCurtain params: {is_open: true} スマートホームAPI カーテン開けました(音声) テキストを音声化
ChatVRMをフロント部分に利用
デモ
UIデモ
実機デモ
実機デモ動画
ChatGPT(function calling)を利用した アプリケーションについての所感 入力側の多言語対応が容易 会話の文脈からの判断力が高い
課題1: 確率的出力をする挙動をどう制御するか 対応策 • 最終実行前にユーザの同意を取るフロー? • プログラムロジック側での制御?
課題2: レスポンスのパフォーマンス • 発話終了から機器の動作まで7〜9秒程度 ◦ ChatGPT APIの呼び出しに3〜5秒 対応策 • 相槌、インタラクションのアニメーションによる心理的な待ち時間の軽減
• GPT3 turboの利用(ただしfuntion callingの精度↓) • ChatGPT Steam APIの利用 • Azure環境でのChatGPT AI API利用 • ローカルLLMでのfunction calling • そもそもLLMに依存しない?