Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2023夏NAHハッカソン_音声ケビンチーム
Search
koichi222
July 20, 2023
0
2.6k
2023夏NAHハッカソン_音声ケビンチーム
koichi222
July 20, 2023
Tweet
Share
More Decks by koichi222
See All by koichi222
NOT A HOTELでのデータ・AI活用
koichi222
0
1.6k
IoT企業におけるWebエンジニアの役割 / web-engineer-of-IoT-company
koichi222
0
1.3k
Featured
See All Featured
Fantastic passwords and where to find them - at NoRuKo
philnash
51
3.4k
[RailsConf 2023] Rails as a piece of cake
palkan
56
5.7k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
A designer walks into a library…
pauljervisheath
207
24k
Speed Design
sergeychernyshev
32
1k
Designing Experiences People Love
moore
142
24k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
770
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Adopting Sorbet at Scale
ufuk
77
9.5k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
How to Think Like a Performance Engineer
csswizardry
25
1.8k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
2.9k
Transcript
音声ケビンチーム 〜声で全ての家電を操作する〜
スマートホーム API 繋ぎこみ インタフェース繋ぎこ み(ChatGPT API部 分) Special Thanks 音声認識
音声で家電を操作する • リモコンに触れずに操作したい ◦ ベッド横にタブレットがあるので寝転がりながら 操作ができない • たまに AI と会話したい時もある
今回の位置づけ • UXのPoC • ありものの技術のつなぎ込みに留める • ↑の構成での限界値、改善点と改善可能性をよりク リアにする
構成 App Web Speech API (SpeechRecognition) カーテン開けて(音声) 呼ぶべきAPI(の呼び出し関数) を判断 音声をテキスト化
function: operateCurtain params: {is_open: true} スマートホームAPI カーテン開けました(音声) テキストを音声化
ChatVRMをフロント部分に利用
デモ
UIデモ
実機デモ
実機デモ動画
ChatGPT(function calling)を利用した アプリケーションについての所感 入力側の多言語対応が容易 会話の文脈からの判断力が高い
課題1: 確率的出力をする挙動をどう制御するか 対応策 • 最終実行前にユーザの同意を取るフロー? • プログラムロジック側での制御?
課題2: レスポンスのパフォーマンス • 発話終了から機器の動作まで7〜9秒程度 ◦ ChatGPT APIの呼び出しに3〜5秒 対応策 • 相槌、インタラクションのアニメーションによる心理的な待ち時間の軽減
• GPT3 turboの利用(ただしfuntion callingの精度↓) • ChatGPT Steam APIの利用 • Azure環境でのChatGPT AI API利用 • ローカルLLMでのfunction calling • そもそもLLMに依存しない?