Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
2023夏NAHハッカソン_音声ケビンチーム
Search
koichi222
July 20, 2023
0
2.3k
2023夏NAHハッカソン_音声ケビンチーム
koichi222
July 20, 2023
Tweet
Share
More Decks by koichi222
See All by koichi222
NOT A HOTELでのデータ・AI活用
koichi222
0
1.5k
IoT企業におけるWebエンジニアの役割 / web-engineer-of-IoT-company
koichi222
0
1.2k
Featured
See All Featured
Large-scale JavaScript Application Architecture
addyosmani
510
110k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
132
33k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.4k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Building Adaptive Systems
keathley
38
2.3k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
230
52k
Reflections from 52 weeks, 52 projects
jeffersonlam
347
20k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
111
50k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Transcript
音声ケビンチーム 〜声で全ての家電を操作する〜
スマートホーム API 繋ぎこみ インタフェース繋ぎこ み(ChatGPT API部 分) Special Thanks 音声認識
音声で家電を操作する • リモコンに触れずに操作したい ◦ ベッド横にタブレットがあるので寝転がりながら 操作ができない • たまに AI と会話したい時もある
今回の位置づけ • UXのPoC • ありものの技術のつなぎ込みに留める • ↑の構成での限界値、改善点と改善可能性をよりク リアにする
構成 App Web Speech API (SpeechRecognition) カーテン開けて(音声) 呼ぶべきAPI(の呼び出し関数) を判断 音声をテキスト化
function: operateCurtain params: {is_open: true} スマートホームAPI カーテン開けました(音声) テキストを音声化
ChatVRMをフロント部分に利用
デモ
UIデモ
実機デモ
実機デモ動画
ChatGPT(function calling)を利用した アプリケーションについての所感 入力側の多言語対応が容易 会話の文脈からの判断力が高い
課題1: 確率的出力をする挙動をどう制御するか 対応策 • 最終実行前にユーザの同意を取るフロー? • プログラムロジック側での制御?
課題2: レスポンスのパフォーマンス • 発話終了から機器の動作まで7〜9秒程度 ◦ ChatGPT APIの呼び出しに3〜5秒 対応策 • 相槌、インタラクションのアニメーションによる心理的な待ち時間の軽減
• GPT3 turboの利用(ただしfuntion callingの精度↓) • ChatGPT Steam APIの利用 • Azure環境でのChatGPT AI API利用 • ローカルLLMでのfunction calling • そもそもLLMに依存しない?