Slide 1

Slide 1 text

20230517_XRミーティング 20230517 HoloLens 2 音声認識 + ChatGPT で現実空間 に立方体を召喚できた話 ワンフットシーバス 田中正吾

Slide 2

Slide 2 text

私の話はスライドを後ほど共有します。 話す内容に注力いただいて大丈夫です!

Slide 3

Slide 3 text

10 分くらいで話します!

Slide 4

Slide 4 text

田中正吾(たなかせいご) 屋号:ワンフットシーバス 2004年よりフリーランス。以後、FLASH制作を 中心にインタラクティブコンテンツを主に行い現 在に至る。 最近ではWEBフロントエンドをベースにしなが らも、情報とインターフェースが合わさるアプ ローチという視点でIoTやMixed Realityといっ た技術も取り入れながら活動しています。

Slide 5

Slide 5 text

東京住まいですが今回は北海道勢参加なんです あながち関連がないわけではないです。以前から少し北海道つながりがありつつ、 最近も今回の要素技術の Node-RED の UG イベントを7/5 札幌でやる予定! よかったら北海道の方、当日配信見てくださーい! https://node-red.connpass.com/event/282500/

Slide 6

Slide 6 text

HoloLens 2 の音声認識で ChatGPT に 立方体を召喚できました https://twitter.com/1ft_seabass/status/1653305818169876481

Slide 7

Slide 7 text

ひとまずデモしてみます

Slide 8

Slide 8 text

今回も Node-RED が橋渡し ChatGPT が音声認識したメッセージを解釈して HoloLens 2 に JSON を返して その JSON データによって物体を生成している仕組み

Slide 9

Slide 9 text

HoloLens 2 から来たメッセージを こんな風に組み込んでます わりとシンプルに磨き上げれて満足

Slide 10

Slide 10 text

いろいろ試行錯誤したこと

Slide 11

Slide 11 text

キューブが誤変換しやすく立方体にした HoloLens 側で私の発音がよくないのかうまくききとってくれない

Slide 12

Slide 12 text

立方体もレポートとして伝わると変なJSONになる なので type は HoloLens 側で受け取った後 cube, ball 以外は除外してる {"type":"report","create":4,"size":1}

Slide 13

Slide 13 text

「コーンが2.3の大きさで36個ください」 については悩ましくて未実装 ボールと立方体と比べて、どう呼んでいいかが悩ましい。コーンが伝わりにくいのもある。がんばる。

Slide 14

Slide 14 text

「ボールが9の大きさで12個ください」と 大きさ要素もあるが中々しゃべりきれない 最初は色要素もいれていたがスムーズに一気に言うのがけっこうむずかしいので、いいやり方考える。

Slide 15

Slide 15 text

クリックで録音開始は使いやすいが いちいち狙って押すのが大変なので模索したい ひとまず使える実装としてはベター、もうちょっとジェスチャとか模索したい(グーとか手合わせ検証中)

Slide 16

Slide 16 text

時間があれば、追いリアルタイムデモします!

Slide 17

Slide 17 text

➔ なにはともあれ音声で物体召喚できるのとてもたのしい! ➔ ChatGPT がかなり柔軟に音声を解釈してルールさえしっ かりすれば JSON をうまく返してくれる ➔ ChatGPT による音声命令の設計は作りやすいものの、そ れでも場合や条件で上手く出す試行錯誤は必要 ➔ HoloLens 側の音声認識が揺れても ChatGPT がフォロー してくれるが混乱する場合もあり、おもしろい ➔ ひきつづき、いろいろ試していきたい! まとめ