Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
スマートスピーカー(AIアシスタント)以外のVoice関連の話をしてみる / #AR_Fuku...
Search
you(@youtoy)
PRO
February 24, 2021
Technology
1
170
スマートスピーカー(AIアシスタント)以外のVoice関連の話をしてみる / #AR_Fukuoka #VUIFukuoka
you(@youtoy)
PRO
February 24, 2021
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
"かわいい" がテーマのハッカソンでWebの技術を使って魔法の世界を作った話など / HTML5 10th Anniversary
you
PRO
0
63
ブラウザで AI・機械学習が扱える TensorFlow.js が使われているライブラリなどの話 / #さくらのAI Meetup vol.4「ブラウザ」
you
PRO
0
130
Blynk と Raspberry Pi Pico W で IoT 〜 MQTT・HTTPリクエストの組み合わせも 〜 / IoTLT vol.114
you
PRO
0
270
AIを活用したWebアプリのプロトタイプを作ってコンテストや展示に出してみた話 / 大阪工業大学 ネットワークデザイン学科 LT大会 2024v2
you
PRO
0
65
Babylon.jsと色々なものを組み合わせる:ブラウザのAPIやガジェットや2D描画ライブラリなど / Babylon.js 勉強会 vol.3
you
PRO
0
500
WebHID API で Joy-Con・DUALSHOCK 4 のセンサーをブラウザから利用する / IoTLT vol.109
you
PRO
0
240
UIFlow 2.0 で MQTT をやってみた! / IoTLT vol.108
you
PRO
0
2.6k
UIFlow 2.0 と ATOMS3 の組み合わせで LINE通知を試す / ビジュアルプログラミングIoTLT vol.16
you
PRO
0
460
技術コミュニティの中での生成AI(自身の観測範囲での事例について) / 23 Xmas Talk / 20231209
you
PRO
0
1.5k
Other Decks in Technology
See All in Technology
心が動くエンジニアリング ── 私が夢中になる理由
16bitidol
0
110
"とにかくやってみる"で始めるAWS Security Hub
maimyyym
2
100
『Firebase Dynamic Links終了に備える』 FlutterアプリでのAdjust導入とDeeplink最適化
techiro
0
190
10XにおけるData Contractの導入について: Data Contract事例共有会
10xinc
7
710
Amplify Gen2 Deep Dive / バックエンドの型をいかにしてフロントエンドへ伝えるか #TSKaigi #TSKaigiKansai #AWSAmplifyJP
tacck
PRO
0
410
マルチプロダクトな開発組織で 「開発生産性」に向き合うために試みたこと / Improving Multi-Product Dev Productivity
sugamasao
1
310
IBC 2024 動画技術関連レポート / IBC 2024 Report
cyberagentdevelopers
PRO
1
120
複雑なState管理からの脱却
sansantech
PRO
1
160
DynamoDB でスロットリングが発生したとき_大盛りver/when_throttling_occurs_in_dynamodb_long
emiki
1
460
初心者向けAWS Securityの勉強会mini Security-JAWSを9ヶ月ぐらい実施してきての近況
cmusudakeisuke
0
140
リンクアンドモチベーション ソフトウェアエンジニア向け紹介資料 / Introduction to Link and Motivation for Software Engineers
lmi
4
300k
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
230
Featured
See All Featured
The Language of Interfaces
destraynor
154
24k
Git: the NoSQL Database
bkeepers
PRO
427
64k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Building a Scalable Design System with Sketch
lauravandoore
459
33k
For a Future-Friendly Web
brad_frost
175
9.4k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
6
430
Making Projects Easy
brettharned
115
5.9k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Transcript
2021年2月24日 (水) xTech ゆるっとLT: VUI Fukuoka and AR_Fukuoka @オンライン 豊田
陽介 ( @youtoy ) スマートスピーカー(AIアシスタント) 以外のVoice関連の話をしてみる
豊田陽介(@youtoy) 自己紹介 普段は、某通信会社の研究所勤務 話題のものをたくさん 購入している気がする IT系イベント主催・登壇・運営、多数参加 子ども向けの活動いろいろ(IT系以外も) プライベートでの活動 ガジェット好き その他
主催テーマ: ビジュアルプログラミング、IoT、 ロボットトイ、メカトロなど
VUI関連の活動など スマートスピーカー Advent Calendar 2020 で書いた記事 ⇒ IFTTT で Alexa・Google
Assistant を利用して IFTTT Pro の新機能 (クエリー・フィルター)との組み合わせも試す - Qiita ヒーローズ・リーグ(旧 Mashup Awards)のVUI部門 ⇒ オーガナイザー(2018〜2020) 今週の土曜 「VoiceLunchJP#07」 ⇒ ハンズオンっぽい感じの内容の ファシリテーター
VUI関連で作ったものの一部 ビジュアルプログラミングで Alexaスキル + toio 連携 Alexaスキル + ラズパイ +
micro:bit連携 Alexa Gadgets Toolkit の Custom Interfaces Espalexa Alexaスキル + M5StickC & micro:bit連携 Voiceflow Node.js・Python・ MakeCode C・MakeCode Node.js・V oiceflow
スマートスピーカー・ AIアシスタントの話を 出していたものの
それらが絡まない話
今日の話題 声(や音全般)+ 機械学習 1 2 ビジュアルプログラミング+ スマホの音声系機能
Teachable Machine (by Google) 1つ目のトピック
声(や音全般)+ 機械学習 Googleさん提供の「Teachable Machine」 ⇒ ブラウザ上で学習ができて推論のお試しも
声より音色がメインの 事例ですが...
Teachable Machine(音)を使った事例 https://www.youtube.com/watch?v=Ve6TyzzmXck
音のインタフェースは...
展示で年齢によらず楽しんでもらえた! 2020年10月開催の Maker Faire Tokyo 2020 にて 中高生以上の学生さん や大人の方にも!
音を対象にしたTeachable Machine 音を学習させる操作を する部分 機械学習モデルの 作成操作をする部分 音の識別を試せる 部分(モデルが できた後)
音の学習は、 サイト上でボタン押下 ⇒ マイクでの録音 という流れ
Web上で音を識別する部分を試す 作成された機械学習モデルの推論をそのままサイト上でお試し
モデルデータを独自のプログラムで動かす •Teachable Machine の FAQ より https://teachablemachine.withgoogle.com/faq 手軽なのは JavaScriptベース のもの
⇒ p5.js + p5.js の Web エディタが一番手軽かも?
手軽なお試し(p5.js Web Editorで試す) 機械学習モデルの クラウドへのアップ オンラインエディタで実行 (ソースコードの変更などもOK) モデルの URL は
書き換えを!
クラウドアップ時のURLへアクセスすると Web上でのお試しや、モデルデータのダウンロードが可能 ⇒ 学習させるデータの追加はできなそうだけど...
プロジェクトのファイルの保存/アップ 左上のメニューから、プロジェクトのダウンロード・アップが
注意点というかコツ などに関わる部分
Teachable Machineの利用での注意点 •Teachable Machine の FAQ「希望どおりに動作しないのはなぜですか?」より https://teachablemachine.withgoogle.com/faq
音の学習・モデル利用の話の一部は記事に
ビジュアルプログラミング でスマホアプリ+VUI 2つ目のトピック
デモ動画:声の機械学習利用+音声合成 https://www.youtube.com/watch?v=Ywu-fy5S16M Androidアプリ
ブロックベースのプログラミング UI を作る画面
Webサイト上での機械学習もできる 学習 推論 ⇒ 機械学習のモデルはダウンロードして Androidアプリへ
細かな話はQiitaの記事(前後編)に モデルのデータを作る部分 Androidアプリ開発の部分
将来的な話として...
Alexa連携用の機能が検討されてるっぽい App Inventor の AIプロジェクトの概要に関するプレゼンより ⇒ https://www.youtube.com/watch?v=mwE0gBH5ai0
終わり!