Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
エッジで音声認識SNIPSを使ってみた
Search
竹のしん
September 27, 2018
Technology
0
1.4k
エッジで音声認識SNIPSを使ってみた
ネットにつながずラズパイで音声認識できるSNIPSの実施例
竹のしん
September 27, 2018
Tweet
Share
More Decks by 竹のしん
See All by 竹のしん
竹のしん
tak6uch1
0
310
竹のしん
tak6uch1
0
460
GR-ADZUKIとBlocklyDuinoでチキンレース
tak6uch1
0
670
Other Decks in Technology
See All in Technology
生成AIをより賢く エンジニアのための RAG入門 - Oracle AI Jam Session #20
kutsushitaneko
4
220
20241220_S3 tablesの使い方を検証してみた
handy
3
380
KubeCon NA 2024 Recap: How to Move from Ingress to Gateway API with Minimal Hassle
ysakotch
0
200
サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや
segavvy
2
410
GitHub Copilot のテクニック集/GitHub Copilot Techniques
rayuron
29
12k
re:Invent 2024 Innovation Talks(NET201)で語られた大切なこと
shotashiratori
0
310
日本版とグローバル版のモバイルアプリ統合の開発の裏側と今後の展望
miichan
1
130
PHP ユーザのための OpenTelemetry 入門 / phpcon2024-opentelemetry
shin1x1
1
190
ガバメントクラウドのセキュリティ対策事例について
fujisawaryohei
0
530
フロントエンド設計にモブ設計を導入してみた / 20241212_cloudsign_TechFrontMeetup
bengo4com
0
1.9k
複雑性の高いオブジェクト編集に向き合う: プラガブルなReactフォーム設計
righttouch
PRO
0
110
Wantedly での Datadog 活用事例
bgpat
1
440
Featured
See All Featured
Being A Developer After 40
akosma
87
590k
YesSQL, Process and Tooling at Scale
rocio
169
14k
What's in a price? How to price your products and services
michaelherold
243
12k
How to Think Like a Performance Engineer
csswizardry
22
1.2k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
44
9.3k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
38
1.9k
Adopting Sorbet at Scale
ufuk
73
9.1k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.2k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
26
1.9k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
1.9k
Transcript
エッジで音声認識 SNIPSを使ってみた 2018.9.27 竹のしん
自己紹介 • 名前: 竹のしん こと 竹内真哉 • 仕事: 半導体メーカー勤務、ハード屋、非ロジック •
趣味: バレーボール、麻雀、ものづくり(ごく最近) • VUI経験: Google Home、SNIPS • ブログ: 竹のしんのテック日記 • Google Homeで百人一首 https://take6shin.blogspot.com/2018/05/google-home.html • 本日の内容の実施手順を紹介 https://take6shin.blogspot.com/2018/07/snips.html • 他、子供向けプログラミングの記事など
SNIPSって何? • フランスの会社 https://snips.ai/ • エッジで音声認識 ⇒ 実行時にネット接続不要 • ラズパイ3(Raspbian
Lite推奨)、Linux、MacOSに対応 • 個人利用は無料 • 2018年6月から日本語対応(聞き取りのみ) ポイント!
作ったモノ:声で動く計算機 • 音声認識して通信した かった • SNIPS on RPi3で音声認識 し、四則演算 •
シリアル通信でGR-CITRUS へ結果を送り、7セグ表示
使い方 • Webでインテント、キーワード、学 習例やアクションを作成。 その場でテストできる。 • キーワードは、数値、日付、温度、 デフォルト、等。数値は千の位ま で認識した。万はダメだった。 •
サーバー上で学習したモデルをイ ンストール。 • 起動の音声“Hey SNIPS”を変えら れる(試せていない)
アクションはラズパイ上のPYTHONプログラム • アクションはWebからPythonプログラムを 入力 • ラズパイにアクションをインストール後は /var/lib/snips/skills/ユーザ名.Skill名 /action-* のファイル内action_wrapperメソッドにコー ドが入っているのでローカルで編集できる。
⇒便利
で、どうなの? • “Hey SNIPS”の認識が結構シビア。特に周りが騒がしい と厳しい。改めてGoogle Homeはすごいと思った。 →今後の進化に期待! • 認識の様子をリアルタイムに見られるのは 面白い。
• サーバーに音声を上げないのは、可能性 を感じる。 • サポートサイトで他のユーザからの相談案 件が参考になるのと、開発者もすぐに回答 してくれて良い。活用すべし。 これからは エッジでしょ
おわり