Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
日本語でおk?
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
shinjism
December 10, 2016
Programming
0
230
日本語でおk?
ARコンテンツ作成勉強会 忘年会 in 2016でのLT資料。
iOS 10から採用されたSpeech Recognition APIでゴニョゴニョやったお話。
shinjism
December 10, 2016
Tweet
Share
More Decks by shinjism
See All by shinjism
OpenCVでつくろうARスタンプアプリ for iOS
shinjism
0
150
ARコンテンツ作成勉強会:VuforiaでつくるスマホAR+VRアプリ
shinjism
0
840
個人的にお気に入りのVuforia公式サンプル #AR_Fukuoka
shinjism
0
110
A-Frameでお手軽WebAR
shinjism
1
4.3k
Other Decks in Programming
See All in Programming
Vuetify 3 → 4 何が変わった?差分と移行ポイント10分まとめ
koukimiura
0
120
LangChain4jとは一味違うLangChain4j-CDI
kazumura
1
170
AWS Infrastructure as Code の新機能 2025 総まとめ 〜SA 4人による怒涛のデモ祭り〜
konokenj
10
3.3k
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
230
Claude Code の Skill で複雑な既存仕様をすっきり整理しよう
yuichirokato
1
370
最初からAWS CDKで技術検証してもいいんじゃない?
akihisaikeda
4
130
AI主導でFastAPIのWebサービスを作るときに 人間が構造化すべき境界線
okajun35
0
710
Cyrius ーLinux非依存にコンテナをネイティブ実行する専用OSー
n4mlz
0
130
nuget-server - あなたが必要だったNuGetサーバー
kekyo
PRO
0
230
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
450
Rで始めるML・LLM活用入門
wakamatsu_takumu
0
170
Claude Codeログ基盤の構築
giginet
PRO
7
2.9k
Featured
See All Featured
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.3k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
210
Speed Design
sergeychernyshev
33
1.6k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.3k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Organizational Design Perspectives: An Ontology of Organizational Design Elements
kimpetersen
PRO
1
630
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
82
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
150
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Primal Persuasion: How to Engage the Brain for Learning That Lasts
tmiket
0
290
Typedesign – Prime Four
hannesfritz
42
3k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
85
Transcript
⽇本語でおk? 【iOS 10】Speech Recognition API をさわってみた感想 Shinji Hayai @_shinjism ARコンテンツ作成勉強会
忘年会 in 2016
• 早井慎⼆ • 熊本県在住フリーランスのプログラマ • Webアプリ / Webシステム開発 Webサイトデザイン &
構築 スマホアプリデザイン & 開発 (主にiOS) など • PHP / JavaScript / C# (Unity) / Swift • #AR_Kumamoto 運営 ⾃⼰紹介
⾳声認識を使いたい
スマホARを できるだけハンズフリーで • カメラをマーカー等にかざして画⾯を タッチするとき両⼿がふさがる • ハコスコやGoogle VRの使⽤中はタッ チ操作できない
アプリ制作の勉強会で iOS 10から使える⾳声認識が あると教えていただきました 5年間で350アプリを作った講師が教える アプリ制作チャレンジ2016秋(全8回予定)熊本会場 https://www.facebook.com/events/1587890414840626/
Speech Recognition API • http://devstreaming.apple.com/videos/wwdc/2016/5 09n1cnykqms19r9jyp/509/509_speech_recognition_a pi.pdf • https://developer.apple.com/library/content/samplec ode/SpeakToMe/Introduction/Intro.html
Speech Recognition APIとは • iOS 10から登場した⾳声認識API • Siriで採⽤されているものと同じ • ⽇本語含め58ヶ国語に対応
• 無償で商⽤利⽤可 • リアルタイム⾳声認識のほか 録⾳済み⾳声データの認識も • 実装がわりと楽にできそう
良い Speech Recognition API を使ってみた結果www ※個⼈の感想です
ただし… • 会話を区切るタイミングが難しい • ネットスラングや流⾏語は厳しいかも ex: 神ってる • 端末ごと、アプリごとに認識回数の制限あり (制限の詳細については公開されていない)
• 連続使⽤は最⼤1分まで • インターネット接続が必要 • バッテリーの消耗が⼼配 • 知⾒が少ない
とりあえず何か 作ってみました ※デモあり、バグ多めw
JIMAKU(仮) written: Unity / Vuforia / Swift (Native Plugin) ⾳声を字幕表⽰+αするアプリ
デモ中はお静かに ご協⼒ありがとうございます
はやくち ことば written: Swift はやくちことばを 練習する(?)アプリ 2016年内公開予定!! ↑↑↑願望↑↑↑ iOSユーザの皆さん 公開したらダウンロードしてね♪
デモ中は お静かに ご協⼒ ありがとうございます
ARコンテンツ作成勉強会 運営の皆さま 参加してくださった皆さま 本年もありがとうございました どうぞよい年をお迎えください