Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Microsoft Translator APIを使ってみた
Search
S-cubism
November 17, 2017
Technology
1
140
Microsoft Translator APIを使ってみた
S-cubism
November 17, 2017
Tweet
Share
More Decks by S-cubism
See All by S-cubism
WSLでreactの開発環境作った話
scubism
0
630
未経験者がAndroidアプリをリリースするまで
scubism
0
99
scubism_LT_20180223_細田謙二_イベントソーシング
scubism
0
140
REVEAL.JSをちょっとだけ使ってみた
scubism
0
250
忙しい人のための仮想通貨
scubism
0
83
サーバ作業の注意コマンド
scubism
0
110
最近勉強してること、次にやりたいこと
scubism
0
94
FOOD TECH
scubism
0
64
Firebase(Realtime Database)について
scubism
0
110
Other Decks in Technology
See All in Technology
mikroBus HAT を用いた簡易ベアメタル開発
tarotene
0
270
SREの組織類型に応じた リーダシップの考察
kenta_hi
PRO
1
630
エンジニア候補者向け資料2024.11.07.pdf
macloud
0
4.5k
3次元点群データ「VIRTUAL SHIZUOKA』のオープンデータ化による恩恵と協働の未来/FOSS4G Japan 2024
kazz24s
0
130
Engineering at LY Corporation
lycorp_recruit_jp
0
330
今、始める、第一歩。 / Your first step
yahonda
2
680
これまでの計測・開発・デプロイ方法全部見せます! / Findy ISUCON 2024-11-14
tohutohu
3
270
OCI Data Integration技術情報 / ocidi_technical_jp
oracle4engineer
PRO
1
2.6k
Datadog RUM を用いた UX 指標の監視・顧客対応への活用
imamura_ko_0314
0
110
株式会社ログラス − エンジニア向け会社説明資料 / Loglass Comapany Deck for Engineer
loglass2019
3
28k
リンクアンドモチベーション ソフトウェアエンジニア向け紹介資料 / Introduction to Link and Motivation for Software Engineers
lmi
4
300k
State of Open Source Web Mapping Libraries
dayjournal
0
200
Featured
See All Featured
Rebuilding a faster, lazier Slack
samanthasiow
79
8.7k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
92
16k
Fashionably flexible responsive web design (full day workshop)
malarkey
404
65k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
191
16k
Why Our Code Smells
bkeepers
PRO
334
57k
Embracing the Ebb and Flow
colly
84
4.5k
Rails Girls Zürich Keynote
gr2m
93
13k
The Art of Programming - Codeland 2020
erikaheidi
52
13k
Bash Introduction
62gerente
608
210k
A Tale of Four Properties
chriscoyier
156
23k
Statistics for Hackers
jakevdp
796
220k
Transcript
Microsoft Translator API を使ってみた (結論: MSさん、もう少し頑張ってください)
まず、はじめに
自己紹介から だいもん かずと 大門 和斗 2012年 新卒としてエスキュービズムに入社 2013年 プライムアゲインに転職 -
DecoAlbum という iOSアプリを開発 2015年 独立して現在の会社を設立 - 株式会社ブルームソフト(現在 3名でやっています)
Microsoft Translator APIとは ・Microsoft の Cognitive Service のひとつ ・Cognitive ServiceはAIを活用したMSの提供サービス
他にも、「視覚」「音声」「知識」「言語」「検索」などの種類を提供
Microsoft Translator APIとは MS Translator Speech と MS Translator Text
Speech は 音声データを受信して、翻訳後のデータをテキ ストとして返してくれるAPI Text はテキストデータを受信して、翻訳後のデータをテキ ストとして返してくれるAPI
Microsoft Translator APIとは MS Translator Server Socket通信で音声データ をストリーミング配信 翻訳結果Stringデータとし て返却
しかし・・・ 実装上は正しいが、
MS Translator Server 1秒に1回ずつ断片的な音 声データを送信 最初のレスポンスまで 3~4秒程度かかる… レスポンスが遅いと UXが非常に悪い
そこで、
Apple 社の提供する SFSpeechRecognizer を試してみた
SFSpeechRecognizer とは ・Appple の Siri の技術に使われている音声認識機能 ・それをiOSのSDKから利用できるようになったもの ※iOS では iOS
10.0 以降でのみ利用可能 英語、日本語 他 21もの言語の音声認識に対応
Apple SFSpeechRecognizer + MS Translator Text API Apple Speech Recognizer
Server Socket通信で音声データ をストリーミング配信 音声を話された言語のテ キストとして返却 MS Translator Server 翻訳対象のテキストデー タを送信 翻訳後のデータをテキス トとして返却
Apple SFSpeechRecognizer + MS Translator Text API Apple Speech Recognizer
Server 音声認識のレスポンスは平均 0.5秒 MS Translator Server MSのテキスト翻訳は高速
デモ 簡単にデモをしたいと思います。
結論 MS Translator Speech Apple Speech Recognizer + MS Translator
Text 認識速度 低速(遅いと4秒以上かかる) 高速(UXが非常に良い) 翻訳精度 高い まあまあ (なぜ、Text翻訳の方が精度が低いの かは謎です) メリット ワンストップで音声認識から翻 訳までが行える 認識精度が非常に良く、高速である デメリット 認識精度が悪く、低速である Apple のSpeech Recognizerと別途テキスト翻 訳機能が必要
今後 ・Google 翻訳APIでも試してみたい → Apple よりも速く精度が高い可能性あり? ※ どなたか試した方がいたら教えてください ・双方の利点、欠点があるので、作りたいアプリによって切り替 えると良いかも
以上です ありがとうございました