Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Microsoft Translator APIを使ってみた
Search
S-cubism
November 17, 2017
Technology
1
160
Microsoft Translator APIを使ってみた
S-cubism
November 17, 2017
Tweet
Share
More Decks by S-cubism
See All by S-cubism
WSLでreactの開発環境作った話
scubism
0
700
未経験者がAndroidアプリをリリースするまで
scubism
0
130
scubism_LT_20180223_細田謙二_イベントソーシング
scubism
0
160
REVEAL.JSをちょっとだけ使ってみた
scubism
0
260
忙しい人のための仮想通貨
scubism
0
110
サーバ作業の注意コマンド
scubism
0
130
最近勉強してること、次にやりたいこと
scubism
0
110
FOOD TECH
scubism
0
67
Firebase(Realtime Database)について
scubism
0
130
Other Decks in Technology
See All in Technology
Shirankedo NOCで見えてきたeduroam/OpenRoaming運用ノウハウと課題 - BAKUCHIKU BANBAN #2
marokiki
0
170
AI時代こそ求められる設計力- AWSクラウドデザインパターン3選で信頼性と拡張性を高める-
kenichirokimura
3
160
空間を設計する力を考える / 20251004 Naoki Takahashi
shift_evolve
PRO
4
440
【Oracle Cloud ウェビナー】クラウド導入に「専用クラウド」という選択肢、Oracle AlloyとOCI Dedicated Region とは
oracle4engineer
PRO
3
120
実装で解き明かす並行処理の歴史
zozotech
PRO
1
630
M5製品で作るポン置きセルラー対応カメラ
sayacom
0
170
職種別ミートアップで社内から盛り上げる アウトプット文化の醸成と関係強化/ #DevRelKaigi
nishiuma
2
160
ガバメントクラウドの概要と自治体事例(名古屋市)
techniczna
2
200
スタートアップにおけるこれからの「データ整備」
shomaekawa
2
320
Adapty_東京AI祭ハッカソン2025ピッチスライド
shinoyamada
0
200
SREとソフトウェア開発者の合同チームはどのようにS3のコストを削減したか?
muziyoshiz
1
110
10年の共創が示す、これからの開発者と企業の関係 ~ Crossroad
soracom
PRO
1
640
Featured
See All Featured
Building a Modern Day E-commerce SEO Strategy
aleyda
43
7.7k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.2k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
16k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.4k
Site-Speed That Sticks
csswizardry
11
890
Mobile First: as difficult as doing things right
swwweet
224
10k
Writing Fast Ruby
sferik
629
62k
The Language of Interfaces
destraynor
162
25k
Facilitating Awesome Meetings
lara
56
6.6k
Visualization
eitanlees
148
16k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
2.7k
How to train your dragon (web standard)
notwaldorf
96
6.3k
Transcript
Microsoft Translator API を使ってみた (結論: MSさん、もう少し頑張ってください)
まず、はじめに
自己紹介から だいもん かずと 大門 和斗 2012年 新卒としてエスキュービズムに入社 2013年 プライムアゲインに転職 -
DecoAlbum という iOSアプリを開発 2015年 独立して現在の会社を設立 - 株式会社ブルームソフト(現在 3名でやっています)
Microsoft Translator APIとは ・Microsoft の Cognitive Service のひとつ ・Cognitive ServiceはAIを活用したMSの提供サービス
他にも、「視覚」「音声」「知識」「言語」「検索」などの種類を提供
Microsoft Translator APIとは MS Translator Speech と MS Translator Text
Speech は 音声データを受信して、翻訳後のデータをテキ ストとして返してくれるAPI Text はテキストデータを受信して、翻訳後のデータをテキ ストとして返してくれるAPI
Microsoft Translator APIとは MS Translator Server Socket通信で音声データ をストリーミング配信 翻訳結果Stringデータとし て返却
しかし・・・ 実装上は正しいが、
MS Translator Server 1秒に1回ずつ断片的な音 声データを送信 最初のレスポンスまで 3~4秒程度かかる… レスポンスが遅いと UXが非常に悪い
そこで、
Apple 社の提供する SFSpeechRecognizer を試してみた
SFSpeechRecognizer とは ・Appple の Siri の技術に使われている音声認識機能 ・それをiOSのSDKから利用できるようになったもの ※iOS では iOS
10.0 以降でのみ利用可能 英語、日本語 他 21もの言語の音声認識に対応
Apple SFSpeechRecognizer + MS Translator Text API Apple Speech Recognizer
Server Socket通信で音声データ をストリーミング配信 音声を話された言語のテ キストとして返却 MS Translator Server 翻訳対象のテキストデー タを送信 翻訳後のデータをテキス トとして返却
Apple SFSpeechRecognizer + MS Translator Text API Apple Speech Recognizer
Server 音声認識のレスポンスは平均 0.5秒 MS Translator Server MSのテキスト翻訳は高速
デモ 簡単にデモをしたいと思います。
結論 MS Translator Speech Apple Speech Recognizer + MS Translator
Text 認識速度 低速(遅いと4秒以上かかる) 高速(UXが非常に良い) 翻訳精度 高い まあまあ (なぜ、Text翻訳の方が精度が低いの かは謎です) メリット ワンストップで音声認識から翻 訳までが行える 認識精度が非常に良く、高速である デメリット 認識精度が悪く、低速である Apple のSpeech Recognizerと別途テキスト翻 訳機能が必要
今後 ・Google 翻訳APIでも試してみたい → Apple よりも速く精度が高い可能性あり? ※ どなたか試した方がいたら教えてください ・双方の利点、欠点があるので、作りたいアプリによって切り替 えると良いかも
以上です ありがとうございました