Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Microsoft Translator APIを使ってみた
Search
S-cubism
November 17, 2017
Technology
1
160
Microsoft Translator APIを使ってみた
S-cubism
November 17, 2017
Tweet
Share
More Decks by S-cubism
See All by S-cubism
WSLでreactの開発環境作った話
scubism
0
710
未経験者がAndroidアプリをリリースするまで
scubism
0
140
scubism_LT_20180223_細田謙二_イベントソーシング
scubism
0
160
REVEAL.JSをちょっとだけ使ってみた
scubism
0
270
忙しい人のための仮想通貨
scubism
0
120
サーバ作業の注意コマンド
scubism
0
140
最近勉強してること、次にやりたいこと
scubism
0
110
FOOD TECH
scubism
0
70
Firebase(Realtime Database)について
scubism
0
130
Other Decks in Technology
See All in Technology
CDKで始めるTypeScript開発のススメ
tsukuboshi
1
500
What happened to RubyGems and what can we learn?
mikemcquaid
0
310
Bill One 開発エンジニア 紹介資料
sansan33
PRO
5
17k
コミュニティが変えるキャリアの地平線:コロナ禍新卒入社のエンジニアがAWSコミュニティで見つけた成長の羅針盤
kentosuzuki
0
130
AI駆動開発を事業のコアに置く
tasukuonizawa
1
300
SREチームをどう作り、どう育てるか ― Findy横断SREのマネジメント
rvirus0817
0
320
Tebiki Engineering Team Deck
tebiki
0
24k
仕様書駆動AI開発の実践: Issue→Skill→PRテンプレで 再現性を作る
knishioka
2
680
Why Organizations Fail: ノーベル経済学賞「国家はなぜ衰退するのか」から考えるアジャイル組織論
kawaguti
PRO
1
140
ファインディの横断SREがTakumi byGMOと取り組む、セキュリティと開発スピードの両立
rvirus0817
1
1.5k
Codex 5.3 と Opus 4.6 にコーポレートサイトを作らせてみた / Codex 5.3 vs Opus 4.6
ama_ch
0
190
FinTech SREのAWSサービス活用/Leveraging AWS Services in FinTech SRE
maaaato
0
130
Featured
See All Featured
How to train your dragon (web standard)
notwaldorf
97
6.5k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
62
Ethics towards AI in product and experience design
skipperchong
2
200
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
230
Statistics for Hackers
jakevdp
799
230k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
The SEO Collaboration Effect
kristinabergwall1
0
350
How to Think Like a Performance Engineer
csswizardry
28
2.4k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.6k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
120
Transcript
Microsoft Translator API を使ってみた (結論: MSさん、もう少し頑張ってください)
まず、はじめに
自己紹介から だいもん かずと 大門 和斗 2012年 新卒としてエスキュービズムに入社 2013年 プライムアゲインに転職 -
DecoAlbum という iOSアプリを開発 2015年 独立して現在の会社を設立 - 株式会社ブルームソフト(現在 3名でやっています)
Microsoft Translator APIとは ・Microsoft の Cognitive Service のひとつ ・Cognitive ServiceはAIを活用したMSの提供サービス
他にも、「視覚」「音声」「知識」「言語」「検索」などの種類を提供
Microsoft Translator APIとは MS Translator Speech と MS Translator Text
Speech は 音声データを受信して、翻訳後のデータをテキ ストとして返してくれるAPI Text はテキストデータを受信して、翻訳後のデータをテキ ストとして返してくれるAPI
Microsoft Translator APIとは MS Translator Server Socket通信で音声データ をストリーミング配信 翻訳結果Stringデータとし て返却
しかし・・・ 実装上は正しいが、
MS Translator Server 1秒に1回ずつ断片的な音 声データを送信 最初のレスポンスまで 3~4秒程度かかる… レスポンスが遅いと UXが非常に悪い
そこで、
Apple 社の提供する SFSpeechRecognizer を試してみた
SFSpeechRecognizer とは ・Appple の Siri の技術に使われている音声認識機能 ・それをiOSのSDKから利用できるようになったもの ※iOS では iOS
10.0 以降でのみ利用可能 英語、日本語 他 21もの言語の音声認識に対応
Apple SFSpeechRecognizer + MS Translator Text API Apple Speech Recognizer
Server Socket通信で音声データ をストリーミング配信 音声を話された言語のテ キストとして返却 MS Translator Server 翻訳対象のテキストデー タを送信 翻訳後のデータをテキス トとして返却
Apple SFSpeechRecognizer + MS Translator Text API Apple Speech Recognizer
Server 音声認識のレスポンスは平均 0.5秒 MS Translator Server MSのテキスト翻訳は高速
デモ 簡単にデモをしたいと思います。
結論 MS Translator Speech Apple Speech Recognizer + MS Translator
Text 認識速度 低速(遅いと4秒以上かかる) 高速(UXが非常に良い) 翻訳精度 高い まあまあ (なぜ、Text翻訳の方が精度が低いの かは謎です) メリット ワンストップで音声認識から翻 訳までが行える 認識精度が非常に良く、高速である デメリット 認識精度が悪く、低速である Apple のSpeech Recognizerと別途テキスト翻 訳機能が必要
今後 ・Google 翻訳APIでも試してみたい → Apple よりも速く精度が高い可能性あり? ※ どなたか試した方がいたら教えてください ・双方の利点、欠点があるので、作りたいアプリによって切り替 えると良いかも
以上です ありがとうございました