Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Microsoft Translator APIを使ってみた
Search
S-cubism
November 17, 2017
Technology
1
160
Microsoft Translator APIを使ってみた
S-cubism
November 17, 2017
Tweet
Share
More Decks by S-cubism
See All by S-cubism
WSLでreactの開発環境作った話
scubism
0
710
未経験者がAndroidアプリをリリースするまで
scubism
0
130
scubism_LT_20180223_細田謙二_イベントソーシング
scubism
0
160
REVEAL.JSをちょっとだけ使ってみた
scubism
0
270
忙しい人のための仮想通貨
scubism
0
120
サーバ作業の注意コマンド
scubism
0
140
最近勉強してること、次にやりたいこと
scubism
0
110
FOOD TECH
scubism
0
70
Firebase(Realtime Database)について
scubism
0
130
Other Decks in Technology
See All in Technology
Lambdaの常識はどう変わる?!re:Invent 2025 before after
iwatatomoya
1
400
re:Invent2025 コンテナ系アップデート振り返り(+CloudWatchログのアップデート紹介)
masukawa
0
320
【AWS re:Invent 2025速報】AIビルダー向けアップデートをまとめて解説!
minorun365
4
480
大企業でもできる!ボトムアップで拡大させるプラットフォームの作り方
findy_eventslides
1
650
多様なデジタルアイデンティティを攻撃からどうやって守るのか / 20251212
ayokura
0
370
手動から自動へ、そしてその先へ
moritamasami
0
290
Lessons from Migrating to OpenSearch: Shard Design, Log Ingestion, and UI Decisions
sansantech
PRO
1
100
AWS re:Invent 2025で見たGrafana最新機能の紹介
hamadakoji
0
220
文字列の並び順 / Unicode Collation
tmtms
3
380
バグハンター視点によるサプライチェーンの脆弱性
scgajge12
3
1.1k
eBPFとwaruiBPF
sat
PRO
4
2.5k
Overture Maps Foundationの3年を振り返る
moritoru
0
160
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Designing for Performance
lara
610
69k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Balancing Empowerment & Direction
lara
5
790
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
Unsuck your backbone
ammeep
671
58k
GitHub's CSS Performance
jonrohan
1032
470k
Building an army of robots
kneath
306
46k
Reflections from 52 weeks, 52 projects
jeffersonlam
355
21k
A better future with KSS
kneath
240
18k
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
390
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Transcript
Microsoft Translator API を使ってみた (結論: MSさん、もう少し頑張ってください)
まず、はじめに
自己紹介から だいもん かずと 大門 和斗 2012年 新卒としてエスキュービズムに入社 2013年 プライムアゲインに転職 -
DecoAlbum という iOSアプリを開発 2015年 独立して現在の会社を設立 - 株式会社ブルームソフト(現在 3名でやっています)
Microsoft Translator APIとは ・Microsoft の Cognitive Service のひとつ ・Cognitive ServiceはAIを活用したMSの提供サービス
他にも、「視覚」「音声」「知識」「言語」「検索」などの種類を提供
Microsoft Translator APIとは MS Translator Speech と MS Translator Text
Speech は 音声データを受信して、翻訳後のデータをテキ ストとして返してくれるAPI Text はテキストデータを受信して、翻訳後のデータをテキ ストとして返してくれるAPI
Microsoft Translator APIとは MS Translator Server Socket通信で音声データ をストリーミング配信 翻訳結果Stringデータとし て返却
しかし・・・ 実装上は正しいが、
MS Translator Server 1秒に1回ずつ断片的な音 声データを送信 最初のレスポンスまで 3~4秒程度かかる… レスポンスが遅いと UXが非常に悪い
そこで、
Apple 社の提供する SFSpeechRecognizer を試してみた
SFSpeechRecognizer とは ・Appple の Siri の技術に使われている音声認識機能 ・それをiOSのSDKから利用できるようになったもの ※iOS では iOS
10.0 以降でのみ利用可能 英語、日本語 他 21もの言語の音声認識に対応
Apple SFSpeechRecognizer + MS Translator Text API Apple Speech Recognizer
Server Socket通信で音声データ をストリーミング配信 音声を話された言語のテ キストとして返却 MS Translator Server 翻訳対象のテキストデー タを送信 翻訳後のデータをテキス トとして返却
Apple SFSpeechRecognizer + MS Translator Text API Apple Speech Recognizer
Server 音声認識のレスポンスは平均 0.5秒 MS Translator Server MSのテキスト翻訳は高速
デモ 簡単にデモをしたいと思います。
結論 MS Translator Speech Apple Speech Recognizer + MS Translator
Text 認識速度 低速(遅いと4秒以上かかる) 高速(UXが非常に良い) 翻訳精度 高い まあまあ (なぜ、Text翻訳の方が精度が低いの かは謎です) メリット ワンストップで音声認識から翻 訳までが行える 認識精度が非常に良く、高速である デメリット 認識精度が悪く、低速である Apple のSpeech Recognizerと別途テキスト翻 訳機能が必要
今後 ・Google 翻訳APIでも試してみたい → Apple よりも速く精度が高い可能性あり? ※ どなたか試した方がいたら教えてください ・双方の利点、欠点があるので、作りたいアプリによって切り替 えると良いかも
以上です ありがとうございました