Slide 8
Slide 8 text
Cloud Text-to-Speech
API
Cloud Speech-to-Text
API
学習済みAI (人工知能) サービス : Speech To Text 比較 ( 音声 → テキスト ) スペック比較
サービス名
対応言語
( 1人 / 複数人 / ストリーミング ) ※1
プログラミング言語
開発ドキュメント
( 日本語対応 )
Speech to Text Amazon Transcribe Cloud Speech-to-Text API
カスタム語彙
( カスタマイズ可能かどうか )
31 / 記載なし / 6
39 / 2 / 記載なし 120 / 記載なし / 記載なし
○
特徴
https://docs.microsoft.com/ja-jp/azure/
cognitive-services/speech-service/speech-to-text
・発話言語特定(4言語)
・シーンに応じて複数モデル選択可
Java, Python + (※CLI)
C++, C#, Java, Javascript, Node.js
Objective-C, Python, Swift
C#, Go, Node.js, JAVA
PHP, Python, RUBY + (※CLI)
○
・種類豊富なSDK/クイックスタート
・明瞭なサービスの切り分け
https://docs.aws.amazon.com/transcribe
/latest/dg/what-is-transcribe.html
https://cloud.google.com/
products/ai/building-blocks/
・話者識別 (2~10名) が可能
・医療業界に特化した認識モデルがある
○
※1 同一言語、他方言含む。
© 2019 Kobe Digital Labo, Inc. All Rights Reserved.