Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【iOS】Cloud Speech-To-Textで 音声を動画にした話

Yosei
September 05, 2019

【iOS】Cloud Speech-To-Textで 音声を動画にした話

# 説明
Radiotalkは、音声配信プラットフォームで、誰でもラジオのようにトークを配信することができます。
最近、ワイヤレスイヤホンが普及などもあり、音声が注目されるようになってきました。
しかし、音声は、以下のような再生までのハードルが高い課題がありました。
・環境によっては今すぐ再生できない(音を出せる環境、ヘッドホンしているかなど)
・再生するトークを選ぶ際に、タイトルや詳細、画像などでしか判断できない(トークのテンションや声などは判断できない)

その課題を解決するために、音声の一部を書き起こして、テロップ動画でシェアできる機能を作成しました。
音声から動画を作成するまでの話と作り方をお話したいと思います。

## 発表内容
・開発の流れ
 ・なぜ音声を動画にすることになったのか
・実装の一連の流れ
 ・音声トリミング方法
 ・音声の解析方法
  ・GoogleSpeechToTextなぜ採用したか
  ・GoogleSpeechToTextの仕様
  ・GoogleSpeechToText精度
 ・テロップ動画作成エディタのUI/UX
 ・静止画動画作成方法
 ・音声と動画の合成方法

【iOSDC2019プロポーザル】
iOSDC2019で採択された内容です。
https://fortee.jp/iosdc-japan-2019/proposal/1c01507d-2dd5-48d8-bcd0-9898e09d3916

Yosei

September 05, 2019
Tweet

More Decks by Yosei

Other Decks in Technology

Transcript