SFSpeechRecognizerは音声認識を利用して音声をテキストに変換することができます。
アバター作成・ライブ配信などを楽しめるスマートフォン向けメタバース「REALITY」のiOSアプリでは、
この技術を活用して、視聴者のデバイス上で完結する自動字幕起こし機能を実装しました。
本セッションでは、その過程で直面した課題とその解決方法について共有したいと思います。
紹介トピック
- 自動字幕起こし機能の概要
- SFSpeechRecognizerの実装方法とその制限
- デバイス上で処理できる言語の条件
-----
本スライドは、iOSDC 2024 LTトークで使用したスライドを微調整したものです。
https://fortee.jp/iosdc-japan-2024/proposal/304e58f1-1af9-42a4-8e06-bacd3944b683