Slide 49
Slide 49 text
49/61
WhisperXを使って分割
◆WhisperX
◼
文字単位のタイムスタンプを取得できる
◼
文章の分割に合わせて音声を切り出せる
◼
音声分割の精度が上がる > 利用できるデータを増やせた
◆ただし不具合あり
◼
タイムスタンプと音声のタイミングが不一致
◼
試した時点の情報なので現在は解決されているかも
{'text': 'お', 'start': 0.10, 'end': 0.12}
{'text': 'は', 'start': 0.30, 'end': 0.32}
{'text': 'よ', 'start': 0.44, 'end': 0.52}
{'text': 'う', 'start': 0.72, 'end': 0.82}