Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Introduction of LINE's Speech Recognition efforts

Introduction of LINE's Speech Recognition efforts

LINEの音声認識に関する取り組みの紹介資料です。音声認識に応用されているプロダクトや、現在運用しているシステムや、End-to-Endの音声認識システムに関する取り組みを紹介しています。

LINE Developers

June 15, 2021
Tweet

More Decks by LINE Developers

Other Decks in Technology

Transcript

  1. ΧʔϑϩϯςΟΞ༷ ચं༧໿ ࣄྫ̍ ࣄྫ̎ ҿ৯ళ΁ͷདྷళ༧໿ʢ౰೔ʣΛ"J$BMM͕ड෇ ༧໿಺༰͸FCJDB΁ࣗಈొ࿥ ચं༧໿Λ-*/&"J$BMM͕ड෇ ड෇ޙɺ͓٬༷ͷ-*/&ΞΧ΢ϯτ΁ड෇಺༰Λ௨஌ ༧໿ ۭ੮

    ֬ೝ ͦͷଞ ళฮ సૹ FCJDB ༧໿ ొ࿥ ü ௚લͷۭ੮֬ೝͳͲ౰೔༧໿Λళฮʹ୅ΘΓɺ ͢΂ͯ-*/&"J$BMM͕ड෇ɾొ࿥ ü ຬ੮ͷ৔߹ɺ୅ସ༧໿Մೳ࣌ؒ΍ۙྡଞళ΋ఏࣔ ü ελοϑ͸μογϡϘʔυͰ-*/&"J$BMMԠରϩάΛ֬ೝ ձ࿩ ü ࣄલʹ*73ͰৼΓ෼͚͠ɺચं༧໿͸-*/&"J$BMM͕ड෇ɾ ొ࿥ ü ༧໿৘ใΛࣗಈొ࿥͠ɺۭ͖ঢ়گ͸UJNZ΁ଈ࣌൓ө ü ελοϑ͸μογϡϘʔυͰ-*/&"J$BMMԠରϩάΛ֬ೝ 1P$Ͱͷ "*׬਱཰  ΤϏιϧ༷ ҿ৯ళ༧໿ -*/&"J$BMMಋೖࣄྫʢ༧໿ड෇ʣ
  2. NSpeechの技術構成 ⾳声区間 検出 特徴 抽出 認識 認識結果 ⾳響 モデル ⾔語

    モデル 語彙 辞書 ⾳声信号 … 特徴ベクトル列 複数のモジュールを 組み合わせて認識
  3. What is NEST? • NAVER/LINEで共同開発しているEnd-to-End⾳声認識システム ⾳声区間 検出 特徴 抽出 認識

    認識結果 E2E モデル ⾳声信号 … 特徴ベクトル列 単⼀のモデルだけで 認識が可能に︕
  4. NSpeech vs NEST NSpeech NEST 認識対象 定型の短いコマンド ⾃由度の⾼い対話 精度 ⾼い

    ⾮常に⾼い 応答待ち時間 短い ⻑い ハードウェア CPU(低コスト) GPU(⾼コスト) 語彙カスタマイズ 容易 難しい NESTのメリットは⾃由度の⾼い対話⾳声に対する⾼い精度 課題はまだ多いが、技術の進化が 速く解決が⾒込める
  5. Appendix. ⾳声認識チーム責任者の紹介 ⽊⽥祐介 / Yusuke Kida • AI開発室 Speechチーム マネージャー

    • ⾳声技術の研究開発に約15年従事 • 2006.04- 東芝 • 2017.05- ヤフー • 2020.05- LINE