Slide 7
Slide 7 text
発話区間検出の要素技術
発話/⾮発話判定
概要 ⼿法(⼀例)
背景雑⾳と⼈間の発話が混ざった
信号から, ⼈間の発話が含まれてい
る区間のみを発話区間として判定
• Spectral Entropy
• Long-Term Spectral Divergence
• Periodic Component to
Aperiodic Component Ratio
• ⾳声モデル(GMM等)
ノイズ推定/
トラッキング
ノイズ除去/
⾳声強調
環境ノイズの変化や, ⾮定常的な雑
⾳に対する頑健性を担保するため
に, ⼈間の発話と背景雑⾳が混ざっ
た⼊⼒信号から, 変化する背景雑⾳
をリアルタイムに推定
推定した雑⾳の情報を元に, 背景雑
⾳と⼈間の発話が混ざった信号か
ら, ⼈間の発話を抽出・強調する技
術
• Minimum Statistics
• VAD Based (Soft / Hard
Decision) Estimator
• MMSE based Estimator
• Spectrum Subtraction
• Wiener filtering
• MMSE-STSA
• Joint-Map
• Beamforming(マイクアレイ)