Upgrade to Pro — share decks privately, control downloads, hide ads and more …

独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化 / Fast online algorithms for independent vector analysis

独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化 / Fast online algorithms for independent vector analysis

日本音響学会2023年春季研究発表会

Taishi Nakashima

March 17, 2023
Tweet

More Decks by Taishi Nakashima

Other Decks in Research

Transcript

  1. 独立ベクトル分析によるオンライン音源分離・追跡のための高速最適化
    日本音響学会 2023 年春季研究発表会 3-1-6
    ◎中嶋 大志 1,2 池下 林太郎 3 小野 順貴 1 荒木 章子 3 中谷 智広 3
    1 東京都立大学大学院 システムデザイン研究科 情報科学域 博士後期課程 2 年
    2 日本学術振興会 特別研究員 (DC1)
    3 NTT コミュニケーション基礎科学研究所
    2023 年 3 月 17 日

    View full-size slide

  2. 研究背景
    1/12
    オンライン音源分離
    • 複数の音源が混合した信号から逐次的に個別の信号を推定する技術
    ෼཭৴߸
    ؍ଌ৴߸
    ϒϥΠϯυ
    Իݯ෼཭

    ϑϨʔϜ ϑϨʔϜ

    View full-size slide

  3. 研究背景
    1/12
    オンライン音源分離
    • 複数の音源が混合した信号から逐次的に個別の信号を推定する技術
    ෼཭৴߸
    ؍ଌ৴߸
    ϒϥΠϯυ
    Իݯ෼཭

    ϑϨʔϜ ϑϨʔϜ

    • 独立ベクトル分析 (IVA) [Kim+2006,Hiroe2006] のオンラインアルゴリズム
    ∘ オンライン自然勾配降下法 [Kim2010]
    ∘ オンライン補助関数型 IVA(オンライン AuxIVA) [Taniguchi+2014]
    � 安定かつ収束が速い

    View full-size slide

  4. オンライン AuxIVA [Taniguchi+2014]
    2/12
    • 分離行列の最適化
    min. ∑
    𝑘
    推定
    𝒘H
    𝑘,𝑡
    𝑉𝑘,𝑡
    推定
    𝒘𝑘,𝑡
    − log|det
    推定
    𝑊𝑡
    |2
    � 共分散行列の逐次更新
    𝑉𝑘,𝑡

    忘却係数
    𝛼
    過去の共分散
    𝑉𝑘,𝑡−1
    + (1 − 𝛼)
    重み
    𝜑(𝑟𝑘,𝑡
    )
    現在の観測信号
    𝒙𝑡
    𝒙H
    𝑡
    � バッチ AuxIVA [Ono2011] の分離行列最適化手法をそのまま適用可能
    ∘ Iterative projection (IP) [Ono2011] � Online IP [Taniguchi+2014]
    ∘ Iterative source steering (ISS) [Scheibler&Ono2020] � Online ISS [Nakashima&Ono2022]

    View full-size slide

  5. オンライン AuxIVA [Taniguchi+2014]
    2/12
    • 分離行列の最適化
    min. ∑
    𝑘
    推定
    𝒘H
    𝑘,𝑡
    𝑉𝑘,𝑡
    推定
    𝒘𝑘,𝑡
    − log|det
    推定
    𝑊𝑡
    |2
    � 共分散行列の逐次更新
    𝑉𝑘,𝑡

    忘却係数
    𝛼
    過去の共分散
    𝑉𝑘,𝑡−1
    + (1 − 𝛼)
    重み
    𝜑(𝑟𝑘,𝑡
    )
    現在の観測信号
    𝒙𝑡
    𝒙H
    𝑡
    � バッチ AuxIVA [Ono2011] の分離行列最適化手法をそのまま適用可能
    ∘ Iterative projection (IP) [Ono2011] � Online IP [Taniguchi+2014]
    ∘ Iterative source steering (ISS) [Scheibler&Ono2020] � Online ISS [Nakashima&Ono2022]

    View full-size slide

  6. オンライン AuxIVA [Taniguchi+2014]
    2/12
    • 分離行列の最適化
    min. ∑
    𝑘
    𝒘H
    𝑘,𝑡
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡
    − log|det 𝑊𝑡
    |2
    � 共分散行列の逐次更新
    � 計算量が大きい � 問題を制限
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    � バッチ AuxIVA [Ono2011] の分離行列最適化手法をそのまま適用可能
    ∘ Iterative projection (IP) [Ono2011] � Online IP [Taniguchi+2014]
    ∘ Iterative source steering (ISS) [Scheibler&Ono2020] � Online ISS [Nakashima&Ono2022]

    View full-size slide

  7. 本研究の成果: 1 音源追跡問題に対する Online ISS の高速化
    3/12
    1 音源追跡
    1 個のみの音源が移動する状況でそのステアリングベクトル 𝒂
    移動音源のインデクス
    ℓ,𝑡
    を推定する問題

    View full-size slide

  8. 本研究の成果: 1 音源追跡問題に対する Online ISS の高速化
    3/12
    1 音源追跡
    1 個のみの音源が移動する状況でそのステアリングベクトル 𝒂
    移動音源のインデクス
    ℓ,𝑡
    を推定する問題
    1 周波数・1 フレームあたりの分離行列更新に必要な計算量
    手法 𝒚𝑡
    の計算 𝒂ℓ,𝑡
    の更新
    理論限界 𝑂(
    音源数
    𝐾2) 𝑂(𝐾)
    Online IP/ISS 𝑂(𝐾2) 後述
    𝑂(𝐾3)

    View full-size slide

  9. 本研究の成果: 1 音源追跡問題に対する Online ISS の高速化
    3/12
    1 音源追跡
    1 個のみの音源が移動する状況でそのステアリングベクトル 𝒂
    移動音源のインデクス
    ℓ,𝑡
    を推定する問題
    1 周波数・1 フレームあたりの分離行列更新に必要な計算量
    手法 𝒚𝑡
    の計算 𝒂ℓ,𝑡
    の更新
    理論限界 𝑂(
    音源数
    𝐾2) 𝑂(𝐾)
    Online IP/ISS 𝑂(𝐾2) 後述
    𝑂(𝐾3)
    Online source steering(OSS) 🆕 𝑂(𝐾2) 𝑂(𝐾2)
    FastOSS 🆕 𝑂(𝐾2) 𝑂(𝐾)
    � 提案手法 FastOSS は 1 音源追跡における理論限界を達成

    View full-size slide

  10. 1 音源追跡における Online IP と Online ISS の違い
    4/12
    Online IP
    分離ベクトル 𝒘𝑘,𝑡
    を更新
    � 毎フレームですべての分離ベクトル
    𝒘1,𝑡
    , … , 𝒘𝐾,𝑡
    の更新が必要
    � 1 音源追跡に不適

    View full-size slide

  11. 1 音源追跡における Online IP と Online ISS の違い
    4/12
    Online IP
    分離ベクトル 𝒘𝑘,𝑡
    を更新
    � 毎フレームですべての分離ベクトル
    𝒘1,𝑡
    , … , 𝒘𝐾,𝑡
    の更新が必要
    � 1 音源追跡に不適

    View full-size slide

  12. 1 音源追跡における Online IP と Online ISS の違い
    4/12
    Online IP
    分離ベクトル 𝒘𝑘,𝑡
    を更新
    � 毎フレームですべての分離ベクトル
    𝒘1,𝑡
    , … , 𝒘𝐾,𝑡
    の更新が必要
    � 1 音源追跡に不適

    View full-size slide

  13. 1 音源追跡における Online IP と Online ISS の違い
    4/12
    Online IP
    分離ベクトル 𝒘𝑘,𝑡
    を更新
    � 毎フレームですべての分離ベクトル
    𝒘1,𝑡
    , … , 𝒘𝐾,𝑡
    の更新が必要
    � 1 音源追跡に不適

    View full-size slide

  14. 1 音源追跡における Online IP と Online ISS の違い
    4/12
    Online IP
    分離ベクトル 𝒘𝑘,𝑡
    を更新
    � 毎フレームですべての分離ベクトル
    𝒘1,𝑡
    , … , 𝒘𝐾,𝑡
    の更新が必要
    � 1 音源追跡に不適

    View full-size slide

  15. 1 音源追跡における Online IP と Online ISS の違い
    4/12
    Online IP
    分離ベクトル 𝒘𝑘,𝑡
    を更新
    � 毎フレームですべての分離ベクトル
    𝒘1,𝑡
    , … , 𝒘𝐾,𝑡
    の更新が必要
    � 1 音源追跡に不適

    View full-size slide

  16. 1 音源追跡における Online IP と Online ISS の違い
    4/12
    Online IP
    分離ベクトル 𝒘𝑘,𝑡
    を更新
    � 毎フレームですべての分離ベクトル
    𝒘1,𝑡
    , … , 𝒘𝐾,𝑡
    の更新が必要
    � 1 音源追跡に不適

    View full-size slide

  17. 1 音源追跡における Online IP と Online ISS の違い
    4/12
    Online IP
    分離ベクトル 𝒘𝑘,𝑡
    を更新
    � 毎フレームですべての分離ベクトル
    𝒘1,𝑡
    , … , 𝒘𝐾,𝑡
    の更新が必要
    � 1 音源追跡に不適
    Online ISS
    ステアリングベクトル 𝒂𝑘,𝑡
    を更新
    � 移動音源のステアリングベクトル
    𝒂ℓ,𝑡
    だけを狙って更新可能(後述)
    � 1 音源追跡に好適 [Nakashima&Ono2022]

    View full-size slide

  18. 従来手法 Online ISS を用いた 1 音源追跡
    5/12
    ISS の性質 [Scheibler&Ono2020]
    ステアリングベクトル 𝒂ℓ,𝑡
    の更新と分離行列 𝑊𝑡
    の行基本変形が等価
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    𝐺𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    𝒘𝑘,𝑡
    ← {
    𝒘𝑘,𝑡−1
    − 𝑔𝑘,𝑡
    𝐺𝑘,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 ≠ ℓ)
    𝐺−1/2
    ℓ,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 = ℓ)

    View full-size slide

  19. 従来手法 Online ISS を用いた 1 音源追跡
    5/12
    ISS の性質 [Scheibler&Ono2020]
    ステアリングベクトル 𝒂ℓ,𝑡
    の更新と分離行列 𝑊𝑡
    の行基本変形が等価
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    𝐺𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    𝒘𝑘,𝑡
    ← {
    𝒘𝑘,𝑡−1
    − 𝑔𝑘,𝑡
    𝐺𝑘,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 ≠ ℓ)
    𝐺−1/2
    ℓ,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 = ℓ)
    Online ISS の課題
    すべての音源に対する共分散行列 𝑉𝑘,𝑡
    の更新に 𝑂(𝐾3) の計算量が必要

    View full-size slide

  20. 従来手法 Online ISS を用いた 1 音源追跡
    5/12
    ISS の性質 [Scheibler&Ono2020]
    ステアリングベクトル 𝒂ℓ,𝑡
    の更新と分離行列 𝑊𝑡
    の行基本変形が等価
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    𝐺𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    𝒘𝑘,𝑡
    ← {
    𝒘𝑘,𝑡−1
    − 𝑔𝑘,𝑡
    𝐺𝑘,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 ≠ ℓ)
    𝐺−1/2
    ℓ,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 = ℓ)
    Online ISS の課題
    すべての音源に対する共分散行列 𝑉𝑘,𝑡
    の更新に 𝑂(𝐾3) の計算量が必要
    � 𝑔𝑘,𝑡
    , 𝐺𝑘,𝑡
    の漸化式を解いて 𝑉𝑘,𝑡
    を消去

    View full-size slide

  21. 提案手法の導出
    6/12
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    = 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    𝐺𝑘,𝑡
    = 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1

    View full-size slide

  22. 提案手法の導出
    6/12
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    = 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    = 𝒘H
    ℓ,𝑡−1
    (𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    ) 𝒘𝑘,𝑡−1
    𝐺𝑘,𝑡
    = 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    = 𝒘H
    ℓ,𝑡−1
    (𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    ) 𝒘ℓ,𝑡−1

    View full-size slide

  23. 提案手法の導出
    6/12
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    = 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    = 𝒘H
    ℓ,𝑡−1
    (𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    ) 𝒘𝑘,𝑡−1
    = 𝛼
    → 0(割愛)
    𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡−1
    𝒘𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )
    ≔ ̂
    𝑦ℓ,𝑡
    (𝒘H
    ℓ,𝑡−1
    𝒙𝑡
    )
    ≔ ̂
    𝑦∗
    𝑘,𝑡
    (𝒙H
    𝑡
    𝒘𝑘,𝑡−1
    )
    𝐺𝑘,𝑡
    = 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    = 𝒘H
    ℓ,𝑡−1
    (𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    ) 𝒘ℓ,𝑡−1
    = 𝛼
    → 𝐺𝑘,𝑡−1
    𝐺ℓ,𝑡−1
    (割愛)
    𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡−1
    𝒘ℓ,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )
    ≔ ̂
    𝑦ℓ,𝑡
    (𝒘H
    ℓ,𝑡−1
    𝒙𝑡
    )
    ≔ ̂
    𝑦∗
    ℓ,𝑡
    (𝒙H
    𝑡
    𝒘ℓ,𝑡−1
    )

    View full-size slide

  24. 提案手法の導出
    6/12
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    = 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    = 𝒘H
    ℓ,𝑡−1
    (𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    ) 𝒘𝑘,𝑡−1
    = 𝛼𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡−1
    𝒘𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )
    ≔ ̂
    𝑦ℓ,𝑡
    (𝒘H
    ℓ,𝑡−1
    𝒙𝑡
    )
    ≔ ̂
    𝑦∗
    𝑘,𝑡
    (𝒙H
    𝑡
    𝒘𝑘,𝑡−1
    )
    = (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    ) ̂
    𝑦ℓ,𝑡
    ̂
    𝑦∗
    𝑘,𝑡
    𝐺𝑘,𝑡
    = 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    = 𝒘H
    ℓ,𝑡−1
    (𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    ) 𝒘ℓ,𝑡−1
    = 𝛼𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡−1
    𝒘ℓ,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )
    ≔ ̂
    𝑦ℓ,𝑡
    (𝒘H
    ℓ,𝑡−1
    𝒙𝑡
    )
    ≔ ̂
    𝑦∗
    ℓ,𝑡
    (𝒙H
    𝑡
    𝒘ℓ,𝑡−1
    )
    = 𝛼𝐺𝑘,𝑡−1
    𝐺ℓ,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )| ̂
    𝑦ℓ,𝑡
    |2

    View full-size slide

  25. 提案手法 1: Online source steering (OSS) 7/12
    Online ISS(従来手法)
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    � ボトルネック
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    𝐺𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    𝒘𝑘,𝑡
    ← {
    𝒘𝑘,𝑡−1
    − 𝑔𝑘,𝑡
    𝐺𝑘,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 ≠ ℓ)
    𝐺−1/2
    ℓ,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 = ℓ)
    � 𝑉𝑘,𝑡
    の更新: 𝑂(𝐾2)
    � 𝑔𝑘,𝑡
    , 𝐺𝑘,𝑡
    の更新: 𝑂(𝐾2)
    � 全体の計算量: 𝑂(𝐾3)

    View full-size slide

  26. 提案手法 1: Online source steering (OSS) 7/12
    Online ISS(従来手法)
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    � ボトルネック
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    𝐺𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    𝒘𝑘,𝑡
    ← {
    𝒘𝑘,𝑡−1
    − 𝑔𝑘,𝑡
    𝐺𝑘,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 ≠ ℓ)
    𝐺−1/2
    ℓ,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 = ℓ)
    � 𝑉𝑘,𝑡
    の更新: 𝑂(𝐾2)
    � 𝑔𝑘,𝑡
    , 𝐺𝑘,𝑡
    の更新: 𝑂(𝐾2)
    � 全体の計算量: 𝑂(𝐾3)
    Online source steering (OSS)
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    ← (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    ) ̂
    𝑦𝑘,𝑡
    ̂
    𝑦∗
    ℓ,𝑡
    𝐺𝑘,𝑡
    ← 𝛼
    𝐺𝑘,𝑡−1
    𝐺ℓ,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )| ̂
    𝑦ℓ,𝑡
    |2
    𝒘𝑘,𝑡
    ← {
    𝒘𝑘,𝑡−1
    − 𝑔𝑘,𝑡
    𝐺𝑘,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 ≠ ℓ)
    𝐺−1/2
    ℓ,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 = ℓ)
    � 𝑉𝑘,𝑡
    の更新: なし
    � 𝑔𝑘,𝑡
    , 𝐺𝑘,𝑡
    の更新: 𝑂(1)
    🤔 全体の計算量: 𝑂(𝐾2)

    View full-size slide

  27. 提案手法 1: Online source steering (OSS) 7/12
    Online ISS(従来手法)
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    � ボトルネック
    𝑉𝑘,𝑡
    𝒘𝑘,𝑡−1
    𝐺𝑘,𝑡
    ← 𝒘H
    ℓ,𝑡−1
    𝑉𝑘,𝑡
    𝒘ℓ,𝑡−1
    𝒘𝑘,𝑡
    ← {
    𝒘𝑘,𝑡−1
    − 𝑔𝑘,𝑡
    𝐺𝑘,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 ≠ ℓ)
    𝐺−1/2
    ℓ,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 = ℓ)
    � 𝑉𝑘,𝑡
    の更新: 𝑂(𝐾2)
    � 𝑔𝑘,𝑡
    , 𝐺𝑘,𝑡
    の更新: 𝑂(𝐾2)
    � 全体の計算量: 𝑂(𝐾3)
    Online source steering (OSS)
    𝑉𝑘,𝑡
    ← 𝛼𝑉𝑘,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )𝒙𝑡
    𝒙H
    𝑡
    𝑔𝑘,𝑡
    ← (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    ) ̂
    𝑦𝑘,𝑡
    ̂
    𝑦∗
    ℓ,𝑡
    𝐺𝑘,𝑡
    ← 𝛼
    𝐺𝑘,𝑡−1
    𝐺ℓ,𝑡−1
    + (1 − 𝛼)𝜑(𝑟𝑘,𝑡
    )| ̂
    𝑦ℓ,𝑡
    |2
    𝒘𝑘,𝑡

    1 音源あたり 𝑂(𝐾)
    処理全体で 𝑂(𝐾2)
    {
    𝒘𝑘,𝑡−1
    − 𝑔𝑘,𝑡
    𝐺𝑘,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 ≠ ℓ)
    𝐺−1/2
    ℓ,𝑡
    𝒘ℓ,𝑡−1
    (𝑘 = ℓ)
    � 𝑉𝑘,𝑡
    の更新: なし
    � 𝑔𝑘,𝑡
    , 𝐺𝑘,𝑡
    の更新: 𝑂(1)
    🤔 全体の計算量: 𝑂(𝐾2) � 高速化

    View full-size slide

  28. 提案手法 2: FastOSS 8/12
    • 方法: 分離行列の乗算更新を用いた OSS の再定義
    𝑊𝑡
    = 𝑄𝑡
    𝑊𝑡−1
    = 𝑄𝑡
    𝑄𝑡−1
    𝑊𝑡−2

    = (𝑄𝑡
    𝑄𝑡−1
    ⋯ 𝑄𝑇′+1
    )𝑊
    目的音源の移動時刻
    𝑇′
    ≕ ̃
    𝑄𝑡
    𝑊𝑇′

    View full-size slide

  29. 提案手法 2: FastOSS 8/12
    • 方法: 分離行列の乗算更新を用いた OSS の再定義
    𝑊𝑡
    = 𝑄𝑡
    𝑊𝑡−1
    = 𝑄𝑡
    𝑄𝑡−1
    𝑊𝑡−2

    = (𝑄𝑡
    𝑄𝑡−1
    ⋯ 𝑄𝑇′+1
    )𝑊
    目的音源の移動時刻
    𝑇′
    ≕ ̃
    𝑄𝑡
    𝑊𝑇′
    • 𝑄𝑡
    の 1 列だけを更新
    � 𝐾 個のパラメータだけ更新すればよいので 𝑂(𝐾) で更新可能
    � 𝑄𝑡
    𝑄𝑡−1
    も 𝑂(𝐾) で更新可能
    � 1 音源追跡の理論限界!
    � ただし 𝒚𝑡
    = 𝑊𝑡
    𝒙𝑡
    が避けられないため処理全体では 𝑂(𝐾2)

    View full-size slide

  30. 実験条件
    9/12
    マイク・音源配置
    1
    2
    3
    4
    40
    6.0 m
    4.0 m
    Height = 2.75 m
    Mic.
    Fixed
    Moving
    • 音源・マイク数: 4
    • 残響時間: 約 300 ms
    � 音源 4 は瞬間的に移動

    View full-size slide

  31. 実験条件
    9/12
    マイク・音源配置
    1
    2
    3
    4
    40
    6.0 m
    4.0 m
    Height = 2.75 m
    Mic.
    Fixed
    Moving
    • 音源・マイク数: 4
    • 残響時間: 約 300 ms
    � 音源 4 は瞬間的に移動
    比較手法
    • Online IP
    • Online ISS
    🆕 OSS
    🆕 FastOSS
    注意
    � Online ISS, OSS, FastOSS は
    等価な更新を異なる計算方法で実現
    � いつ・どの音源が移動したかは既知

    View full-size slide

  32. 分離性能
    10/12


    4PVSDF
    044 0OMJOF *1
    4PVSDF

    5JNF T



    4PVSDF

    5JNF T

    4PVSDF
    4%3 JNQSPWFNFOUT E#

    View full-size slide

  33. 分離性能
    10/12


    4PVSDF 4PVSDF

    5JNF T



    4PVSDF

    5JNF T

    4PVSDF
    4%3 JNQSPWFNFOUT E#

    ԻݯͷҠಈલ
    0OMJOF*1Ͱ෼཭ߦྻΛߋ৽

    View full-size slide

  34. 分離性能
    10/12


    4PVSDF 4PVSDF

    5JNF T



    4PVSDF

    5JNF T

    4PVSDF
    4%3 JNQSPWFNFOUT E#

    Իݯ͕Ҡಈ
    0OMJOF*1Ͱߋ৽ͨ͠
    ෼཭ߦྻΛॳظ஋ͱͯ͠Իݯ௥੻

    View full-size slide

  35. 分離性能
    10/12


    4PVSDF
    044 0OMJOF *1
    4PVSDF

    5JNF T



    4PVSDF

    5JNF T

    4PVSDF
    4%3 JNQSPWFNFOUT E#

    � OSS はステアリングベクトルを 1 個更新するだけで
    分離行列全体を更新する Online IP に接近した性能

    View full-size slide

  36. 30 秒の信号に対する実行時間
    11/12

    5IF OVNCFS PG DIBOOFMT





    3VOUJNF T











    *Run on AMD EPYC 7643 48-core [email protected] GHz
    .FUIPE
    'BTU044
    044
    0OMJOF *44
    0OMJOF *1
    • 音源数を 3,4,5,6 と変化させ実行時間を計測
    � OSS はすべての条件で従来手法よりも 3 倍以上高速

    View full-size slide

  37. 30 秒の信号に対する実行時間
    11/12

    5IF OVNCFS PG DIBOOFMT





    3VOUJNF T











    *Run on AMD EPYC 7643 48-core [email protected] GHz
    .FUIPE
    'BTU044
    044
    0OMJOF *44
    0OMJOF *1
    • 音源数を 3,4,5,6 と変化させ実行時間を計測
    � OSS はすべての条件で従来手法よりも 3 倍以上高速

    View full-size slide

  38. おわりに
    12/12
    本発表のまとめ
    • 1 音源追跡: 1 個の音源のみが移動する状況の音源分離
    • 1 音源追跡のための高速なステアリングベクトル更新 OSS, FastOSS の提案

    View full-size slide

  39. おわりに
    12/12
    本発表のまとめ
    • 1 音源追跡: 1 個の音源のみが移動する状況の音源分離
    • 1 音源追跡のための高速なステアリングベクトル更新 OSS, FastOSS の提案
    手法 𝒚𝑡
    の計算 𝒂ℓ,𝑡
    の更新
    理論限界 𝑂(𝐾2) 𝑂(𝐾)
    Online IP/ISS 𝑂(𝐾2) 𝑂(𝐾3)
    OSS 🆕 𝑂(𝐾2) 𝑂(𝐾2)
    FastOSS 🆕 𝑂(𝐾2) �
    (ほぼ)理論限界を達成!
    𝑂(𝐾)

    View full-size slide

  40. おわりに
    12/12
    本発表のまとめ
    • 1 音源追跡: 1 個の音源のみが移動する状況の音源分離
    • 1 音源追跡のための高速なステアリングベクトル更新 OSS, FastOSS の提案
    手法 𝒚𝑡
    の計算 𝒂ℓ,𝑡
    の更新
    理論限界 𝑂(𝐾2) 𝑂(𝐾)
    Online IP/ISS 𝑂(𝐾2) 𝑂(𝐾3)
    OSS 🆕 𝑂(𝐾2) 𝑂(𝐾2)
    FastOSS 🆕 𝑂(𝐾2) �
    (ほぼ)理論限界を達成!
    𝑂(𝐾)
    今後の課題
    • 2 音源追跡のための OSS, FastOSS の提案(投稿準備中)

    View full-size slide

  41. 参考文献
    [Hiroe2006] A. Hiroe, “Solution of permutation problem in frequency domain ICA, using multivariate
    probability density functions,” in Proc. ICA, pp. 601–608, Mar. 2006.
    [Kim+2006] T. Kim, H. T. Attias, S.-Y. Lee, and T.-W. Lee, “Blind source separation exploiting higher-order
    frequency dependencies,” IEEE/ACM Trans. Audio, Speech, Language Process., vol. 15, no. 1,
    pp. 70–79, Jan. 2006.
    [Kim2010] T. Kim, “Real-time independent vector analysis for convolutive blind source separation,”
    IEEE Trans. Circuits Syst. I, vol. 57, no. 7, pp. 1431–1438, 2010.
    [Nakashima&Ono2022] T. Nakashima and N. Ono, “Inverse-free online independent vector analysis with flexible
    iterative source steering,” in Proc. APSIPA, pp. 750–754, Nov. 2022.
    [Ono2011] N. Ono, “Stable and fast update rules for independent vector analysis based on auxiliary
    function technique,” in Proc. WASPAA, pp. 189–192, Oct. 2011.
    [Scheibler&Ono2020] R. Scheibler and N. Ono, “Fast and stable blind source separation with rank-1 updates,” in
    Proc. ICASSP, pp. 236–240, 2020.
    [Taniguchi+2014] T. Taniguchi, N. Ono, A. Kawamura, and S. Sagayama, “An auxiliary-function approach to
    online independent vector analysis for real-time blind source separation,” in Proc. HSCMA,
    pp. 107–111, May 2014.

    View full-size slide