Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Search
Shoichi Koyama
September 09, 2021
Research
0
180
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Presentation slides for ASJ2021A.
Shoichi Koyama
September 09, 2021
Tweet
Share
More Decks by Shoichi Koyama
See All by Shoichi Koyama
Weighted Pressure Matching Based on Kernel Interpolation for Sound Field Reproduction
sh01k
0
210
Binaural reproduction from multiple microphone arrays
sh01k
0
160
Sound Field Reproduction With Weighted Mode Matching and Infinite-Dimensional Harmonic Analysis: An Experimental Evaluation
sh01k
0
200
[ASJ2020A: 2.1.15] 音場制御におけるスピーカ・制御点配置最適化法の比較評価
sh01k
0
290
Other Decks in Research
See All in Research
Weekly AI Agents News! 11月号 プロダクト/ニュースのアーカイブ
masatoto
0
300
コーパスを丸呑みしたモデルから言語の何がわかるか
eumesy
PRO
7
2.2k
大規模言語モデルを用いたニュースデータのセンチメント判定モデルの開発および実体経済センチメントインデックスの構成
nomamist
0
110
Composed image retrieval for remote sensing
satai
3
240
書き手はどこを訪れたか? - 言語モデルで訪問行動を読み取る -
hiroki13
0
150
Neural Fieldの紹介
nnchiba
2
700
PostgreSQLにおける分散トレーシングの現在 - 第50回PostgreSQLアンカンファレンス
seinoyu
0
250
VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding
sansan_randd
1
460
リモートワークにおけるパッシブ疲労
matsumoto_r
PRO
6
5k
研究を支える拡張性の高い ワークフローツールの提案 / Proposal of highly expandable workflow tools to support research
linyows
0
310
ソフトウェア研究における脅威モデリング
laysakura
0
1.7k
ナレッジプロデューサーとしてのミドルマネージャー支援 - MIMIGURI「知識創造室」の事例の考察 -
chiemitaki
0
230
Featured
See All Featured
Practical Orchestrator
shlominoach
186
10k
StorybookのUI Testing Handbookを読んだ
zakiyama
28
5.5k
Navigating Team Friction
lara
183
15k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.2k
Six Lessons from altMBA
skipperchong
27
3.6k
A Philosophy of Restraint
colly
203
16k
How to Think Like a Performance Engineer
csswizardry
22
1.4k
Being A Developer After 40
akosma
89
590k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
Unsuck your backbone
ammeep
669
57k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
For a Future-Friendly Web
brad_frost
176
9.6k
Transcript
MeshRIR: ⾳場分析・合成のための 格⼦点上室内⾳響インパルス応答 データセット ⼩⼭ 翔⼀1,⻄⽥智哉1 ,⽊村圭佑1 , 阿部拓実1 ,植野夏樹2
,Jesper Brunnström 1 1東京⼤学,2東京都⽴⼤学
September 9, 2021 2 Ø “MeshRIR”と呼ぶインパルス応答データセットを公開 ü 測定領域を格⼦点上に離散化したインパ ルス応答 ü
⾳場分析・合成⼿法の評価に適したデー タセット ü 2つのサブデータセット • 1⾳源から3次元直⽅体領域まで • 32⾳源から2次元正⽅形領域まで ü いくつかの⾳場分析・合成⼿法のサンプ ルコードも提供 https://sh01k.github.io/MeshRIR/
サブデータセット Ø S1-M3969 – 1⾳源から3次元直⽅体の測定領域 – 測定領域:1.0 m x 1.0
m x 0.4 m – 間隔:0.05 m – 点数:21 x 21 x 9 = 3969点 – 残響時間:0.38 s Ø S32-M441 – 32⾳源から2次元正⽅形の測定領域 – 測定領域:1.0 m x 1.0 m – 間隔:0.05 m – 点数:21 x 21 = 441点 – 残響時間:0.19 s September 9, 2021 3
測定⽅法 Ø 無指向性マイクを3軸直交ロボットに取り付けて測定 – マイクロフォン:Primo EM272J – スピーカ (S1-M3969):DIATONE DS-7
– スピーカ (S32-M441):YAMAHA VXS1MLB – 測定⽤信号:Linear swept sine September 9, 2021 4
測定条件の詳細 September 9, 2021 5 ü ファイル形式はNumpy⽤のNPYとMatlab⽤のMATがダウン ロード可能 ü 付加的なデータはJSONファイルの形式で提供
ü ⾳場分析・合成のサンプルコードも付属
⾳場の可視化結果 Ø S1-M3969を⽤いて⾳場を可視化 September 9, 2021 6 xy平⾯上の分布 y軸上のインパルス応答
⾳場補間∕再構成の評価例 Ø S1-M3969を⽤いて18個のマイク信号から領域全体を推定 September 9, 2021 7 真値 カーネル補間法 [Ueno+
2018] ガウスカーネルを ⽤いた場合 MSE: -5.8 dB MSE: -13.7 dB ⾳圧分布 誤差分布
⾳場合成∕制御の評価例 Ø S32-M441を⽤いて領域内に平⾯波⾳場を合成 September 9, 2021 8 ⾳圧分布 誤差分布 重み付きモードマッチング
[Ueno+ 2019] 多点⾳圧制御 SDR: 3.85 dB SDR: 4.65 dB 真値