Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Search
Shoichi Koyama
September 09, 2021
Research
0
220
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Presentation slides for ASJ2021A.
Shoichi Koyama
September 09, 2021
Tweet
Share
More Decks by Shoichi Koyama
See All by Shoichi Koyama
Weighted Pressure Matching Based on Kernel Interpolation for Sound Field Reproduction
sh01k
0
250
Binaural reproduction from multiple microphone arrays
sh01k
0
190
Sound Field Reproduction With Weighted Mode Matching and Infinite-Dimensional Harmonic Analysis: An Experimental Evaluation
sh01k
0
220
[ASJ2020A: 2.1.15] 音場制御におけるスピーカ・制御点配置最適化法の比較評価
sh01k
0
320
Other Decks in Research
See All in Research
論文読み会 SNLP2025 Learning Dynamics of LLM Finetuning. In: ICLR 2025
s_mizuki_nlp
0
210
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
0
160
まずはここから:Overleaf共同執筆・CopilotでAIコーディング入門・Codespacesで独立環境
matsui_528
2
500
不確実性下における目的と手段の統合的探索に向けた連続腕バンディットの応用 / iot70_gp_rff_mab
monochromegane
2
170
SSII2025 [SS1] レンズレスカメラ
ssii
PRO
2
1.1k
AIスパコン「さくらONE」のLLM学習ベンチマークによる性能評価 / SAKURAONE LLM Training Benchmarking
yuukit
0
350
Generative Models 2025
takahashihiroshi
25
13k
Adaptive Experimental Design for Efficient Average Treatment Effect Estimation and Treatment Choice
masakat0
0
110
能動適応的実験計画
masakat0
2
810
Mechanistic Interpretability:解釈可能性研究の新たな潮流
koshiro_aoki
1
410
VectorLLM: Human-like Extraction of Structured Building Contours via Multimodal LLMs
satai
4
210
多言語カスタマーインタビューの“壁”を越える~PMと生成AIの共創~ 株式会社ジグザグ 松野 亘
watarumatsuno
0
120
Featured
See All Featured
Building Adaptive Systems
keathley
43
2.7k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
285
14k
Product Roadmaps are Hard
iamctodd
PRO
54
11k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
What's in a price? How to price your products and services
michaelherold
246
12k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Automating Front-end Workflow
addyosmani
1370
200k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Rails Girls Zürich Keynote
gr2m
95
14k
The Language of Interfaces
destraynor
161
25k
A designer walks into a library…
pauljervisheath
207
24k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.5k
Transcript
MeshRIR: ⾳場分析・合成のための 格⼦点上室内⾳響インパルス応答 データセット ⼩⼭ 翔⼀1,⻄⽥智哉1 ,⽊村圭佑1 , 阿部拓実1 ,植野夏樹2
,Jesper Brunnström 1 1東京⼤学,2東京都⽴⼤学
September 9, 2021 2 Ø “MeshRIR”と呼ぶインパルス応答データセットを公開 ü 測定領域を格⼦点上に離散化したインパ ルス応答 ü
⾳場分析・合成⼿法の評価に適したデー タセット ü 2つのサブデータセット • 1⾳源から3次元直⽅体領域まで • 32⾳源から2次元正⽅形領域まで ü いくつかの⾳場分析・合成⼿法のサンプ ルコードも提供 https://sh01k.github.io/MeshRIR/
サブデータセット Ø S1-M3969 – 1⾳源から3次元直⽅体の測定領域 – 測定領域:1.0 m x 1.0
m x 0.4 m – 間隔:0.05 m – 点数:21 x 21 x 9 = 3969点 – 残響時間:0.38 s Ø S32-M441 – 32⾳源から2次元正⽅形の測定領域 – 測定領域:1.0 m x 1.0 m – 間隔:0.05 m – 点数:21 x 21 = 441点 – 残響時間:0.19 s September 9, 2021 3
測定⽅法 Ø 無指向性マイクを3軸直交ロボットに取り付けて測定 – マイクロフォン:Primo EM272J – スピーカ (S1-M3969):DIATONE DS-7
– スピーカ (S32-M441):YAMAHA VXS1MLB – 測定⽤信号:Linear swept sine September 9, 2021 4
測定条件の詳細 September 9, 2021 5 ü ファイル形式はNumpy⽤のNPYとMatlab⽤のMATがダウン ロード可能 ü 付加的なデータはJSONファイルの形式で提供
ü ⾳場分析・合成のサンプルコードも付属
⾳場の可視化結果 Ø S1-M3969を⽤いて⾳場を可視化 September 9, 2021 6 xy平⾯上の分布 y軸上のインパルス応答
⾳場補間∕再構成の評価例 Ø S1-M3969を⽤いて18個のマイク信号から領域全体を推定 September 9, 2021 7 真値 カーネル補間法 [Ueno+
2018] ガウスカーネルを ⽤いた場合 MSE: -5.8 dB MSE: -13.7 dB ⾳圧分布 誤差分布
⾳場合成∕制御の評価例 Ø S32-M441を⽤いて領域内に平⾯波⾳場を合成 September 9, 2021 8 ⾳圧分布 誤差分布 重み付きモードマッチング
[Ueno+ 2019] 多点⾳圧制御 SDR: 3.85 dB SDR: 4.65 dB 真値