Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Search
Shoichi Koyama
September 09, 2021
Research
0
140
MeshRIR: ⾳場分析・合成のための格⼦点上室内⾳響インパルス応答データセット
Presentation slides for ASJ2021A.
Shoichi Koyama
September 09, 2021
Tweet
Share
More Decks by Shoichi Koyama
See All by Shoichi Koyama
Introduction of NII Shoichi Koyama's Lab (FY2023)
sh01k
0
260
Weighted Pressure Matching Based on Kernel Interpolation for Sound Field Reproduction
sh01k
0
160
Introduction of our research (FY2022)
sh01k
0
370
研究紹介2022年度版
sh01k
0
870
Binaural reproduction from multiple microphone arrays
sh01k
0
130
Sound Field Reproduction With Weighted Mode Matching and Infinite-Dimensional Harmonic Analysis: An Experimental Evaluation
sh01k
0
160
[ASJ2020A: 2.1.15] 音場制御におけるスピーカ・制御点配置最適化法の比較評価
sh01k
0
240
Other Decks in Research
See All in Research
「Goトレ」のご紹介
smartfukushilab1
0
210
Weekly AI Agents News!
masatoto
18
11k
IVILab. Research Introduction
ysugano
0
260
WikipediaやYouTubeにおける論文参照 / joss2024
corgies
1
210
生成AIエージェントの現状を俯瞰する
isidaitc
0
2.4k
単語埋め込みを用いた日本語オノマトペにおける有声・無声子音の対立による音象徴の分析
shunnosukemotomura
0
390
SSII2024 [TS1] 生成AIと3次元ビジョン ~3次元生成AIの最先端の理論~
ssii
PRO
1
980
自然言語とVision&Language
kuehara
19
4.4k
MLtraq: Track your AI experiments at hyperspeed
micheda
1
170
Threat Intelligence and Beyond
rishikadesai_7
0
240
Introduction of NII S. Koyama's Lab (AY2024)
skoyamalab
0
330
[輪講資料] Text Embeddings by Weakly-Supervised Contrastive Pre-training
hpprc
3
720
Featured
See All Featured
Building Applications with DynamoDB
mza
89
5.8k
Leading Effective Engineering Teams 2024
addyosmani
3
300
Java REST API Framework Comparison - PWX 2021
mraible
PRO
20
7.2k
How STYLIGHT went responsive
nonsquared
93
5k
Optimising Largest Contentful Paint
csswizardry
18
2.6k
Side Projects
sachag
451
42k
Designing Experiences People Love
moore
136
23k
Clear Off the Table
cherdarchuk
89
320k
The World Runs on Bad Software
bkeepers
PRO
63
11k
Scaling GitHub
holman
458
140k
Infographics Made Easy
chrislema
238
18k
How to Ace a Technical Interview
jacobian
274
23k
Transcript
MeshRIR: ⾳場分析・合成のための 格⼦点上室内⾳響インパルス応答 データセット ⼩⼭ 翔⼀1,⻄⽥智哉1 ,⽊村圭佑1 , 阿部拓実1 ,植野夏樹2
,Jesper Brunnström 1 1東京⼤学,2東京都⽴⼤学
September 9, 2021 2 Ø “MeshRIR”と呼ぶインパルス応答データセットを公開 ü 測定領域を格⼦点上に離散化したインパ ルス応答 ü
⾳場分析・合成⼿法の評価に適したデー タセット ü 2つのサブデータセット • 1⾳源から3次元直⽅体領域まで • 32⾳源から2次元正⽅形領域まで ü いくつかの⾳場分析・合成⼿法のサンプ ルコードも提供 https://sh01k.github.io/MeshRIR/
サブデータセット Ø S1-M3969 – 1⾳源から3次元直⽅体の測定領域 – 測定領域:1.0 m x 1.0
m x 0.4 m – 間隔:0.05 m – 点数:21 x 21 x 9 = 3969点 – 残響時間:0.38 s Ø S32-M441 – 32⾳源から2次元正⽅形の測定領域 – 測定領域:1.0 m x 1.0 m – 間隔:0.05 m – 点数:21 x 21 = 441点 – 残響時間:0.19 s September 9, 2021 3
測定⽅法 Ø 無指向性マイクを3軸直交ロボットに取り付けて測定 – マイクロフォン:Primo EM272J – スピーカ (S1-M3969):DIATONE DS-7
– スピーカ (S32-M441):YAMAHA VXS1MLB – 測定⽤信号:Linear swept sine September 9, 2021 4
測定条件の詳細 September 9, 2021 5 ü ファイル形式はNumpy⽤のNPYとMatlab⽤のMATがダウン ロード可能 ü 付加的なデータはJSONファイルの形式で提供
ü ⾳場分析・合成のサンプルコードも付属
⾳場の可視化結果 Ø S1-M3969を⽤いて⾳場を可視化 September 9, 2021 6 xy平⾯上の分布 y軸上のインパルス応答
⾳場補間∕再構成の評価例 Ø S1-M3969を⽤いて18個のマイク信号から領域全体を推定 September 9, 2021 7 真値 カーネル補間法 [Ueno+
2018] ガウスカーネルを ⽤いた場合 MSE: -5.8 dB MSE: -13.7 dB ⾳圧分布 誤差分布
⾳場合成∕制御の評価例 Ø S32-M441を⽤いて領域内に平⾯波⾳場を合成 September 9, 2021 8 ⾳圧分布 誤差分布 重み付きモードマッチング
[Ueno+ 2019] 多点⾳圧制御 SDR: 3.85 dB SDR: 4.65 dB 真値