Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
バンド編曲に向けたギター音源からベース音源を生成するCNNモデル
Search
Kitahara Lab.
February 06, 2023
0
46
バンド編曲に向けたギター音源からベース音源を生成するCNNモデル
2022年度卒業研究発表会、香西智雄
Kitahara Lab.
February 06, 2023
Tweet
Share
More Decks by Kitahara Lab.
See All by Kitahara Lab.
初学者による演奏音の自動評価を目的としたフルート音の音響分析
kthrlab
1
36
サッカーにおける選手位置とパスコースの可聴化システム
kthrlab
0
21
ハウスミュージックの楽曲構成を決める要因とその法則性の分析
kthrlab
0
160
川原瑞樹
kthrlab
0
83
即興演奏システム JamSketch の社会応用の可能性
kthrlab
0
24
Generating Melodies from Melodic Outlines Towards an Improvisation Support Systems for Non-musicians
kthrlab
0
34
即興演奏支援に向けた旋律生成の一試行
kthrlab
0
10
JamSketch Deep α: A CNN-based Improvisation System in Accordance with User's Melodic Outline Drawing
kthrlab
0
23
即興演奏システムJamSketchにおける 旋律生成手法の改善
kthrlab
0
27
Featured
See All Featured
Statistics for Hackers
jakevdp
799
230k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.3k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
Side Projects
sachag
455
43k
First, design no harm
axbom
PRO
1
1.1k
Claude Code のすすめ
schroneko
67
210k
Designing Powerful Visuals for Engaging Learning
tmiket
0
190
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
260
Building Flexible Design Systems
yeseniaperezcruz
330
40k
SEO for Brand Visibility & Recognition
aleyda
0
4.1k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
39
We Are The Robots
honzajavorek
0
130
Transcript
バンド編曲に向けたギター音源から ベース音源を生成するCNNモデル 北原研 香西智雄
背景 ギターリストの中にはギターで作曲を楽しむ人が居る。 だが、編曲するとなると、人と音楽知識を要する。 そこで知識いらずで自動バンド編曲してくれるシステムが あればいいな。 パソコンを通して、バンド編曲
研究概要 今回は、ギターの音響信号から、ベースの音響信号の生成 を取り扱うことにする。 ベースonly 入力 出力 モデル
特徴量 特徴量抽出 圧縮 フィルター層 逆フィルター層 復元 一致するよう学習する フーリエ変換 フーリエ変換 予測結果
CNN
データセット 実際のデータセット内の音源の楽譜 作成に用いたソフト Cakewalk By BandLab ビート 八分音符のみ BPM 120
小節数 4(8秒) 学習データ数 10曲 テストデータ数 11曲(1曲のみ、実演奏)
実験目的・実験条件 特徴量抽出手法を変えて、設定した条件ごとの予測結果を 比較する。 評価基準 正解音源と予測音源の基本周波数の一致度合い(正解率) 。 特徴量抽出手法
1 短時間フーリエ変換(STFT) 2 メルスペクトログラム(Mel) 3 クロマグラム(Chorma) 条件 学習データ テストデータ 1 Cakewalk Cakewalk 2 Cakewalk Cakewalk(ローパスフィルタ適用) 3 Cakewalk 実演奏
実験結果:条件1 STFT Mel Chroma 復元音源 正解率:0.70 復元音源 正解率:0.54 復元音源 正解率:0.79
入力データ guitar音源 bass音源 コード進行:AmFGC
実験結果:条件2 STFT Mel Chroma 復元音源 正解率:0.29 復元音源 正解率:0.26 復元音源 正解率:0.58
入力データ guitar音源 bass音源 コード進行:A#CDmEm
実験結果:条件3 STFT Mel Chroma 復元音源 正解率:0.20 復元音源 正解率:0.09 復元音源 正解率:0.35
入力データ guitar音源 bass音源 コード進行:CDEmAm
結論 CNNでギター音響信号からベース音響信号の生成を行った。 最も精度の高いモデルは、クロマグラムだった。 考察 クロマグラムは和音分析に特化しているため、うまくいった。
音源がエフェクターなどに加工されるとうまくいかない可能 性がある。 今後の課題 データセットを増やして、精度に変化が生じるか。 特徴量抽出手法の設定条件を変更し、精度に変化が生じるか。