Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
バンド編曲に向けたギター音源からベース音源を生成するCNNモデル
Search
Kitahara Lab.
February 06, 2023
0
34
バンド編曲に向けたギター音源からベース音源を生成するCNNモデル
2022年度卒業研究発表会、香西智雄
Kitahara Lab.
February 06, 2023
Tweet
Share
More Decks by Kitahara Lab.
See All by Kitahara Lab.
初学者による演奏音の自動評価を目的としたフルート音の音響分析
kthrlab
1
18
サッカーにおける選手位置とパスコースの可聴化システム
kthrlab
0
9
ハウスミュージックの楽曲構成を決める要因とその法則性の分析
kthrlab
0
38
川原瑞樹
kthrlab
0
22
即興演奏システム JamSketch の社会応用の可能性
kthrlab
0
7
Generating Melodies from Melodic Outlines Towards an Improvisation Support Systems for Non-musicians
kthrlab
0
13
即興演奏支援に向けた旋律生成の一試行
kthrlab
0
4
JamSketch Deep α: A CNN-based Improvisation System in Accordance with User's Melodic Outline Drawing
kthrlab
0
12
即興演奏システムJamSketchにおける 旋律生成手法の改善
kthrlab
0
11
Featured
See All Featured
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
32
1.8k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
4
380
Scaling GitHub
holman
458
140k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
28
8k
Fireside Chat
paigeccino
32
3k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
126
18k
BBQ
matthewcrist
85
9.3k
Happy Clients
brianwarren
97
6.7k
Navigating Team Friction
lara
183
14k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
26
1.4k
Transcript
バンド編曲に向けたギター音源から ベース音源を生成するCNNモデル 北原研 香西智雄
背景 ギターリストの中にはギターで作曲を楽しむ人が居る。 だが、編曲するとなると、人と音楽知識を要する。 そこで知識いらずで自動バンド編曲してくれるシステムが あればいいな。 パソコンを通して、バンド編曲
研究概要 今回は、ギターの音響信号から、ベースの音響信号の生成 を取り扱うことにする。 ベースonly 入力 出力 モデル
特徴量 特徴量抽出 圧縮 フィルター層 逆フィルター層 復元 一致するよう学習する フーリエ変換 フーリエ変換 予測結果
CNN
データセット 実際のデータセット内の音源の楽譜 作成に用いたソフト Cakewalk By BandLab ビート 八分音符のみ BPM 120
小節数 4(8秒) 学習データ数 10曲 テストデータ数 11曲(1曲のみ、実演奏)
実験目的・実験条件 特徴量抽出手法を変えて、設定した条件ごとの予測結果を 比較する。 評価基準 正解音源と予測音源の基本周波数の一致度合い(正解率) 。 特徴量抽出手法
1 短時間フーリエ変換(STFT) 2 メルスペクトログラム(Mel) 3 クロマグラム(Chorma) 条件 学習データ テストデータ 1 Cakewalk Cakewalk 2 Cakewalk Cakewalk(ローパスフィルタ適用) 3 Cakewalk 実演奏
実験結果:条件1 STFT Mel Chroma 復元音源 正解率:0.70 復元音源 正解率:0.54 復元音源 正解率:0.79
入力データ guitar音源 bass音源 コード進行:AmFGC
実験結果:条件2 STFT Mel Chroma 復元音源 正解率:0.29 復元音源 正解率:0.26 復元音源 正解率:0.58
入力データ guitar音源 bass音源 コード進行:A#CDmEm
実験結果:条件3 STFT Mel Chroma 復元音源 正解率:0.20 復元音源 正解率:0.09 復元音源 正解率:0.35
入力データ guitar音源 bass音源 コード進行:CDEmAm
結論 CNNでギター音響信号からベース音響信号の生成を行った。 最も精度の高いモデルは、クロマグラムだった。 考察 クロマグラムは和音分析に特化しているため、うまくいった。
音源がエフェクターなどに加工されるとうまくいかない可能 性がある。 今後の課題 データセットを増やして、精度に変化が生じるか。 特徴量抽出手法の設定条件を変更し、精度に変化が生じるか。