Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
バンド編曲に向けたギター音源からベース音源を生成するCNNモデル
Search
Kitahara Lab.
February 06, 2023
0
39
バンド編曲に向けたギター音源からベース音源を生成するCNNモデル
2022年度卒業研究発表会、香西智雄
Kitahara Lab.
February 06, 2023
Tweet
Share
More Decks by Kitahara Lab.
See All by Kitahara Lab.
初学者による演奏音の自動評価を目的としたフルート音の音響分析
kthrlab
1
24
サッカーにおける選手位置とパスコースの可聴化システム
kthrlab
0
9
ハウスミュージックの楽曲構成を決める要因とその法則性の分析
kthrlab
0
53
川原瑞樹
kthrlab
0
34
即興演奏システム JamSketch の社会応用の可能性
kthrlab
0
13
Generating Melodies from Melodic Outlines Towards an Improvisation Support Systems for Non-musicians
kthrlab
0
17
即興演奏支援に向けた旋律生成の一試行
kthrlab
0
5
JamSketch Deep α: A CNN-based Improvisation System in Accordance with User's Melodic Outline Drawing
kthrlab
0
15
即興演奏システムJamSketchにおける 旋律生成手法の改善
kthrlab
0
14
Featured
See All Featured
Java REST API Framework Comparison - PWX 2021
mraible
28
8.4k
Music & Morning Musume
bryan
46
6.3k
Making the Leap to Tech Lead
cromwellryan
133
9.1k
Art, The Web, and Tiny UX
lynnandtonic
298
20k
Agile that works and the tools we love
rasmusluckow
328
21k
Code Review Best Practice
trishagee
66
17k
RailsConf 2023
tenderlove
29
990
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
33
2.8k
The Pragmatic Product Professional
lauravandoore
32
6.4k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Fireside Chat
paigeccino
34
3.2k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Transcript
バンド編曲に向けたギター音源から ベース音源を生成するCNNモデル 北原研 香西智雄
背景 ギターリストの中にはギターで作曲を楽しむ人が居る。 だが、編曲するとなると、人と音楽知識を要する。 そこで知識いらずで自動バンド編曲してくれるシステムが あればいいな。 パソコンを通して、バンド編曲
研究概要 今回は、ギターの音響信号から、ベースの音響信号の生成 を取り扱うことにする。 ベースonly 入力 出力 モデル
特徴量 特徴量抽出 圧縮 フィルター層 逆フィルター層 復元 一致するよう学習する フーリエ変換 フーリエ変換 予測結果
CNN
データセット 実際のデータセット内の音源の楽譜 作成に用いたソフト Cakewalk By BandLab ビート 八分音符のみ BPM 120
小節数 4(8秒) 学習データ数 10曲 テストデータ数 11曲(1曲のみ、実演奏)
実験目的・実験条件 特徴量抽出手法を変えて、設定した条件ごとの予測結果を 比較する。 評価基準 正解音源と予測音源の基本周波数の一致度合い(正解率) 。 特徴量抽出手法
1 短時間フーリエ変換(STFT) 2 メルスペクトログラム(Mel) 3 クロマグラム(Chorma) 条件 学習データ テストデータ 1 Cakewalk Cakewalk 2 Cakewalk Cakewalk(ローパスフィルタ適用) 3 Cakewalk 実演奏
実験結果:条件1 STFT Mel Chroma 復元音源 正解率:0.70 復元音源 正解率:0.54 復元音源 正解率:0.79
入力データ guitar音源 bass音源 コード進行:AmFGC
実験結果:条件2 STFT Mel Chroma 復元音源 正解率:0.29 復元音源 正解率:0.26 復元音源 正解率:0.58
入力データ guitar音源 bass音源 コード進行:A#CDmEm
実験結果:条件3 STFT Mel Chroma 復元音源 正解率:0.20 復元音源 正解率:0.09 復元音源 正解率:0.35
入力データ guitar音源 bass音源 コード進行:CDEmAm
結論 CNNでギター音響信号からベース音響信号の生成を行った。 最も精度の高いモデルは、クロマグラムだった。 考察 クロマグラムは和音分析に特化しているため、うまくいった。
音源がエフェクターなどに加工されるとうまくいかない可能 性がある。 今後の課題 データセットを増やして、精度に変化が生じるか。 特徴量抽出手法の設定条件を変更し、精度に変化が生じるか。