Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
バンド編曲に向けたギター音源からベース音源を生成するCNNモデル
Search
Kitahara Lab.
February 06, 2023
0
42
バンド編曲に向けたギター音源からベース音源を生成するCNNモデル
2022年度卒業研究発表会、香西智雄
Kitahara Lab.
February 06, 2023
Tweet
Share
More Decks by Kitahara Lab.
See All by Kitahara Lab.
初学者による演奏音の自動評価を目的としたフルート音の音響分析
kthrlab
1
26
サッカーにおける選手位置とパスコースの可聴化システム
kthrlab
0
16
ハウスミュージックの楽曲構成を決める要因とその法則性の分析
kthrlab
0
100
川原瑞樹
kthrlab
0
52
即興演奏システム JamSketch の社会応用の可能性
kthrlab
0
16
Generating Melodies from Melodic Outlines Towards an Improvisation Support Systems for Non-musicians
kthrlab
0
25
即興演奏支援に向けた旋律生成の一試行
kthrlab
0
6
JamSketch Deep α: A CNN-based Improvisation System in Accordance with User's Melodic Outline Drawing
kthrlab
0
20
即興演奏システムJamSketchにおける 旋律生成手法の改善
kthrlab
0
17
Featured
See All Featured
The Cost Of JavaScript in 2023
addyosmani
51
8.8k
[RailsConf 2023] Rails as a piece of cake
palkan
56
5.8k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
It's Worth the Effort
3n
185
28k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
47
9.6k
Producing Creativity
orderedlist
PRO
347
40k
Site-Speed That Sticks
csswizardry
10
770
Designing for humans not robots
tammielis
253
25k
The Cult of Friendly URLs
andyhume
79
6.5k
Being A Developer After 40
akosma
90
590k
Six Lessons from altMBA
skipperchong
28
3.9k
Transcript
バンド編曲に向けたギター音源から ベース音源を生成するCNNモデル 北原研 香西智雄
背景 ギターリストの中にはギターで作曲を楽しむ人が居る。 だが、編曲するとなると、人と音楽知識を要する。 そこで知識いらずで自動バンド編曲してくれるシステムが あればいいな。 パソコンを通して、バンド編曲
研究概要 今回は、ギターの音響信号から、ベースの音響信号の生成 を取り扱うことにする。 ベースonly 入力 出力 モデル
特徴量 特徴量抽出 圧縮 フィルター層 逆フィルター層 復元 一致するよう学習する フーリエ変換 フーリエ変換 予測結果
CNN
データセット 実際のデータセット内の音源の楽譜 作成に用いたソフト Cakewalk By BandLab ビート 八分音符のみ BPM 120
小節数 4(8秒) 学習データ数 10曲 テストデータ数 11曲(1曲のみ、実演奏)
実験目的・実験条件 特徴量抽出手法を変えて、設定した条件ごとの予測結果を 比較する。 評価基準 正解音源と予測音源の基本周波数の一致度合い(正解率) 。 特徴量抽出手法
1 短時間フーリエ変換(STFT) 2 メルスペクトログラム(Mel) 3 クロマグラム(Chorma) 条件 学習データ テストデータ 1 Cakewalk Cakewalk 2 Cakewalk Cakewalk(ローパスフィルタ適用) 3 Cakewalk 実演奏
実験結果:条件1 STFT Mel Chroma 復元音源 正解率:0.70 復元音源 正解率:0.54 復元音源 正解率:0.79
入力データ guitar音源 bass音源 コード進行:AmFGC
実験結果:条件2 STFT Mel Chroma 復元音源 正解率:0.29 復元音源 正解率:0.26 復元音源 正解率:0.58
入力データ guitar音源 bass音源 コード進行:A#CDmEm
実験結果:条件3 STFT Mel Chroma 復元音源 正解率:0.20 復元音源 正解率:0.09 復元音源 正解率:0.35
入力データ guitar音源 bass音源 コード進行:CDEmAm
結論 CNNでギター音響信号からベース音響信号の生成を行った。 最も精度の高いモデルは、クロマグラムだった。 考察 クロマグラムは和音分析に特化しているため、うまくいった。
音源がエフェクターなどに加工されるとうまくいかない可能 性がある。 今後の課題 データセットを増やして、精度に変化が生じるか。 特徴量抽出手法の設定条件を変更し、精度に変化が生じるか。