Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Speaker Deck
PRO
Sign in
Sign up for free
LSPC deep-people for music processing #01 導入
Yuya Yamamoto
May 05, 2022
Research
0
9
LSPC deep-people for music processing #01 導入
筑波大学人と音の情報学研究室で行われた,
深層学習×音楽データの勉強会の資料を公開しています.
誤りなどがあるかもしれません.その場合,ご指摘お願いします.
#01 音楽×深層学習の導入
Yuya Yamamoto
May 05, 2022
Tweet
Share
More Decks by Yuya Yamamoto
See All by Yuya Yamamoto
2022年度情報学学位プログラム説明会 学生体験談
yamathcy
0
21
LSPC deep-people for music processing #05 CNN
yamathcy
0
8
LSPC deep-people for music processing #06 RNN
yamathcy
0
5
LSPC博士前期チュートリアル
yamathcy
0
81
2020年度修士論文最終発表
yamathcy
0
28
MULTIMODAL METRIC LEARNING FOR TAG-BASED MUSIC RETRIEVAL@ICASSP2021読み会
yamathcy
0
500
SIGMUS130-yamamoto
yamathcy
0
27
#muana IRM
yamathcy
0
1k
論文サタデーナイト#01 SEMI-SUPERVISED LEARNING USING TEACHER-STUDENT MODELS FOR VOCAL MELODY EXTRACTION
yamathcy
0
110
Other Decks in Research
See All in Research
Celebrate UTIG: Staff and Student Awards 2022
utig
0
140
民間企業におけるデータ整備の課題と工夫 / 20220305
yuzutas0
4
3.1k
生成的モデリングによる集合データのVisual Analytics(博士論文公聴会)
ae14watanabe
4
900
深層学習を用いた三次元点群処理入門
nnchiba
4
2.7k
GDPナウキャスティング・webアプリ「NowcastingR」の概要
secondapunta
0
230
研究紹介2022年度版
sh01k
0
330
Natural language processing tells us the shape of language
eumesy
0
280
Output Image - 10INC.
10inc
0
220
まだ生態学に本格導入されていない統計的因果推論手法の紹介:傾向スコア、回帰分断デザイン、操作変数法を中心に
takehikoihayashi
2
860
[ASRU 2021] Multi-stream HiFi-GAN with data-driven waveform decomposition
takuma_okamoto
0
140
幼少期の自然体験が理科学習への態度に及ぼす影響
arumakan
0
830
2022松井研研究室紹介
matsui_528
0
110
Featured
See All Featured
Fireside Chat
paigeccino
11
1.3k
A designer walks into a library…
pauljervisheath
196
16k
WebSockets: Embracing the real-time Web
robhawkes
57
5k
Pencils Down: Stop Designing & Start Developing
hursman
112
9.8k
Fantastic passwords and where to find them - at NoRuKo
philnash
25
1.5k
From Idea to $5000 a Month in 5 Months
shpigford
372
44k
Imperfection Machines: The Place of Print at Facebook
scottboms
253
11k
Mobile First: as difficult as doing things right
swwweet
213
7.5k
Automating Front-end Workflow
addyosmani
1351
200k
Java REST API Framework Comparison - PWX 2021
mraible
PRO
11
4.6k
We Have a Design System, Now What?
morganepeng
35
2.9k
GraphQLとの向き合い方2022年版
quramy
16
8.1k
Transcript
Իָʹ͓͚Δਂֶश ~ಋೖ~ Deep-people #1
͜ͷษڧձͷత 2 • ҰॹʹਂֶशͭΑ͘ͳΖ͏ͥʂͳձ • LSPCDeepʹͭΑ͘ͳ͍… • ͔ͩΒΈΜͳͰษڧͯ͠ݟΛஷΊΑ͏ • ΰʔϧɿӃࢼͷܭըͷϞσϧΛ࣮ɾΧελϚΠζՄೳͳঢ়ଶʹͳΔ
• ਂֶश/ରͱ͢ΔԻɾԻָͷॲཧʹ͍ͭͯҰ௨Γ͍ͬͯΔ • PyTorchͰ࣮ݧΛߦ͏ϓϩάϥϜΛॻ͚Δ
༧ఆ • ʢఆʣय़ABC: ຖिਫ༵56ݶ • ͓ͦΒ͘Ͳͷߨٛͱ͔Ϳͬͯͳ͍ͣ • θϛͷఔͱඃͬͨΒม͑·͢ 3
ϕʔεͱͳΔࢿྉ • Musical Applications of Machine Learning (2021) • https://mac.kaist.ac.kr/~juhan/gct634/index.html
• KAISTͷେֶӃͷߨٛࢿྉ, ԻָใॲཧݚڀऀͷJuhan NamࢯʹΑͬͯ࡞ • Իָใॲཧ × ػցֶशɾਂֶशͷτϐοΫΛΧόʔ • ͪΐͬͱԻڹدΓɼָේܥͷτϐοΫΛΧόʔ͍ͯ͠Δࢿྉ୳͠·͢ • ॓Ͱαϯϓϧίʔυ͕͍͍ͯΔ • https://github.com/juhannam/gct634-ai613-2021 4
ຖճͷ༰ • ϨΫνϟʔ • ༰ʹؔͯ͠ྠߨܗࣜͰൃද • εϥΠυʹ·ͱΊΔ or ίʔυ͕͋Εgoogle colabΛۦ
• ࢿྉΛͦͷ··ղઆͰ͓k ʢhowever ଞਓͷϓϨθϯͰղઆ͢Δͷ͍͠…ʣ • ྠߨํࣜ • ಛʹษڧ͍ͨ͠τϐοΫݸਓʹׂΓͯɼ୭رऀ͕͍ͳ͍τϐοΫࢁຊ ͕ղઆ • ୲͜ͷ࣌ؒͷऴΘΓʹܾΊ·͠ΐ͏ 5
ಋೖᶃɿͳͥਂֶशΛ͏ͷ͔ʁ
ԻָΛίϯϐϡʔλͰѻ͏ݚڀ 7 Իָใॲཧ ԻָԻݯ (wav, mp3) ָේ (MIDI) ใॲཧ ςΩετɾϝλσʔλ
(Իָʹؔ͢Δใ) ԻָΛ࠾ේָͯ͠ේʹ͢ΔɼԻූ͔ΒԋΛੜ͢Δɼ ࡞ۂ͢ΔɼͦͷԻָʹ͍ͭͯͷใΛ֫ಘ͢Δ etc…
Իָใॲཧͷछผ • ॲཧͷํ • ࡞ΔɿԻָේΛੜ or Ճ • ௌ͘ɿԻԻָ͔ΒใΛ֫ಘ •
ରσʔλ • ԻڹσʔλɿԻͦͷͷɽwav • ه߸දݱɿԻָΛූ߸Խͨ͠ͷ ʹ ָේɽMIDI • ςΩετσʔλɿδϟϯϧɾϜʔυͷϝλσʔλɼՎࢺ • ϨίʔυσʔλɿԻָ৴ͷௌ͍ͨཤྺ • etc… 8
Իָใॲཧ meets ਂֶश • ਂֶश͕ԻָใॲཧͰٸʹ·ͬͨͷ2015~2018͘Β͍ • ʢ͜ͷลͷΛαʔϕΠ͢ΔͱλεΫΛDeepԽͨ࢝͠తͳจʹग़ձ͑Δ͔ʣ 9 $IPJFUBM"650."5*$5"((*/(64*/(%&&1 $0/70-65*0/"-/&63"-/&5803,4*4.*3
)BEKFSFTFUBM%FFQ#BDIB4UFFSBCMF.PEFMGPS#BDI$IPSBMFT (FOFSBUJPO *$.-IUUQTXXX fl PXNBDIJOFTDPNIJTUPSZQSPKFDUT EFFQCBDIQPMZQIPOJDNVTJDHFOFSBUJPOCBDIDIPSBMFT +BOTTPOFUBM 4JOHJOHWPJDFTFQBSBUJPOXJUIEFFQVOFUDPOWPMVUJPOBMOFUXPSLT *4.*3
Ͳͷํ໘ʹؔͯ͠ॲཧͷਫ਼্͕͕ͬͨ 10 ͲΜͳ͜ͱ͕Ͱ͖ΔΑ͏ʹͳͬͨʁ • ௌ͘ଆ -> ਓؒͷೳྗʹഭΔೝࣝೳྗ • ࣗಈ࠾ේɿ΄΅ᘳʹ͍ۙࣖίϐΛ࣮ݱ •
ԻݯɿࡶԻͷগͳ͍Ի • ԻָδϟϯϧྨɿਓؒͱḮ৭ͳ͍ఔͷਖ਼ղ etc… • ࡞Δଆ -> ҧײͷগͳ͍࡞ • ՎɾָԻ߹ɿຊͱؒҧ͏ఔͷߴਫ਼ͳ߹ • ࣗಈ࡞ۂɿैདྷٕज़ͷෆࣗવ͞Λͳָͨ͘͠ۂͷੜ
ʢେ·͔ʹʣ3ஈ֊ 11 Իָใॲཧͷٕज़τϨϯυͷ͋ΏΈ ϧʔϧϕʔεख๏ ౷ܭతֶशϕʔε ख๏ ਂֶश ਓ͕ϧʔϧΛ༩͑ɼ ͦΕʹج͍ͮͯॲཧ ਓ͕ख͕͔Γ
ʢԻڹಛྔɼ֬ʣΛ༩͑ɼ ͋ͱσʔλ͔Βֶशͤ͞Δ ਂχϡʔϥϧωοτϫʔΫΛར༻ ΑΓେྔͷσʔλΛجʹɼ ਓͷखΛʢ͋·ΓʣՃֶ͑ͣशͤ͞Δ JGd UIFOʜ FMTFJGd UIFOʜ Իָใॲཧͷᴈ໌ظ ‘00͋ͨΓ~ ‘10લ ‘10ޙ~ σʔλͷ ׆༻ Ϗοά σʔλˍ ॲཧํ๏ͷ ਐԽ
12 3ͭͷख๏ͷൺֱ ਂֶश ಛྔ ݹయతػցֶश ϧʔϧϕʔε ඞཁͳϥϕϧσʔλྔ େྔ গྔ ͳ͓ͯ͘L
ඞཁͳܭࢉػϦιʔε º ˓ ˚ʢϧʔϧͷܭࢉྔʹґΔʣ εέʔϥϏϦςΟ ʢଞλεΫͷస༻ͳͲΛ ॊೈʹରԠͰ͖Δ͔ʣ ˕ ˓ º ରͷϞσϦϯάͷදݱྗ ˕ ̋ º υϝΠϯಛ༗ͷࣝͷഉআ ˓ ˚ º ݁ՌͷղऍՄೳੑ ˚ ˓ ˕ ख๏ ؍ σʔλۦಈܕΞϓϩʔν
13 ཁ͢Δʹɼਂֶश… • ͜͏͍͏߹ʹબࢶʹೖΔ • େྔͷσʔλ͕ѻ͑Δͱ͖ • ͱʹ͔͘ੑೳ͕ཉ͍͠ͱ͖ • ઐࣝʹΑΔϞσϦϯάʹݶքΛײͨ࣌͡
• ൚༻తͰॊೈͳϞσϦϯάΛ͍ͨ͠ͱ͖ • ͜͏͍͏߹Θͳ͍ํ͕͍͍ • σʔλ͕େྔʹͳ͍ • ରʹର͢Δੑ࣭͕Γ͍ͨʢ㲎 ղऍՄೳੑʹ͕͋Δʣ • ؔੑ͕ࣗ໌ͱ͍͏ͱ͜Ζ·Ͱམͱ͠ࠐΊΔλεΫ
ಋೖᶄɿਂֶशͷྲྀΕ
ਂֶशΛ͢Δ্Ͱͷεςοϓ 1. σʔλͷ༻ҙ 2. σʔλͷલॲཧ 3. Ϟσϧͷֶश 4. ϞσϧͷςετʢධՁʣ 15
PyTorch • MetaࣾʹΑΔਂֶशϥΠϒϥϦ • ݱࡏ͓ͦΒ͘࠷ϝδϟʔͰࢀߟʹͳΔ ࢿྉଟ͍ • σʔλͷલॲཧ४උपΓΛɼ Dataloaderͱ͍͏ಠࣗͷΈͰͬͯ ͘ΕΔ
16