Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習でやってみたい事
Search
brainbrown
September 26, 2019
Programming
2
950
機械学習でやってみたい事
テーマ『データ分析者としての学習ロードマップ(初学者・初級者編)』
場所:スペースフォーリアル
住所:東京都渋谷区恵比寿南1-9-10
brainbrown
September 26, 2019
Tweet
Share
Other Decks in Programming
See All in Programming
DevFest Android in Korea 2025 - 개발자 커뮤니티를 통해 얻는 가치
wisemuji
0
180
CSC307 Lecture 03
javiergs
PRO
1
460
Graviton と Nitro と私
maroon1st
0
160
Denoのセキュリティに関する仕組みの紹介 (toranoana.deno #23)
uki00a
0
220
Vibe codingでおすすめの言語と開発手法
uyuki234
0
160
GoLab2025 Recap
kuro_kurorrr
0
1.2k
AtCoder Conference 2025
shindannin
0
900
React 19でつくる「気持ちいいUI」- 楽観的UIのすすめ
himorishige
11
3.8k
JETLS.jl ─ A New Language Server for Julia
abap34
2
470
愛される翻訳の秘訣
kishikawakatsumi
3
370
AIで開発はどれくらい加速したのか?AIエージェントによるコード生成を、現場の評価と研究開発の評価の両面からdeep diveしてみる
daisuketakeda
1
360
Spinner 軸ズレ現象を調べたらレンダリング深淵に飲まれた #レバテックMeetup
bengo4com
1
210
Featured
See All Featured
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
81
Build your cross-platform service in a week with App Engine
jlugia
234
18k
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
300
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
92
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.1k
AI Search: Where Are We & What Can We Do About It?
aleyda
0
6.8k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.1k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
78
Testing 201, or: Great Expectations
jmmastey
46
7.8k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.3k
Transcript
機械学習で やってみたい事 2019年9月26日 brainbrown
何をするの? 1. 【端折った説明】コンピューターに、耳コピーをさせる。
何をするの? 1. 【端折った説明】コンピューターに、耳コピーをさせる。 2. 【少し噛み砕いた説明】楽曲データ(WAVファイル)を読ませて、譜 面(SMFファイル)を吐き出す。
何をするの? 1. 【端折った説明】コンピューターに、耳コピーをさせる。 2. 【少し噛み砕いた説明】楽曲データ(WAVファイル)を読ませて、譜 面(SMFファイル)を吐き出す。 3. 【具体的な説明】この後スグ!
本当の目的 既に自分が他の人と比較して突出して出来る事=耳コピーの能力 を、計算機に代行させるしくみを構築体験する事で、 システム構築のノウハウを習得したい =機械学習としての耳コピー出力結果が欲しいのでは無い。
アドバンテージ:データの収集(読出/生成系) 【音の元素材:読み出し系】500GBを余裕で超える(推定波形ファイル数:100万ファイル) 生楽器のサンプリング・ライブラリー
アドバンテージ:データの収集(読出/生成系) 【音の元素材:読み出し系】500GBを余裕で超える(推定波形ファイル数:100万ファイル) 生楽器のサンプリング・ライブラリー 【音の元素材:生成系】約60機種のソフトウェア・シンセサイザー群の無限とも思えるプリ セット・サウンドと微調整結果
アドバンテージ:データの収集(変調/合成系) 【元素材のバリエーション:変調系】各種エフェクターを用いて、音色のニュアンスの変更
アドバンテージ:データの収集(変調/合成系) 【元素材のバリエーション:変調系】各種エフェクターを用いて、音色のニュアンスの変更 【元素材のバリエーション:表現系】MIDIデータ的に、小さな音から大きな音(ppp~fff)に依 る音色の違い、奏法の違い等
アドバンテージ:データの収集(変調/合成系) 【元素材のバリエーション:変調系】各種エフェクターを用いて、音色のニュアンスの変更 【元素材のバリエーション:表現系】MIDIデータ的に、小さな音から大きな音(ppp~fff)に依 る音色の違い、奏法の違い等 【元素材のバリエーション:単音色合成系】MIDIデータ的に、音程を重ねて和音にする(2音 ~10音程度)
アドバンテージ:データの収集(変調/合成系) 【元素材のバリエーション:変調系】各種エフェクターを用いて、音色のニュアンスの変更 【元素材のバリエーション:表現系】MIDIデータ的に、小さな音から大きな音(ppp~fff)に依 る音色の違い、奏法の違い等 【元素材のバリエーション:単音色合成系】MIDIデータ的に、音程を重ねて和音にする(2音 ~10音程度) 【元素材のバリエーション:その他】MIDIデータ的に、ワンショット系のフレーズを作る(装飾 音符、トリル、グリッサンド等)
アドバンテージ:データの収集(パッチ演算生成) 【元素材:変調系】シンセサイザーの主要パラメータの値を、プログラムに依って総当たり的 に生成し(音色プログラムの自動生成)、そのデータをソフトウェアシンセサイザーに読み込 ませ、別途生成されたMIDIデータによって再生=波形データ(教師付データ)を出力。 タイプ:6種類 波形:4種類+α フィルタ種類:6種類 フィルタ値:127段階 強調値:127段階 EG連動値:127段階
音色変化用 立ち上がり/減衰/持続 /余韻 音量変化用 立ち上がり/減衰/持続 /余韻
アドバンテージ:データの収集(パッチ演算生成) 【元素材:変調系】シンセサイザーの主要パラメータの値を、プログラムに依って総当たり的 に生成し(音色プログラムの自動生成)、そのデータをソフトウェアシンセサイザーに読み込 ませ、別途生成されたMIDIデータによって再生=波形データ(教師付データ)を出力。 音 楽 WAVデータ 教師付データ 譜 面 MIDIデータ ラベル
楽 器 音色データ ラベル
アドバンテージ:データの収集(パッチ演算生成) 音 楽 WAVデータ 教師付データ 譜 面 MIDIデータ ラベル 楽 器 音色データ ラベル
音程 WAVデータ 教師付データ 譜面 MIDIデータ ラベル エフェクタ ー セッティングデータ 楽器 音色データ ラベル
アドバンテージのまとめ 他の分野に比べ、教師付データの収集という点に於いて、圧倒的な優位性がある。 →→3DCGの1キャラクターモデルを元に、様々な顔やポーズや衣装のバリエー ションを生成出来るのと同じ。
アドバンテージのまとめ 他の分野に比べ、教師付データの収集という点に於いて、圧倒的な優位性がある。 →→3DCGの1キャラクターモデルを元に、様々な顔やポーズや衣装のバリエー ションを生成出来るのと同じ。 →→キャラクターの人物違い、或いは動物として、もしくは有機物と無機物として の違いは、元素材としての楽器の種類に該当 ✕
アドバンテージのまとめ 他の分野に比べ、教師付データの収集という点に於いて、圧倒的な優位性がある。 →→3DCGの1キャラクターモデルを元に、様々な顔やポーズや衣装のバリエー ションを生成出来るのと同じ。 →→キャラクターの人物違い、或いは動物として、もしくは有機物と無機物として の違いは、元素材としての楽器の種類に該当 収集=足し算だが、生成=掛け算であり、その掛け算要素を複数持つ事が可能
アドバンテージのまとめ 他の分野に比べ、教師付データの収集という点に於いて、圧倒的な優位性がある。 →→3DCGの1キャラクターモデルを元に、様々な顔やポーズや衣装のバリエー ションを生成出来るのと同じ。 →→キャラクターの人物違い、或いは動物として、もしくは有機物と無機物として の違いは、元素材としての楽器の種類に該当 収集=足し算だが、生成=掛け算であり、その掛け算要素を複数持つ事が可能 →→→少ないリソースで豊富で十分なバリエーションを持つ、正しいラベ ルの付いた教師付データが手に入る
全体のフロー 原 料 準 備 部 ソフトウェア・シンセサイ ザーに演奏をさせる為の 演奏データ(MIDIデータ) を、プログラムで生成させ
る。 ・MAX/MSPというスクリプト型 音楽ソフトを用いて、アルゴリズ ム生成 ・VSTに対応しているので、右 のピアノテック音源をコントロー ルして波形生成が可能
全体のフロー 原 料 準 備 部 教師付データ生成部 ソフトウェア・シンセサイ ザーに演奏をさせる為の 演奏データ(MIDIデータ)
を、プログラムで生成させ る。 ・MAX/MSPというスクリプト型 音楽ソフトを用いて、アルゴリズ ム生成 ・VSTに対応しているので、右 のピアノテック音源をコントロー ルして波形生成が可能 音程を正しく拾う事が目的 なので、学習教材として、 ピアノテック(物理演算ピア ノ)を用いて波形データを 生成 【ピアノテックの優位性】 ・調律が1鍵単位で出来る ・ピアノの各要素(弦、ハン マー、ペダル、共振、マイク位置 等)が調整可能
全体のフロー 原 料 準 備 部 教師付データ生成部 機 械 学
習 部 ソフトウェア・シンセサイ ザーに演奏をさせる為の 演奏データ(MIDIデータ) を、プログラムで生成させ る。 ・MAX/MSPというスクリプト型 音楽ソフトを用いて、アルゴリズ ム生成 ・VSTに対応しているので、右 のピアノテック音源をコントロー ルして波形生成が可能 音程を正しく拾う事が目的 なので、学習教材として、 ピアノテック(物理演算ピア ノ)を用いて波形データを 生成 【ピアノテックの優位性】 ・調律が1鍵単位で出来る ・ピアノの各要素(弦、ハン マー、ペダル、共振、マイク位置 等)が調整可能 GoogleCloudPlatformに て構築 (これから頑張る)
全体のフロー 原 料 準 備 部 教師付データ生成部 機 械 学
習 部 検 証 部 ソフトウェア・シンセサイ ザーに演奏をさせる為の 演奏データ(MIDIデータ) を、プログラムで生成させ る。 ・MAX/MSPというスクリプト型 音楽ソフトを用いて、アルゴリズ ム生成 ・VSTに対応しているので、右 のピアノテック音源をコントロー ルして波形生成が可能 音程を正しく拾う事が目的 なので、学習教材として、 ピアノテック(物理演算ピア ノ)を用いて波形データを 生成 【ピアノテックの優位性】 ・調律が1鍵単位で出来る ・ピアノの各要素(弦、ハン マー、ペダル、共振、マイク位置 等)が調整可能 GoogleCloudPlatformに て構築 (これから頑張る) GoogleCloudPlatform にて構築 (これから頑張る) 生成されたMIDIデータを、 原料準備部で生成された MIDIデータと比較し、採点 する。 その結果を、機械学習部 にフィードバックする。
全体のフロー 原 料 準 備 部 教師付データ生成部 機 械 学
習 部 検 証 部 ソフトウェア・シンセサイ ザーに演奏をさせる為の 演奏データ(MIDIデータ) を、プログラムで生成させ る。 ・MAX/MSPというスクリプト型 音楽ソフトを用いて、アルゴリズ ム生成 ・VSTに対応しているので、右 のピアノテック音源をコントロー ルして波形生成が可能 音程を正しく拾う事が目的 なので、学習教材として、 ピアノテック(物理演算ピア ノ)を用いて波形データを 生成 【ピアノテックの優位性】 ・調律が1鍵単位で出来る ・ピアノの各要素(弦、ハン マー、ペダル、共振、マイク位置 等)が調整可能 GoogleCloudPlatformに て構築 (これから頑張る) GoogleCloudPlatform にて構築 (これから頑張る) 生成されたMIDIデータを、 原料準備部で生成された MIDIデータと比較し、採点 する。 その結果を、機械学習部 にフィードバックする。
このシステムの調教計画(教育方針) 第1目標 ピアノテック音源を用いた 「ピアノの音色のみで、 単 音で構成されているオー ディオファイル」から、元の 譜面に相当する音程デー タを完全に正しく予測する
このシステムの調教計画(教育方針) 第1目標 第2目標 ピアノテック音源を用いた 「ピアノの音色のみで、 単 音で構成されているオー ディオファイル」から、元の 譜面に相当する音程デー タを完全に正しく予測する
第1目標と同じ条件で、 2 音で構成されているオー ディオファイル」から、元の 譜面に(略
このシステムの調教計画(教育方針) 第1目標 第2目標 第3目標 ピアノテック音源を用いた 「ピアノの音色のみで、 単 音で構成されているオー ディオファイル」から、元の 譜面に相当する音程デー
タを完全に正しく予測する 第1目標と同じ条件で、 2 音で構成されているオー ディオファイル」から、元の 譜面に(略 第2目標と同じ条件で、 3 音以上で構成されている オーディオファイル」から、 元の譜面に(略
このシステムの調教計画(教育方針) 第1目標 第2目標 第3目標 第4目標 ピアノテック音源を用いた 「ピアノの音色のみで、 単 音で構成されているオー ディオファイル」から、元の
譜面に相当する音程デー タを完全に正しく予測する 第1目標と同じ条件で、 2 音で構成されているオー ディオファイル」から、元の 譜面に(略 第2目標と同じ条件で、 3 音以上で構成されている オーディオファイル」から、 元の譜面に(略 第3目標と同じ条件だが、 同じ和音でボイシングの 異なる複数のオーディオ ファイル」から、元の譜面 に(略
このシステムの調教計画(教育方針) 第1目標 第2目標 第3目標 第4目標 ピアノテック音源を用いた 「ピアノの音色のみで、 単 音で構成されているオー ディオファイル」から、元の
譜面に相当する音程デー タを完全に正しく予測する 第1目標と同じ条件で、 2 音で構成されているオー ディオファイル」から、元の 譜面に(略 第2目標と同じ条件で、 3 音以上で構成されている オーディオファイル」から、 元の譜面に(略 第3目標と同じ条件だが、 同じ和音でボイシングの 異なる複数のオーディオ ファイル」から、元の譜面 に(略 第5目標 第1~4目標と同じ条件だ が、各種エフェクトを掛け たオーディオファイル から (略
このシステムの調教計画(教育方針) 第1目標 第2目標 第3目標 第4目標 ピアノテック音源を用いた 「ピアノの音色のみで、 単 音で構成されているオー ディオファイル」から、元の
譜面に相当する音程デー タを完全に正しく予測する 第1目標と同じ条件で、 2 音で構成されているオー ディオファイル」から、元の 譜面に(略 第2目標と同じ条件で、 3 音以上で構成されている オーディオファイル」から、 元の譜面に(略 第3目標と同じ条件だが、 同じ和音でボイシングの 異なる複数のオーディオ ファイル」から、元の譜面 に(略 第5目標 第1~4目標と同じ条件だ が、各種エフェクトを掛け たオーディオファイル から (略 第6目標 第1~4目標と同じ条件だ が、少し調律の甘いオー ディオファイルから(略
このシステムの調教計画(教育方針) 第1目標 第2目標 第3目標 第4目標 ピアノテック音源を用いた 「ピアノの音色のみで、 単 音で構成されているオー ディオファイル」から、元の
譜面に相当する音程デー タを完全に正しく予測する 第1目標と同じ条件で、 2 音で構成されているオー ディオファイル」から、元の 譜面に(略 第2目標と同じ条件で、 3 音以上で構成されている オーディオファイル」から、 元の譜面に(略 第3目標と同じ条件だが、 同じ和音でボイシングの 異なる複数のオーディオ ファイル」から、元の譜面 に(略 第5目標 第1~4目標と同じ条件だ が、各種エフェクトを掛け たオーディオファイル から (略 第6目標 第1~4目標と同じ条件だ が、少し調律の甘いオー ディオファイルから(略 第7目標 第1~4目標と同じ条件だ が、背後で雑音(環境音) が混ざっているオーディオ ファイルから(略 (いずれは雑音が他の楽器の音に)
このシステムの調教計画(教育方針) 第1目標 第2目標 第3目標 第4目標 ピアノテック音源を用いた 「ピアノの音色のみで、 単 音で構成されているオー ディオファイル」から、元の
譜面に相当する音程デー タを完全に正しく予測する 第1目標と同じ条件で、 2 音で構成されているオー ディオファイル」から、元の 譜面に(略 第2目標と同じ条件で、 3 音以上で構成されている オーディオファイル」から、 元の譜面に(略 第3目標と同じ条件だが、 同じ和音でボイシングの 異なる複数のオーディオ ファイル」から、元の譜面 に(略 第5目標 第1~4目標と同じ条件だ が、各種エフェクトを掛け たオーディオファイル から (略 第6目標 第1~4目標と同じ条件だ が、少し調律の甘いオー ディオファイルから(略 第7目標 第1~4目標と同じ条件だ が、背後で雑音(環境音) が混ざっているオーディオ ファイルから(略 (いずれは雑音が他の楽器の音に) 第八目標 第7目標と同じ条件だが、 背後で雑音(人の会話)が 混ざっているオーディオ ファイルから(略 (いずれは人の会話がコーラスのハー モニーに)
本計画を実施する事に依って得られる技能 教師付データ生成部 機 械 学 習 部 検 証 部 音程を正しく拾う事が目的 なので、学習教材として、
ピアノテック(物理演算ピア ノ)を用いて波形データを 生成 【ピアノテックの優位性】 ・調律が1鍵単位で出来る ・ピアノの各要素(弦、ハン マー、ペダル、共振、マイク位置 等)が調整可能 GoogleCloudPlatformに て構築 (これから頑張る) GoogleCloudPlatform にて構築 (これから頑張る) 生成されたMIDIデータを、 原料準備部で生成された MIDIデータと比較し、採点 する。 その結果を、機械学習部 にフィードバックする。 原 料 準 備 部 ソフトウェア・シンセサイ ザーに演奏をさせる為の 演奏データ(MIDIデータ) を、プログラムで生成させ る。 ・MAX/MSPというスクリプト型 音楽ソフトを用いて、アルゴリズ ム生成 ・VSTに対応しているので、右 のピアノテック音源をコントロー ルして波形生成が可能