機械学習でやってみたい事

機械学習で  やってみたい事  2019年9月26日　brainbrown

何をするの？ 1. 【端折った説明】コンピューターに、耳コピーをさせる。

何をするの？ 1. 【端折った説明】コンピューターに、耳コピーをさせる。 2. 【少し噛み砕いた説明】楽曲データ（WAVファイル）を読ませて、譜面（SMFファイル）を吐き出す。

何をするの？ 1. 【端折った説明】コンピューターに、耳コピーをさせる。 2. 【少し噛み砕いた説明】楽曲データ（WAVファイル）を読ませて、譜面（SMFファイル）を吐き出す。 3. 【具体的な説明】この後スグ！

本当の目的既に自分が他の人と比較して突出して出来る事＝耳コピーの能力を、計算機に代行させるしくみを構築体験する事で、システム構築のノウハウを習得したい＝機械学習としての耳コピー出力結果が欲しいのでは無い。

アドバンテージ：データの収集（読出/生成系）【音の元素材：読み出し系】500GBを余裕で超える（推定波形ファイル数：100万ファイル）生楽器のサンプリング・ライブラリー

アドバンテージ：データの収集（読出/生成系）【音の元素材：読み出し系】500GBを余裕で超える（推定波形ファイル数：100万ファイル）生楽器のサンプリング・ライブラリー【音の元素材：生成系】約60機種のソフトウェア・シンセサイザー群の無限とも思えるプリセット・サウンドと微調整結果

アドバンテージ：データの収集（変調/合成系）【元素材のバリエーション：変調系】各種エフェクターを用いて、音色のニュアンスの変更

アドバンテージ：データの収集（変調/合成系）【元素材のバリエーション：変調系】各種エフェクターを用いて、音色のニュアンスの変更【元素材のバリエーション：表現系】MIDIデータ的に、小さな音から大きな音（ppp~fff）に依る音色の違い、奏法の違い等

アドバンテージ：データの収集（変調/合成系）【元素材のバリエーション：変調系】各種エフェクターを用いて、音色のニュアンスの変更【元素材のバリエーション：表現系】MIDIデータ的に、小さな音から大きな音（ppp~fff）に依る音色の違い、奏法の違い等【元素材のバリエーション：単音色合成系】MIDIデータ的に、音程を重ねて和音にする（2音～10音程度）

アドバンテージ：データの収集（変調/合成系）【元素材のバリエーション：変調系】各種エフェクターを用いて、音色のニュアンスの変更【元素材のバリエーション：表現系】MIDIデータ的に、小さな音から大きな音（ppp~fff）に依る音色の違い、奏法の違い等【元素材のバリエーション：単音色合成系】MIDIデータ的に、音程を重ねて和音にする（2音～10音程度）【元素材のバリエーション：その他】MIDIデータ的に、ワンショット系のフレーズを作る（装飾音符、トリル、グリッサンド等）

アドバンテージ：データの収集（パッチ演算生成）【元素材：変調系】シンセサイザーの主要パラメータの値を、プログラムに依って総当たり的に生成し（音色プログラムの自動生成）、そのデータをソフトウェアシンセサイザーに読み込ませ、別途生成されたMIDIデータによって再生＝波形データ（教師付データ）を出力。タイプ：６種類波形：４種類＋α フィルタ種類：６種類フィルタ値：127段階強調値：127段階 EG連動値：127段階
音色変化用立ち上がり/減衰/持続 /余韻音量変化用立ち上がり/減衰/持続 /余韻

アドバンテージ：データの収集（パッチ演算生成）【元素材：変調系】シンセサイザーの主要パラメータの値を、プログラムに依って総当たり的に生成し（音色プログラムの自動生成）、そのデータをソフトウェアシンセサイザーに読み込ませ、別途生成されたMIDIデータによって再生＝波形データ（教師付データ）を出力。音　楽 WAVデータ教師付データ譜　面 MIDIデータラベル
楽　器音色データラベル

アドバンテージ：データの収集（パッチ演算生成）音　楽 WAVデータ教師付データ譜　面 MIDIデータラベル楽　器音色データラベル
音程 WAVデータ教師付データ譜面 MIDIデータラベルｴﾌｪｸﾀｰｾｯﾃｨﾝｸﾞﾃﾞｰﾀ楽器音色データラベル

アドバンテージのまとめ他の分野に比べ、教師付データの収集という点に於いて、圧倒的な優位性がある。 →→3DCGの1キャラクターモデルを元に、様々な顔やポーズや衣装のバリエーションを生成出来るのと同じ。

アドバンテージのまとめ他の分野に比べ、教師付データの収集という点に於いて、圧倒的な優位性がある。 →→3DCGの1キャラクターモデルを元に、様々な顔やポーズや衣装のバリエーションを生成出来るのと同じ。 →→キャラクターの人物違い、或いは動物として、もしくは有機物と無機物としての違いは、元素材としての楽器の種類に該当 ✕

アドバンテージのまとめ他の分野に比べ、教師付データの収集という点に於いて、圧倒的な優位性がある。 →→3DCGの1キャラクターモデルを元に、様々な顔やポーズや衣装のバリエーションを生成出来るのと同じ。 →→キャラクターの人物違い、或いは動物として、もしくは有機物と無機物としての違いは、元素材としての楽器の種類に該当収集＝足し算だが、生成＝掛け算であり、その掛け算要素を複数持つ事が可能

アドバンテージのまとめ他の分野に比べ、教師付データの収集という点に於いて、圧倒的な優位性がある。 →→3DCGの1キャラクターモデルを元に、様々な顔やポーズや衣装のバリエーションを生成出来るのと同じ。 →→キャラクターの人物違い、或いは動物として、もしくは有機物と無機物としての違いは、元素材としての楽器の種類に該当収集＝足し算だが、生成＝掛け算であり、その掛け算要素を複数持つ事が可能 →→→少ないリソースで豊富で十分なバリエーションを持つ、正しいラベルの付いた教師付データが手に入る

全体のフロー原料準備部ソフトウェア・シンセサイザーに演奏をさせる為の演奏データ（MIDIデータ）を、プログラムで生成させ
る。・MAX/MSPというスクリプト型音楽ソフトを用いて、アルゴリズム生成・VSTに対応しているので、右のピアノテック音源をコントロールして波形生成が可能

全体のフロー原料準備部教師付データ生成部ソフトウェア・シンセサイザーに演奏をさせる為の演奏データ（MIDIデータ）
を、プログラムで生成させる。・MAX/MSPというスクリプト型音楽ソフトを用いて、アルゴリズム生成・VSTに対応しているので、右のピアノテック音源をコントロールして波形生成が可能音程を正しく拾う事が目的なので、学習教材として、ピアノテック（物理演算ピアノ）を用いて波形データを生成【ピアノテックの優位性】・調律が1鍵単位で出来る・ピアノの各要素（弦、ハンマー、ペダル、共振、マイク位置等）が調整可能

全体のフロー原料準備部教師付データ生成部機械学
習部ソフトウェア・シンセサイザーに演奏をさせる為の演奏データ（MIDIデータ）を、プログラムで生成させる。・MAX/MSPというスクリプト型音楽ソフトを用いて、アルゴリズム生成・VSTに対応しているので、右のピアノテック音源をコントロールして波形生成が可能音程を正しく拾う事が目的なので、学習教材として、ピアノテック（物理演算ピアノ）を用いて波形データを生成【ピアノテックの優位性】・調律が1鍵単位で出来る・ピアノの各要素（弦、ハンマー、ペダル、共振、マイク位置等）が調整可能 GoogleCloudPlatformにて構築（これから頑張る）

全体のフロー原料準備部教師付データ生成部機械学
習部検　証　部ソフトウェア・シンセサイザーに演奏をさせる為の演奏データ（MIDIデータ）を、プログラムで生成させる。・MAX/MSPというスクリプト型音楽ソフトを用いて、アルゴリズム生成・VSTに対応しているので、右のピアノテック音源をコントロールして波形生成が可能音程を正しく拾う事が目的なので、学習教材として、ピアノテック（物理演算ピアノ）を用いて波形データを生成【ピアノテックの優位性】・調律が1鍵単位で出来る・ピアノの各要素（弦、ハンマー、ペダル、共振、マイク位置等）が調整可能 GoogleCloudPlatformにて構築（これから頑張る） GoogleCloudPlatform にて構築（これから頑張る）生成されたMIDIデータを、原料準備部で生成された MIDIデータと比較し、採点する。その結果を、機械学習部にフィードバックする。

このシステムの調教計画（教育方針）第１目標ピアノテック音源を用いた「ピアノの音色のみで、単音で構成されているオーディオファイル」から、元の譜面に相当する音程データを完全に正しく予測する

このシステムの調教計画（教育方針）第１目標第２目標ピアノテック音源を用いた「ピアノの音色のみで、単音で構成されているオーディオファイル」から、元の譜面に相当する音程データを完全に正しく予測する
第１目標と同じ条件で、 2 音で構成されているオーディオファイル」から、元の譜面に（略

このシステムの調教計画（教育方針）第１目標第２目標第３目標ピアノテック音源を用いた「ピアノの音色のみで、単音で構成されているオーディオファイル」から、元の譜面に相当する音程デー
タを完全に正しく予測する第１目標と同じ条件で、 2 音で構成されているオーディオファイル」から、元の譜面に（略第２目標と同じ条件で、 3 音以上で構成されているオーディオファイル」から、元の譜面に（略

このシステムの調教計画（教育方針）第１目標第２目標第３目標第４目標ピアノテック音源を用いた「ピアノの音色のみで、単音で構成されているオーディオファイル」から、元の
譜面に相当する音程データを完全に正しく予測する第１目標と同じ条件で、 2 音で構成されているオーディオファイル」から、元の譜面に（略第２目標と同じ条件で、 3 音以上で構成されているオーディオファイル」から、元の譜面に（略第３目標と同じ条件だが、同じ和音でボイシングの異なる複数のオーディオファイル」から、元の譜面に（略

譜面に相当する音程データを完全に正しく予測する第１目標と同じ条件で、 2 音で構成されているオーディオファイル」から、元の譜面に（略第２目標と同じ条件で、 3 音以上で構成されているオーディオファイル」から、元の譜面に（略第３目標と同じ条件だが、同じ和音でボイシングの異なる複数のオーディオファイル」から、元の譜面に（略第５目標第１～4目標と同じ条件だが、各種エフェクトを掛けたオーディオファイルから（略

譜面に相当する音程データを完全に正しく予測する第１目標と同じ条件で、 2 音で構成されているオーディオファイル」から、元の譜面に（略第２目標と同じ条件で、 3 音以上で構成されているオーディオファイル」から、元の譜面に（略第３目標と同じ条件だが、同じ和音でボイシングの異なる複数のオーディオファイル」から、元の譜面に（略第５目標第１～4目標と同じ条件だが、各種エフェクトを掛けたオーディオファイルから（略第６目標第１～4目標と同じ条件だが、少し調律の甘いオーディオファイルから（略

譜面に相当する音程データを完全に正しく予測する第１目標と同じ条件で、 2 音で構成されているオーディオファイル」から、元の譜面に（略第２目標と同じ条件で、 3 音以上で構成されているオーディオファイル」から、元の譜面に（略第３目標と同じ条件だが、同じ和音でボイシングの異なる複数のオーディオファイル」から、元の譜面に（略第５目標第１～4目標と同じ条件だが、各種エフェクトを掛けたオーディオファイルから（略第６目標第１～4目標と同じ条件だが、少し調律の甘いオーディオファイルから（略第７目標第１～4目標と同じ条件だが、背後で雑音（環境音）が混ざっているオーディオファイルから（略（いずれは雑音が他の楽器の音に）

譜面に相当する音程データを完全に正しく予測する第１目標と同じ条件で、 2 音で構成されているオーディオファイル」から、元の譜面に（略第２目標と同じ条件で、 3 音以上で構成されているオーディオファイル」から、元の譜面に（略第３目標と同じ条件だが、同じ和音でボイシングの異なる複数のオーディオファイル」から、元の譜面に（略第５目標第１～4目標と同じ条件だが、各種エフェクトを掛けたオーディオファイルから（略第６目標第１～4目標と同じ条件だが、少し調律の甘いオーディオファイルから（略第７目標第１～4目標と同じ条件だが、背後で雑音（環境音）が混ざっているオーディオファイルから（略（いずれは雑音が他の楽器の音に）第八目標第７目標と同じ条件だが、背後で雑音（人の会話）が混ざっているオーディオファイルから（略（いずれは人の会話がコーラスのハーモニーに）

本計画を実施する事に依って得られる技能教師付データ生成部機械学習部検　証　部音程を正しく拾う事が目的なので、学習教材として、
ピアノテック（物理演算ピアノ）を用いて波形データを生成【ピアノテックの優位性】・調律が1鍵単位で出来る・ピアノの各要素（弦、ハンマー、ペダル、共振、マイク位置等）が調整可能 GoogleCloudPlatformにて構築（これから頑張る） GoogleCloudPlatform にて構築（これから頑張る）生成されたMIDIデータを、原料準備部で生成された MIDIデータと比較し、採点する。その結果を、機械学習部にフィードバックする。原料準備部ソフトウェア・シンセサイザーに演奏をさせる為の演奏データ（MIDIデータ）を、プログラムで生成させる。・MAX/MSPというスクリプト型音楽ソフトを用いて、アルゴリズム生成・VSTに対応しているので、右のピアノテック音源をコントロールして波形生成が可能

機械学習でやってみたい事

機械学習でやってみたい事

brainbrown

Other Decks in Programming

Featured

Transcript