Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Machine Learning of Jazz
Search
Lystahi
February 26, 2021
Research
2
1.1k
Machine Learning of Jazz
Music×Analytics Meetup Vol.4
https://muana.connpass.com/event/202120/
のLT資料
Lystahi
February 26, 2021
Tweet
Share
More Decks by Lystahi
See All by Lystahi
CauseAndEffectTokyoStartup
lystahi
0
310
ReinforcementLearningChapter1
lystahi
0
410
Other Decks in Research
See All in Research
さまざまなAgent FrameworkとAIエージェントの評価
ymd65536
1
360
SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images
satai
3
500
視覚から身体性を持つAIへ: 巧緻な動作の3次元理解
tkhkaeio
0
110
Pythonでジオを使い倒そう! 〜それとFOSS4G Hiroshima 2026のご紹介を少し〜
wata909
0
1.2k
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
280
20250725-bet-ai-day
cipepser
3
550
GPUを利用したStein Particle Filterによる点群6自由度モンテカルロSLAM
takuminakao
0
640
SREはサイバネティクスの夢をみるか? / Do SREs Dream of Cybernetics?
yuukit
2
200
AIスパコン「さくらONE」のLLM学習ベンチマークによる性能評価 / SAKURAONE LLM Training Benchmarking
yuukit
2
900
Sat2City:3D City Generation from A Single Satellite Image with Cascaded Latent Diffusion
satai
4
340
AlphaEarth Foundations: An embedding field model for accurate and efficient global mapping from sparse label data
satai
3
540
日本語新聞記事を用いた大規模言語モデルの暗記定量化 / LLMC2025
upura
0
370
Featured
See All Featured
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
GraphQLとの向き合い方2022年版
quramy
50
14k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.3k
GitHub's CSS Performance
jonrohan
1032
470k
Agile that works and the tools we love
rasmusluckow
331
21k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.3k
Music & Morning Musume
bryan
46
7k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
Speed Design
sergeychernyshev
33
1.4k
Unsuck your backbone
ammeep
671
58k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Code Review Best Practice
trishagee
74
19k
Transcript
ジャズの文法と機械学習 Music×Analytics Meetup Vol.4 by Lystahi (りすたひ) Feb. 26th, 2021
内容 ・自己紹介 ・今日の話について ・ジャズとは ・分析とは ・ジャズの文法と機械学習 ・Machine Learning of Jazz
Grammars ・deepjazz ・BebopNet
自己紹介 ・Lystahi(りすたひ) ・お昼はデータサイエンティスト ・夜はミュージシャン
今日の話について ・含まないもの ジャズ自体の分析 ・含むもの ジャズ分析プロジェクトの紹介 ジャズ分析プロジェクトの分析
ジャズとは ジャズは、19世紀後半から20世紀初頭にかけて、米国ルイジアナ州ニューオーリンズのアフリ カ系アメリカ人コミュニティで生まれた音楽ジャンルであり、そのルーツはブルースとラグタイム です。1920年代のジャズエイジ以来、アフリカ系アメリカ人とヨーロッパ系アメリカ人の音楽の親 子関係の共通の絆によって結び付けられた、伝統音楽やポピュラー音楽の主要な音楽表現と して認識されてきました。ジャズは、スイングとブルーノート、複雑なコード、コールアンドレスポ ンスのボーカル、ポリリズム、即興演奏が特徴です。ジャズは西アフリカの文化的および音楽 的表現、そしてアフリカ系アメリカ人の音楽の伝統にルーツを持っています 。 https://en.wikipedia.org/wiki/Jazz
Translated by Google Translate
分析とは 「分析とは何か?」僕の答えは「分析とは比較、すなわち比べること」というものだ。 分析と言われるものに共通するのは、フェアに対象同士を比べ、その違いを見るこ とだ。 安宅和人. イシューからはじめよ 知的生産の「シンプルな本質」 (Japanese Edition) (Kindle
Locations 1365-1367). Kindle Edition.
ジャズの文法と機械学習 ・Machine Learning of Jazz Grammars ジャズの文法を機械学習したもの (論文は公開。プログラムと音源は非公開か?) ・deepjazz 深層学習でジャズの曲を生成するハッカソンでの成果物
・BebopNet AIを用いてビバップ(ジャズの一種)の即興演奏を生成する試み
Machine Learning of Jazz Grammars Jon Gillick, ∗ Kevin Tang,
† and Robert M. Keller ∗∗ http://ai.stanford.edu/~kdtang/papers/cmj10-jazzgrammar.pdf
論文の概要 確率的文法を使用して新しいジャズソロを生成できる教育用ソフトウェアツール(Keller 2007)のコンテキストで、この論文では、そのような文法の自動学習について説明 学習は、通常は1人の演奏者からの文字起こしのコーパスから行われ、私たちの方法で は、そのようなスタイルを表すソロを即興で演奏しようとする 特定のソリストの慣用的なジェスチャーをキャプチャするために、以前の文法表現 (Keller and Morrison 2007)を拡張
None
None
Jazz Improvisation 理想的には、ジャズの即興演奏には、メロディー自体が演奏されている間に新しいメロ ディーを作成することが含まれる このプロセスは、パフォーマンスの前に語彙のアイデアを事前に作成して実践すること によって通知されることがよくある
Melody Generation Based on Abstraction ジャズソロの生成の目的は、いくつかの構造的および調和的なガイドラインを遵守しな がら、斬新さを生み出すこと メロディックな抽象化は分析において明らかな用途があるが、生成においても非常に有 用である たとえば、最初にメロディの抽象化を生成し、次にその抽象化を実際の再生可能なメロ
ディにインスタンス化することによって、メロディを生成できる
Clustering メロディサイドの再結合の多様性を高めるために、k-meansクラスタリングアルゴリズム を使用して類似の抽象的なメロディーをクラスター化する(Hartiganand Wong1979) 次に、どのクラスターがコーパス内の他のクラスターに続くかを表す統計を収集し、それ に応じて、クラスターをマルコフ連鎖の状態として使用して確率のテーブルを作成する
Qualitative Results 4〜8小節の短いソロの場合、アルゴリズムの構成は通常、適度に有能なジャズソリスト のように聞こえ、時にはアーティストの説得力のある模倣のように聞こえることがわかっ た。 ソロが長くなると、方向感覚が失われやすくなった。
deepjazz Ji-Sung Kim https://deepjazz.io/
Listen https://soundcloud.com/deepjazz-ai/sets/deepjazz-o n-metheny
deepjazz ハッカソンで36時間で作られた。 ディープラーニングライブラリであるKeras&Theanoを使用して、ジャズ音楽を生成す る。 具体的には、指定されたMIDIファイルから学習して2層のLSTMを構築する。 GoogleのAlphaGoとIBMのWatsonを強化するAI技術であるディープラーニングを使用 して、音楽を作成する。 非常に人間的なものと見なされている。(本人談) https://deepjazz.io/
BebopNet: Neural Models for Jazz Improvisations Shunit Haviv Hakimi, Nadav
Bhonker, and Ran El-Yaniv AIを用いてビバップ(ジャズの一種)のパーソナライズされた即興演奏を生成 https://program.ismir2020.net/static/final_papers/132.pdf
Listen https://shunithaviv.github.io/bebopnet/
要約 この論文では、パーソナライズされた音楽の生成に取り組み、ユーザー固有の音楽の好みを学習して最適化する音楽生成 の新しいパイプラインを提案。シンボルベース、モノフォニック、ハーモニーに制約のあるジャズの即興演奏に焦点を当てて いる。 パーソナライズパイプラインは、 Bebopの巨人によるジャズの即興のコーパスでトレーニングされた音楽言語モデルである BebopNetから始まる。 BebopNetは、特定のコード進行に基づいて即興演奏を生成できる。次に、特定のユーザーによって ラベル付けされたパーソナライズされたデータセットを組み立て、このユーザーのユニークな音楽の好みを反映するユー ザー固有のメトリックをトレーニングする。最後に、
BebopNetを使用したビーム検索のパーソナライズされたバリアントを使用 して、そのユーザー向けに生成されたジャズの即興演奏を最適化する。 結果は、個人的なジャズの好みをモデル化して最適化し、個人化された芸術の世代における将来の研究の基盤を提供する ことが可能であることを示している。また、創造性に関連する問題を含め、私たちの仕事から生じる機会、課題、および質問 について簡単に説明する。
分析とは 「分析とは比較、すなわち比べること」(再掲) ・Machine Learning of Jazz Grammars(MLJG) ・deepjazz (DJ) ・BebopNet(BN)
ジャズの分析プロジェクトの分析 ・Machine Learning of Jazz Grammars(MLJG) ・deepjazz (DJ) ・BebopNet(BN) 統計的機械学習
深層学習 ソロ(アドリブ) 曲全体
ジャズの分析プロジェクトの分析 ・Machine Learning of Jazz Grammars(MLJG) ・deepjazz (DJ) ・BebopNet(BN) 統計的機械学習
MLJG ??? 深層学習 BN DJ ソロ(アドリブ) 曲全体
E.O.F.