Upgrade to Pro — share decks privately, control downloads, hide ads and more …

音楽生成AIを利活用した即興演奏の実践

brightwaltz
November 05, 2022

 音楽生成AIを利活用した即興演奏の実践

第二回創作+機械学習LT会での発表スライドです。

brightwaltz

November 05, 2022
Tweet

Other Decks in Technology

Transcript

  1. 今⽇の流れ ▪ ⾳楽⽣成AIの例 ▪ 即興演奏への応⽤ – [実践] AIを使った即興演奏の紹介: Imaginary Soundscape,

    RAVE – [実践] 即興演奏を学習させて⾳楽⽣成: Dance Diffusion – [実演] リアルタイム演奏: Drumify ▪ おわりに
  2. Qosmo, ⾳楽⽣成AIの現状と可能性 2022年度版 https://qosmo.jp/publication/musicai-whitepaper/ MIDI 波形 画像 ⼊⼒された画像に適切なサウンドクリップを⾒つけるSoundify Soundify: Matching

    Sound Effects to Video ( David Chuan-En Lin ) https://chuanenlin.com/soundify/ https://arxiv.org/abs/2112.09726 <⾳楽⽣成の例> Image to Sound
  3. <⾳楽⽣成の例> Qosmo, ⾳楽⽣成AIの現状と可能性 2022年度版 https://qosmo.jp/publication/musicai-whitepaper/ MIDI 波形 多様な⼊⼒ Text to

    Music Image to Music ( by fffiloni ) a photo of bright sunny forest, humid, strong golden lighting, Nikon D4 and Nikon Lens 50mm F1.4 Image -> (CLIP) -> Text -> (Mubert) -> Music Text to Image (DALL·E) ( Mubert )
  4. 即興演奏への応⽤ 1. ⽣成された⾳(リズム等)をベースに即興演奏 Imaginary Soundscapeで挑戦︕ 2. 即興演奏を学習させて⾳楽⽣成 Dance Diffusionで挑戦︕ 3.

    リアルタイム演奏 1. Drumify(Magenta)で実演︕(LT会後) 2. AI DJ プロジェクトを紹介 3. 簡単に即興演奏できるPiano Genieを紹介 AI ⼈ AI ⼈ AI ⼈
  5. 即興演奏への応⽤ 1-1.Image to Music/Soundを使った即興演奏 ▪ Imaginary Soundscape(Qosmo) https://www.imaginarysoundscape.net イメージに合う画像を⽣成 →

    ⾳源⽣成 → ピアノ即興演奏 → 合成して 完成 by DALL·E a photo of bright sunny forest, humid, strong golden lighting, Nikon D4 and Nikon Lens 50mm F1.4
  6. おわりに ▪ ⾳楽⽣成AIを使って下記3パターンの即興演奏に挑戦 – [実践] AIを使った即興演奏の紹介: Imaginary Soundscape, RAVE –

    [実践] 即興演奏を学習させて⾳楽⽣成: Dance Diffusion ▪ 「MagentaのMUSIC TRANSFORMERのようなMIDI⽣成」 「Dance Diffusionのような波形⽣成」 どちらが発展するだろうか ▪ 作曲する⽴場としては、完成された楽曲の⽣成より、 「⼀部だけ⽣成」や「新たな発想を⽣む種のような⾳」がほしい ▪ 将来的にマルチモーダル⼊⼒による⾳楽⽣成とかもあり得るんだ ろうか
  7. その他の⾳楽⽣成AI(サイトで試せます) ▪ Jukebox(OpenAI) – https://openai.com/blog/jukebox/ – https://jukebox.openai.com/?song=787770742 ▪ MuseNet (OpenAI)

    – https://openai.com/blog/musenet/ ▪ Lo-Fi Player (Google Magenta) – https://magenta.tensorflow.org/lofi-player ▪ MUSIC TRANSFORMER (Google Magenta) – https://magenta.tensorflow.org/music-transformer ▪ Text to Music (Mubert) – https://mubert.com – https://huggingface.co/spaces/Mubert/Text-to-Music ▪ Image to Music (Image -> (CLIP) -> Text -> (Mubert) -> Music ) – https://huggingface.co/spaces/fffiloni/img-to-music 他︓https://note.com/npaka/n/n48caad0f699f