Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepComposer ~ Hello GAN World ~ / DeepComposer...
Search
y-danno
December 09, 2019
Technology
1
750
DeepComposer ~ Hello GAN World ~ / DeepComposer, Hello GAN World
AWS re:Invent 2019 Recap JAWS-UG 横浜
#jawsug #jawsugyokohama #deepcomposer
y-danno
December 09, 2019
Tweet
Share
More Decks by y-danno
See All by y-danno
AWS re:Invent 2019 視察レポート / aws-reinvent-2019-recap-aws-seminar
danno
0
400
Load to Cloud by Default
danno
0
55
BigQuery を利用した視聴データのリアルタイム ダッシュボード構築〜Google Cloud Next'19 in Tokyo〜 / TV Logs Realtime Dashboard with BigQuery and DataPortal
danno
0
640
(再掲)Media ServicesとAIを利用した字幕付きライブ配信 / Live Streaming with AWS MediaServices and AI
danno
0
230
AWS re:Invent 2018 の視察レポート 海外メディア業界における クラウド最新動向を学ぶ / AWS reInvent 2019 recap trend in media industry
danno
0
53
Video QoEへの取り組み
danno
1
940
Firebaseを活用したPUSH通知基盤構築
danno
4
6.6k
Other Decks in Technology
See All in Technology
Digitization部 紹介資料
sansan33
PRO
1
6.4k
2025年のデザインシステムとAI 活用を振り返る
leveragestech
0
750
Introduction to Bill One Development Engineer
sansan33
PRO
0
340
AIと融ける人間の冒険
pujisi
0
110
Keynoteから見るAWSの頭の中
nrinetcom
PRO
1
170
自己管理型チームと個人のセルフマネジメント 〜モチベーション編〜
kakehashi
PRO
5
2.4k
Oracle Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
2
770
BidiAgent と Nova 2 Sonic から考える音声 AI について
yama3133
2
150
AI: The stuff that nobody shows you
jnunemaker
PRO
1
160
田舎で20年スクラム(後編):一個人が企業で長期戦アジャイルに挑む意味
chinmo
1
1.3k
【Agentforce Hackathon Tokyo 2025 発表資料】みらいシフト:あなた働き方を、みらいへシフト。
kuratani
0
110
Eight Engineering Unit 紹介資料
sansan33
PRO
0
6.2k
Featured
See All Featured
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
73
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
300
Mobile First: as difficult as doing things right
swwweet
225
10k
How to Talk to Developers About Accessibility
jct
1
94
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Bash Introduction
62gerente
615
210k
Bioeconomy Workshop: Dr. Julius Ecuru, Opportunities for a Bioeconomy in West Africa
akademiya2063
PRO
0
37
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Code Reviewing Like a Champion
maltzj
527
40k
The Hidden Cost of Media on the Web [PixelPalooza 2025]
tammyeverts
2
130
How to train your dragon (web standard)
notwaldorf
97
6.5k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Transcript
2019/12/10 JAWS-UG横浜 #19 AWS re:Invent 2019 Recap いま何かと話題の… DeepComposer ~
Hello GAN World ~ TV TOKYO Corporation 段野 祐一郎 (@ydanno)
このスライドは connpass上に アップしています!
情シス 局長 0.997 段野 祐一郎 @ydanno Media-JAWS 運営 株式会社テレビ東京 動画配信技術、データ分析基盤、
人材育成・採用、技術戦略 担当 AWS re:Invent 3 回目 (2017, 2018, 2019) 戦績:-$88, 累計:-$278 今年は会社から初めて2名で参加 平社員 0.999
私) Media Servicesのアップデート期待! ↓ 初日のAWS Experts MTG AWS )「そんなの一個もないよ」 ↓
完 制作・著作 ━━━━━ ⓃⒽⓀ
例年以上に全力で 楽しんできました! チキン大食い競争 Tatonka 4K/8K チャリティラン AWS Global User Group
MTG ワークショップ x 5 DeepComposer, DeepLens, IoT dispenser, AI/ML for Media, WEB AR by Sumerian 超高所絶叫マシーン Insanity AWS主催音楽FES Intersect
今回一番推しの発表は、AWS Local Zones !!! 放送運行のような低遅延処理が求められるシステムでは必須 アメリカ放送局FOXが導入を予定していると発表
今回の LT テーマは ワークショップにも参加した DeepComposer !
Deep 3姉弟 ※イメージ ・教師あり機械学習モデルで しっかりものの長女 DeepLens ・強化学習モデルで やんちゃな次男 DeepRacer ・教師なし機械学習モデル、GAN学習用の 音楽好きで真面目な三女
DeepComposer すべての開発者に機械学習を イタズラ好きでわんぱく。 頭の回転は早く行動力や判断力も高い 明るく陽気でしっかりものだが、 一方でおっちょこちょい 心優しく、真面目 想像力が豊かで即興の歌を作る才能 ©フジテレビ
AWS DeepComposer 開発者が Generative AI で 作成されたモデルを使って 自分でつけたフレーズに伴奏 を自動でつけてくれるAI 「自動作曲」のためのツール
最近の音楽制作業界において AIの猛威は凄い。 右図は AI マスタリングソフト iZotope。 AWS参入で音楽制作もクラウド /AI化の流れが加速しそう!
新サービスの前フリはあった JAWS-UG 福岡の内村さんが FBグループで異様にリピート 数の多いワークショップを 見つけていた そのワークショップ AIM223 が今回の DeepComposer
の ワークショップになった!
おかげでDeepComposer、GETしてきました! 内村さん、Thank you very much! 実機持ってきたので、みなさん、触って下さい!!!
米アマゾンでは 2020/3/16リリース予定で 予約受付されてます
DeepComposerをGETした喜びも つかの間… このTwitterの投稿写真に、 とんでもないものが紛れ込んで しまっていた… もうおわかりいただけただろうか?
None
(某 心霊番組 調)
コーヒーじゃない!!!
None
!!!
DeepComposer ≠ キーボード DeepComposer = Generative AI DeepLens・DeepRacerと違って、 MIDIデータをインプットすれば 自由に成果物を体験・シェアできる!
(キーボードOEMかよ!というツッコミはナシよ。)
要 注 意
コンソールに仮想キーボードもあるので 誰でも使える!試せる!! Previewが待ち遠しいですね!
これだと内容が薄すぎるので、 ワークショップで得た内容をシェア
GANは産業界ではすでに、 機体や歯のプラントのモデリングで使われている
サンプルは「きらきら星」。右上の「モデル」から学習モデルを選択し、 「Generate Composition」を押すと、楽器の音が生成される。
学習済みモデルとして、ジャズ/Pop/Rock/シンフォニーの他、 ジョナサンコールトン(プログラマーでシンガーソングライター. コーディングやギークカルチャーをテーマとする歌を謳ってる)が 用意されていた(アメリカン・ジョーク)
作成した楽曲は、MIDIやMP3でのダウンロードの他、 SoundCloudでシェアできる。
deepcomposer で検索すると68曲あります。 クラスメソッド 宮島さんも15曲アップしてました。さすが…
カスタムモデルは、SageMaker(jupyter notebook)で作成
2次元グラフ化 ピアノロールは、 ・時間 ・ピッチ を備えた2次元のグリッド として見ることができる 音楽を2次元データの グラフとして処理する! ピアノと機械学習は相性が良い
https://www.freecodecamp.org/news/an-intuitive-introduction -to-generative-adversarial-networks-gans-7a2264a81394/ GAN(Generative Adversarial Networks) 貨幣の偽造者(Generator)と、それを見抜く警察(Discriminator) 2つのモデルを競合するように学習させていく
DeepComposer ワークショップでは GAN に WGAN-GP(Wasserstein GAN with Gradient Penalty) Generator
ネットワーク構成に U-Net を採用して精度を高めているとのこと(お勉強中…)
aws-samples/aws-deepcomposer-samples
所感 YouTuber 等、オリジナル音源を使いたい人にはマッチしそう。 プロも参考には使えるかも。 学習用に使う楽曲の著作権、GANで生成した音楽の著作権は どうなるのか??? 「音楽を編曲する」という目的が明確化されているので、 GAN を学ぶキッカケには良さそう!
ヤマハ社のAI音声技術で美空ひばりの歌声を再現! 大晦日 紅白で見られます! https://www.itmedia.co.jp/news/articles/1911/14/news139.html ©NHK
[PR] 年末年始の夜のテレ東は、 「三夜連続“美食晩餐会”」! 12月31日 1月1日 1月2日 紅白は 「美空ひばりAI」 を見終わったら
テレ東で「孤独のグルメ」を見てね!!
NOV30 - DEC4, 2020, Las Vegas