Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepComposer ~ Hello GAN World ~ / DeepComposer...
Search
y-danno
December 09, 2019
Technology
1
630
DeepComposer ~ Hello GAN World ~ / DeepComposer, Hello GAN World
AWS re:Invent 2019 Recap JAWS-UG 横浜
#jawsug #jawsugyokohama #deepcomposer
y-danno
December 09, 2019
Tweet
Share
More Decks by y-danno
See All by y-danno
AWS re:Invent 2019 視察レポート / aws-reinvent-2019-recap-aws-seminar
danno
0
350
Load to Cloud by Default
danno
0
47
BigQuery を利用した視聴データのリアルタイム ダッシュボード構築〜Google Cloud Next'19 in Tokyo〜 / TV Logs Realtime Dashboard with BigQuery and DataPortal
danno
0
580
(再掲)Media ServicesとAIを利用した字幕付きライブ配信 / Live Streaming with AWS MediaServices and AI
danno
0
150
AWS re:Invent 2018 の視察レポート 海外メディア業界における クラウド最新動向を学ぶ / AWS reInvent 2019 recap trend in media industry
danno
0
46
Video QoEへの取り組み
danno
1
860
Firebaseを活用したPUSH通知基盤構築
danno
4
6.1k
Other Decks in Technology
See All in Technology
オープンソースAIとは何か? --「オープンソースAIの定義 v1.0」詳細解説
shujisado
7
800
ドメインの本質を掴む / Get the essence of the domain
sinsoku
2
150
20241120_JAWS_東京_ランチタイムLT#17_AWS認定全冠の先へ
tsumita
2
250
Platform Engineering for Software Developers and Architects
syntasso
1
520
Amazon Personalizeのレコメンドシステム構築、実際何するの?〜大体10分で具体的なイメージをつかむ〜
kniino
1
100
安心してください、日本語使えますよ―Ubuntu日本語Remix提供休止に寄せて― 2024-11-17
nobutomurata
1
990
ISUCONに強くなるかもしれない日々の過ごしかた/Findy ISUCON 2024-11-14
fujiwara3
8
870
iOS/Androidで同じUI体験をネ イティブで作成する際に気をつ けたい落とし穴
fumiyasac0921
1
110
TypeScript、上達の瞬間
sadnessojisan
46
13k
Shopifyアプリ開発における Shopifyの機能活用
sonatard
4
250
[CV勉強会@関東 ECCV2024 読み会] オンラインマッピング x トラッキング MapTracker: Tracking with Strided Memory Fusion for Consistent Vector HD Mapping (Chen+, ECCV24)
abemii
0
220
Oracle Cloud Infrastructureデータベース・クラウド:各バージョンのサポート期間
oracle4engineer
PRO
28
12k
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
28
2k
Building a Scalable Design System with Sketch
lauravandoore
459
33k
What's new in Ruby 2.0
geeforr
343
31k
Optimizing for Happiness
mojombo
376
70k
Building Applications with DynamoDB
mza
90
6.1k
Embracing the Ebb and Flow
colly
84
4.5k
Ruby is Unlike a Banana
tanoku
97
11k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
6.9k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.3k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
250
21k
The Language of Interfaces
destraynor
154
24k
Transcript
2019/12/10 JAWS-UG横浜 #19 AWS re:Invent 2019 Recap いま何かと話題の… DeepComposer ~
Hello GAN World ~ TV TOKYO Corporation 段野 祐一郎 (@ydanno)
このスライドは connpass上に アップしています!
情シス 局長 0.997 段野 祐一郎 @ydanno Media-JAWS 運営 株式会社テレビ東京 動画配信技術、データ分析基盤、
人材育成・採用、技術戦略 担当 AWS re:Invent 3 回目 (2017, 2018, 2019) 戦績:-$88, 累計:-$278 今年は会社から初めて2名で参加 平社員 0.999
私) Media Servicesのアップデート期待! ↓ 初日のAWS Experts MTG AWS )「そんなの一個もないよ」 ↓
完 制作・著作 ━━━━━ ⓃⒽⓀ
例年以上に全力で 楽しんできました! チキン大食い競争 Tatonka 4K/8K チャリティラン AWS Global User Group
MTG ワークショップ x 5 DeepComposer, DeepLens, IoT dispenser, AI/ML for Media, WEB AR by Sumerian 超高所絶叫マシーン Insanity AWS主催音楽FES Intersect
今回一番推しの発表は、AWS Local Zones !!! 放送運行のような低遅延処理が求められるシステムでは必須 アメリカ放送局FOXが導入を予定していると発表
今回の LT テーマは ワークショップにも参加した DeepComposer !
Deep 3姉弟 ※イメージ ・教師あり機械学習モデルで しっかりものの長女 DeepLens ・強化学習モデルで やんちゃな次男 DeepRacer ・教師なし機械学習モデル、GAN学習用の 音楽好きで真面目な三女
DeepComposer すべての開発者に機械学習を イタズラ好きでわんぱく。 頭の回転は早く行動力や判断力も高い 明るく陽気でしっかりものだが、 一方でおっちょこちょい 心優しく、真面目 想像力が豊かで即興の歌を作る才能 ©フジテレビ
AWS DeepComposer 開発者が Generative AI で 作成されたモデルを使って 自分でつけたフレーズに伴奏 を自動でつけてくれるAI 「自動作曲」のためのツール
最近の音楽制作業界において AIの猛威は凄い。 右図は AI マスタリングソフト iZotope。 AWS参入で音楽制作もクラウド /AI化の流れが加速しそう!
新サービスの前フリはあった JAWS-UG 福岡の内村さんが FBグループで異様にリピート 数の多いワークショップを 見つけていた そのワークショップ AIM223 が今回の DeepComposer
の ワークショップになった!
おかげでDeepComposer、GETしてきました! 内村さん、Thank you very much! 実機持ってきたので、みなさん、触って下さい!!!
米アマゾンでは 2020/3/16リリース予定で 予約受付されてます
DeepComposerをGETした喜びも つかの間… このTwitterの投稿写真に、 とんでもないものが紛れ込んで しまっていた… もうおわかりいただけただろうか?
None
(某 心霊番組 調)
コーヒーじゃない!!!
None
!!!
DeepComposer ≠ キーボード DeepComposer = Generative AI DeepLens・DeepRacerと違って、 MIDIデータをインプットすれば 自由に成果物を体験・シェアできる!
(キーボードOEMかよ!というツッコミはナシよ。)
要 注 意
コンソールに仮想キーボードもあるので 誰でも使える!試せる!! Previewが待ち遠しいですね!
これだと内容が薄すぎるので、 ワークショップで得た内容をシェア
GANは産業界ではすでに、 機体や歯のプラントのモデリングで使われている
サンプルは「きらきら星」。右上の「モデル」から学習モデルを選択し、 「Generate Composition」を押すと、楽器の音が生成される。
学習済みモデルとして、ジャズ/Pop/Rock/シンフォニーの他、 ジョナサンコールトン(プログラマーでシンガーソングライター. コーディングやギークカルチャーをテーマとする歌を謳ってる)が 用意されていた(アメリカン・ジョーク)
作成した楽曲は、MIDIやMP3でのダウンロードの他、 SoundCloudでシェアできる。
deepcomposer で検索すると68曲あります。 クラスメソッド 宮島さんも15曲アップしてました。さすが…
カスタムモデルは、SageMaker(jupyter notebook)で作成
2次元グラフ化 ピアノロールは、 ・時間 ・ピッチ を備えた2次元のグリッド として見ることができる 音楽を2次元データの グラフとして処理する! ピアノと機械学習は相性が良い
https://www.freecodecamp.org/news/an-intuitive-introduction -to-generative-adversarial-networks-gans-7a2264a81394/ GAN(Generative Adversarial Networks) 貨幣の偽造者(Generator)と、それを見抜く警察(Discriminator) 2つのモデルを競合するように学習させていく
DeepComposer ワークショップでは GAN に WGAN-GP(Wasserstein GAN with Gradient Penalty) Generator
ネットワーク構成に U-Net を採用して精度を高めているとのこと(お勉強中…)
aws-samples/aws-deepcomposer-samples
所感 YouTuber 等、オリジナル音源を使いたい人にはマッチしそう。 プロも参考には使えるかも。 学習用に使う楽曲の著作権、GANで生成した音楽の著作権は どうなるのか??? 「音楽を編曲する」という目的が明確化されているので、 GAN を学ぶキッカケには良さそう!
ヤマハ社のAI音声技術で美空ひばりの歌声を再現! 大晦日 紅白で見られます! https://www.itmedia.co.jp/news/articles/1911/14/news139.html ©NHK
[PR] 年末年始の夜のテレ東は、 「三夜連続“美食晩餐会”」! 12月31日 1月1日 1月2日 紅白は 「美空ひばりAI」 を見終わったら
テレ東で「孤独のグルメ」を見てね!!
NOV30 - DEC4, 2020, Las Vegas