Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
DeepComposer ~ Hello GAN World ~ / DeepComposer...
Search
y-danno
December 09, 2019
Technology
1
740
DeepComposer ~ Hello GAN World ~ / DeepComposer, Hello GAN World
AWS re:Invent 2019 Recap JAWS-UG 横浜
#jawsug #jawsugyokohama #deepcomposer
y-danno
December 09, 2019
Tweet
Share
More Decks by y-danno
See All by y-danno
AWS re:Invent 2019 視察レポート / aws-reinvent-2019-recap-aws-seminar
danno
0
400
Load to Cloud by Default
danno
0
53
BigQuery を利用した視聴データのリアルタイム ダッシュボード構築〜Google Cloud Next'19 in Tokyo〜 / TV Logs Realtime Dashboard with BigQuery and DataPortal
danno
0
630
(再掲)Media ServicesとAIを利用した字幕付きライブ配信 / Live Streaming with AWS MediaServices and AI
danno
0
220
AWS re:Invent 2018 の視察レポート 海外メディア業界における クラウド最新動向を学ぶ / AWS reInvent 2019 recap trend in media industry
danno
0
52
Video QoEへの取り組み
danno
1
930
Firebaseを活用したPUSH通知基盤構築
danno
4
6.5k
Other Decks in Technology
See All in Technology
AI駆動開発を実現するためのアーキテクチャと取り組み
baseballyama
17
12k
Service Monitoring Platformについて
lycorptech_jp
PRO
0
350
IaC を使いたくないけどポリシー管理をどうにかしたい
kazzpapa3
1
160
技術広報のOKRで生み出す 開発組織への価値 〜 カンファレンス協賛を通して育む学びの文化 〜 / Creating Value for Development Organisations Through Technical Communications OKRs — Nurturing a Culture of Learning Through Conference Sponsorship —
pauli
5
540
持続可能なアクセシビリティ開発
azukiazusa1
6
320
Datadog LLM Observabilityで実現するLLMOps実践事例 / practical-llm-observability-with-datadog
k6s4i53rx
0
130
重厚長大企業で、顧客価値をスケールさせるためのプロダクトづくりとプロダクト開発チームづくりの裏側 / Developers X Summit 2025
mongolyy
0
190
スタートアップの事業成長を支えるアーキテクチャとエンジニアリング
doragt
1
7.4k
メッセージ駆動が可能にする結合の最適化
j5ik2o
9
1.5k
なぜブラウザで帳票を生成したいのか どのようにブラウザで帳票を生成するのか
yagisanreports
1
200
LINEヤフー バックエンド組織・体制の紹介
lycorptech_jp
PRO
0
850
ECS組み込みのBlue/Greenデプロイを動かしてELB側の動きを観察してみる
yuki_ink
3
410
Featured
See All Featured
GraphQLの誤解/rethinking-graphql
sonatard
73
11k
RailsConf 2023
tenderlove
30
1.3k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3k
Why Our Code Smells
bkeepers
PRO
340
57k
The Cult of Friendly URLs
andyhume
79
6.7k
Faster Mobile Websites
deanohume
310
31k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
The Cost Of JavaScript in 2023
addyosmani
55
9.3k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.3k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.2k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.5k
Transcript
2019/12/10 JAWS-UG横浜 #19 AWS re:Invent 2019 Recap いま何かと話題の… DeepComposer ~
Hello GAN World ~ TV TOKYO Corporation 段野 祐一郎 (@ydanno)
このスライドは connpass上に アップしています!
情シス 局長 0.997 段野 祐一郎 @ydanno Media-JAWS 運営 株式会社テレビ東京 動画配信技術、データ分析基盤、
人材育成・採用、技術戦略 担当 AWS re:Invent 3 回目 (2017, 2018, 2019) 戦績:-$88, 累計:-$278 今年は会社から初めて2名で参加 平社員 0.999
私) Media Servicesのアップデート期待! ↓ 初日のAWS Experts MTG AWS )「そんなの一個もないよ」 ↓
完 制作・著作 ━━━━━ ⓃⒽⓀ
例年以上に全力で 楽しんできました! チキン大食い競争 Tatonka 4K/8K チャリティラン AWS Global User Group
MTG ワークショップ x 5 DeepComposer, DeepLens, IoT dispenser, AI/ML for Media, WEB AR by Sumerian 超高所絶叫マシーン Insanity AWS主催音楽FES Intersect
今回一番推しの発表は、AWS Local Zones !!! 放送運行のような低遅延処理が求められるシステムでは必須 アメリカ放送局FOXが導入を予定していると発表
今回の LT テーマは ワークショップにも参加した DeepComposer !
Deep 3姉弟 ※イメージ ・教師あり機械学習モデルで しっかりものの長女 DeepLens ・強化学習モデルで やんちゃな次男 DeepRacer ・教師なし機械学習モデル、GAN学習用の 音楽好きで真面目な三女
DeepComposer すべての開発者に機械学習を イタズラ好きでわんぱく。 頭の回転は早く行動力や判断力も高い 明るく陽気でしっかりものだが、 一方でおっちょこちょい 心優しく、真面目 想像力が豊かで即興の歌を作る才能 ©フジテレビ
AWS DeepComposer 開発者が Generative AI で 作成されたモデルを使って 自分でつけたフレーズに伴奏 を自動でつけてくれるAI 「自動作曲」のためのツール
最近の音楽制作業界において AIの猛威は凄い。 右図は AI マスタリングソフト iZotope。 AWS参入で音楽制作もクラウド /AI化の流れが加速しそう!
新サービスの前フリはあった JAWS-UG 福岡の内村さんが FBグループで異様にリピート 数の多いワークショップを 見つけていた そのワークショップ AIM223 が今回の DeepComposer
の ワークショップになった!
おかげでDeepComposer、GETしてきました! 内村さん、Thank you very much! 実機持ってきたので、みなさん、触って下さい!!!
米アマゾンでは 2020/3/16リリース予定で 予約受付されてます
DeepComposerをGETした喜びも つかの間… このTwitterの投稿写真に、 とんでもないものが紛れ込んで しまっていた… もうおわかりいただけただろうか?
None
(某 心霊番組 調)
コーヒーじゃない!!!
None
!!!
DeepComposer ≠ キーボード DeepComposer = Generative AI DeepLens・DeepRacerと違って、 MIDIデータをインプットすれば 自由に成果物を体験・シェアできる!
(キーボードOEMかよ!というツッコミはナシよ。)
要 注 意
コンソールに仮想キーボードもあるので 誰でも使える!試せる!! Previewが待ち遠しいですね!
これだと内容が薄すぎるので、 ワークショップで得た内容をシェア
GANは産業界ではすでに、 機体や歯のプラントのモデリングで使われている
サンプルは「きらきら星」。右上の「モデル」から学習モデルを選択し、 「Generate Composition」を押すと、楽器の音が生成される。
学習済みモデルとして、ジャズ/Pop/Rock/シンフォニーの他、 ジョナサンコールトン(プログラマーでシンガーソングライター. コーディングやギークカルチャーをテーマとする歌を謳ってる)が 用意されていた(アメリカン・ジョーク)
作成した楽曲は、MIDIやMP3でのダウンロードの他、 SoundCloudでシェアできる。
deepcomposer で検索すると68曲あります。 クラスメソッド 宮島さんも15曲アップしてました。さすが…
カスタムモデルは、SageMaker(jupyter notebook)で作成
2次元グラフ化 ピアノロールは、 ・時間 ・ピッチ を備えた2次元のグリッド として見ることができる 音楽を2次元データの グラフとして処理する! ピアノと機械学習は相性が良い
https://www.freecodecamp.org/news/an-intuitive-introduction -to-generative-adversarial-networks-gans-7a2264a81394/ GAN(Generative Adversarial Networks) 貨幣の偽造者(Generator)と、それを見抜く警察(Discriminator) 2つのモデルを競合するように学習させていく
DeepComposer ワークショップでは GAN に WGAN-GP(Wasserstein GAN with Gradient Penalty) Generator
ネットワーク構成に U-Net を採用して精度を高めているとのこと(お勉強中…)
aws-samples/aws-deepcomposer-samples
所感 YouTuber 等、オリジナル音源を使いたい人にはマッチしそう。 プロも参考には使えるかも。 学習用に使う楽曲の著作権、GANで生成した音楽の著作権は どうなるのか??? 「音楽を編曲する」という目的が明確化されているので、 GAN を学ぶキッカケには良さそう!
ヤマハ社のAI音声技術で美空ひばりの歌声を再現! 大晦日 紅白で見られます! https://www.itmedia.co.jp/news/articles/1911/14/news139.html ©NHK
[PR] 年末年始の夜のテレ東は、 「三夜連続“美食晩餐会”」! 12月31日 1月1日 1月2日 紅白は 「美空ひばりAI」 を見終わったら
テレ東で「孤独のグルメ」を見てね!!
NOV30 - DEC4, 2020, Las Vegas