データ・AI 活用最前線：「Data Augmentation （データ拡張）」という新しい常識

by Masaya Mori (森正弥) / Partner of Deloitte Digital

Slide 1

Slide 1 text

データ/AI活用最前線: 「Data Augmentation（データ拡張）」という新しい常識森正弥 Feb/2020 https://note.mu/masayamori

Slide 2

Slide 2 text

2 インドでの Deep Learning ハッカソン料理画像からの識別参加者はみな最新の手法に通じていて、、、

Slide 3

Slide 3 text

3 • 企業情報化協会 AI&ロボティクス委員長 • 日本データベース学会理事 • APEC（アジア太平洋経済協力）データ・アナリティクス人材育成プロジェクトアドバイザー • 楽天株式会社執行役員森正弥 https://note.mu/masayamori • 先端技術の動向の情報発信を行い、産業横断的な公職にも携わる • 楽天では、開発組織のグローバル化、研究開発の統括を行い、AI を用いた新サービスも創出 Profile

Slide 4

Slide 4 text

4 「AI ネイティブなる世代に向けて」 https://note.mu/masayamori/n/n61f93076442e • 機械学習、深層学習を中心としたITサービスが、従来のモジュール型発想の開発手法とあわず、新しいアプローチを要求している • それらを自然に身につけたAIネイティブの世代が来ている

Slide 5

Slide 5 text

5 「AI を経営戦略の中心に据えるには？」 https://note.mu/masayamori/n/n4311ffd303d5 • 機械学習・深層学習の本質的な特徴を、いかに単機能の改善ではなく、組織的なプロセスに組み込んでいくか。 • そのためのマネジメントフレームワークとして、Prof. Ajay Agrawal の「AI Canvas」を紹介

Slide 6

Slide 6 text

6 楽天技術研究所：世界５カ国１５０名以上の研究者が所属 TOKYO SINGAPORE PARIS & NY BOSTON SAN MATEO BENGALURU

Slide 7

Slide 7 text

7 AI / Deep Learning の成果 ⚫ 画像認識（Rakutenラクマでの活用、楽天ドローンでの活用） ⚫ 顔認識（各グループ会社での活用、楽天Pay の顔認識ペイメント） ⚫ 機械翻訳（Video配信ビジネスでの７言語の字幕翻訳。世界レベルの精度） ⚫ 商品データの自動生成 ⚫ 顧客ニーズの抽出及び商品デザイン ⚫ 株価予測・マーケット予測 ⚫ 潜在顧客ターゲティング（Rakuten Airis） ⚫ 広告バナーの自動生成、商品解説文の自動生成（Creative AI) • Deep Learning による具体的なビジネスソリューションを創出

Slide 8

Slide 8 text

8 機械翻訳「Rakuten Translate」で日経DLビジネス活用アワード優秀賞を受賞

Slide 9

Slide 9 text

9 広告事業とともに企画した、データ＆Deep Learningを活用した新ビジネス AIris AIエージェントが顧客の個々の購買行動を解析し、予測する [Iris] “AI”（Artificial Intelligence：人工知能）と、英語で「虹彩」を意味する “Iris” を組み合わせた造語で、機械学習を用いた独自のアルゴリズムで消費行動を解析することで購買の見込みがあるユーザーを抽出することができる「Target Prospecting機能」を有しています。 2018年5月、深層学習を活用し、広告配信における高精度な拡張ターゲティングの新ビジネスを開始 Customer DNA Brand Mart • ブランドコード • デモグラフィック • 検索履歴 • ページ来場 • 購入履歴 • 価格選好 • 利用デバイス • アクセス時間 • 楽天サービスの利用 AIris インプット潜在顧客 Target Prospecting アイテム / ブランドシードユーザー Alrisのプロダクトデザイン

Slide 10

Slide 10 text

10 Deep Learning のトレンド「データが少ないのであれば、、、」

Slide 11

Slide 11 text

11 脅威の精度を実現した機械翻訳 Back Translation https://arxiv.org/abs/1808.09381

Slide 12

Slide 12 text

12 Next Paradigm is coming. Deep learning Small Dataset Big Dataset Great AI Deep learning So so AI Other Dataset 2nd Deep Learning Another so so AI Connect & Loop Learning Super AI Interactive Loop

Slide 13

Slide 13 text

13 Data Augmentation データ拡張キーワード

Slide 14

Slide 14 text

14 「Data Augmentation」 https://note.mu/masayamori/n/n63caf39a4cdf • データが少ない、あるいはばらつきがある中でもDeep Learning の高い性能を獲得することができる手法として注目される • Deep Learning の学習の謎に迫る手がかりの可能性

Slide 15

Slide 15 text

15 具体的な手法：言語データ • 同義語、類義語で置き換える • 類似度を計算して置き換える • 反意語で置き換える • 文章内の語と語を入れ替える • ランダムに削除する • Back Translation を用いて文章を水増しする • 楽天の機械翻訳も、データ拡張を駆使して、元データを増やし、35言語翻訳に到達している • 特に、お客様の声の分析や、Chatbot、翻訳などの開発においては有効に作用する（理由は後で述べます）

Slide 16

Slide 16 text

16 具体的な手法：画像データ • 水平・垂直に画像をシフトする • 水平方向・垂直方向に画像を反転させる • 回転させる（回転角度はランダムのケースもある） • 明度を変える • ズームインする、ズームアウトする • 画像の一部をくり抜く、削除する • 背景色を変える • 背景を置き換える • Mixup、CutMix • 冒頭で紹介したハッカソンでも参加者はみなデータ拡張を駆使 • Mixup, CutMix 以外はラベルの変更不要 • 例えば、ドローンやUGV （無人配送車）の学習では、道路の画像に、対象物のCG 物体や人物を配置したデータでも十分な成果がでてくる

Slide 17

Slide 17 text

17 脅威の手法： Mixup (2017)、CutMix (2019) • ドメイン知識不要 • 計算上のオーバーヘッドがほとんどない https://arxiv.org/pdf/1710.09412.pdf https://arxiv.org/abs/1905.04899v1

Slide 18

Slide 18 text

18 背景としてのインターネット、スマートフォンの普及 • C2C、B2C 領域においてはスマホが広く普及 • 言語データ：様々なユーザーが入力した文章データは不完全な文や構造化されていない文、またフレーズの誤用や記述ミス等も含まれる。 • 画像データ： SNSの画像共有とあいまって多くはスマホで撮影。色々な距離や角度、照明の強弱、反射、映り込み、陰影、何かによって一部覆われていることも。 • 実際のデータは様々な撹乱があり、それらに対応し、ロバストネスさを高めていくことも非常に重要。

Slide 19

Slide 19 text

19 Waymo もData Augmentation を駆使し、自動運転を実現 https://note.com/masayamori/n/n7f21db4e5e49 • Deep Neural Net を複数用いたアーキテクチャとしており、入力データの拡張だけでなく、内部データも拡張させていく方法で、ロバストな自動運転を実現している。

Slide 20

Slide 20 text

20 GAN と Creative AI

Slide 21

Slide 21 text

21 GAN （敵対的生成ネットワーク） Generator Discriminator Random Input Sample Sample Real Data Generator Loss Discriminator Loss • データ拡張にも使えるが、創造性を持ったAI （Creative AI）というトレンドの原動力にもなっている

Slide 22

Slide 22 text

22 NVIDIA による Imaginary Celebrities https://research.nvidia.com/sites/default/files/pubs/2017- 10_Progressive-Growing-of/karras2018iclr-paper.pdf

Slide 23

Slide 23 text

23 新しいトレンド： Creative Economy, Creative AI ⚫ World Economic Forum でも注目されるトレンド ⚫ 特定の技術やソリューションではなく、活用（アプリケーション） ⚫ Non-iterative かつ Expert Knowledge を要する経済的価値創出を実現する ✓ PFNのオンライン線画自動着色サービス PaintsChainer ✓ Magical PunchLine、 AI をクリエイティブディレクターに迎える ✓ 電通によるAI コピーライター AICO ✓ 佐藤・松崎研によるAIによるSF小説「人狼知能能力測定テスト」 ✓ 日経のAI記者「決算サマリー」 (LINK) (LINK) (LINK) (LINK) (LINK)

Slide 24

Slide 24 text

24 Draw by AI AttnGAN by Microsoft: AI can create a picture from caption Text-to-Image convertor http://www.itmedia.co.jp/news/articles/1801/19/news054.html “A bird with a yellow body, with black feathers and has a short beak.” • 画像から画像を作るのではないところがポイント。 • 例えば応用することで、設計図から製品の画像を作り出し、実際の製品と比較することで設計図どおりに作られているのかの確認等にも使える。

Slide 25

Slide 25 text

25 Creative AI 事例 [LuBan System, Alibaba] Background Shapes Colors Layout Product Alibaba used automated banner design system at 11.11 出典：（Alibaba社発表資料より）http://www.uisdc.com/alibaba-luban-ai-banner

Slide 26

Slide 26 text

26 Creative AI：商品説明の自動生成 Dan Jurafsky 教授との研究を通し、究極のパーソナライズサービスの実現へ一歩商品とセールス・嗜好の関係を踏まえ、PC/モバイル/スピーカーそれぞれに最適な商品説明を生成 s://news.stanford.edu/2017/09/29/predicting-sales-online-products-advertising-language/

Slide 27

Slide 27 text

27 データ拡張のポイント

Slide 28

Slide 28 text

28 • データのバリエーションはどういう風に存在するのか？ • 固定カメラだとしたら、回転させる意味はない • ノイズを減らすのか、増やすのか？ • 答えは、両方 • 混入する可能性のあるノイズを増やし、 • そうでないものは除去するポイント

Slide 29

Slide 29 text

29 イメージ • 実際のインプットとしてありうるデータの分布に、トレーニングデータは近くあってほしい。 • 近くであれば、ないよりもはるかにまし。（CG でも学習効果は高い） • 本番でもノイズが混入しうるのであれば、トレーニングデータにも同様のノイズは混入しているべき。

Slide 30

Slide 30 text

30 • Data Augmentation （データ拡張）という手法 • Back Translation、GAN という新テクノロジー • Creative AI という新トレンドにもつながっている • 単にデータを集める・貯める、をこえたデータをどう拡張して活用していくかという視点が AI 活用においては大事まとめ https://note.mu/masayamori