Slide 1

Slide 1 text

AI活⽤はじめの⼀歩 - 取組を始めるために必要なこと DataStrategy Inc. http://datastrategy.jp June 29th, 2017

Slide 2

Slide 2 text

Data Strategy Inc. | 1 このテキストは、AI活⽤に関して関⼼があるが何から始めて良いか わからない、主にエンジニアリングの経験がないビジネスサイドの ⽅向けに作成しました。初⼼者の⽅向けに分かりやすく書いている ため、厳密性を書いている部分がありますがご容赦ください。 このテキストは転送を歓迎します。取引先や社内へ⾃由に再配布し ていただいて構いません。少しでもAI活⽤に向けた取り組みが進み、 様々なシーンでの社会課題解決が進むことを願っております。

Slide 3

Slide 3 text

テーマはAI活⽤ですが・・ Data Strategy Inc. | 2

Slide 4

Slide 4 text

あらゆるものにAIと名前が付けられ始めている • キーワード的に挙げるとキリがないような状態 Data Strategy Inc. | 3 機械学習 深層学習 Chatbot RPA 自然言語 処理 などなど・・

Slide 5

Slide 5 text

深層学習が発展したあたりから”AI”が注⽬され出した のではないか • ⼈間の脳を模倣する研究から、特定のタスクを解くための研究 ⼿法として「機械学習・深層学習」へ発展 Data Strategy Inc. | 4 人工知能 深層学習 (ディープラーニング) 機械学習 人間の脳をどうすれば模倣できるか 特定タスクに対して 人間が学習する能力を アルゴリズムで再現できないか 機械学習の手法である脳のニューロンを 模したモデル(ニューラルネットワーク)を使い 特定タスクに対する人間の学習能力を 再現できないか 1950~ 1980~ 2010~ 目安

Slide 6

Slide 6 text

深層学習が⾒直されたきっかけの⼀つ • 画像分類コンペティション(ILSVRC物体カテゴリ認識)での優勝 Data Strategy Inc. | 5 Alex Krizhevsky et al, 2012, “ImageNet Classification with Deep Convolutional Neural Networks”

Slide 7

Slide 7 text

そのほか、計算機性能の向上や、 収集・蓄積できるデータの拡⼤など、いろいろな 時代的背景があると思います (今回は詳細は割愛します) Data Strategy Inc. | 6

Slide 8

Slide 8 text

ここでは、AI(⼈⼯知能)を 機械学習・深層学習のアプローチと定義して 以降の説明を進めます Data Strategy Inc. | 7

Slide 9

Slide 9 text

AIとはどんなものか Data Strategy Inc. | 8

Slide 10

Slide 10 text

AIモデルの構築イメージ • ⼤量のInput/Outputデータを機械に「学習」させる必要があり ます(教師あり学習)。 Data Strategy Inc. | 9 過 去 の デ タ Model 猫である 猫ではない 猫である 猫である 猫ではない 同じサイズの 画像データ Input Model Output Input/Outputの 組み合わせから AIを学習させる Model 猫ではない ü 未知のデータ(過去にModelに投入していないデータ)の判別ができる ü 教えられていないこと(例:犬)は、判別できない

Slide 11

Slide 11 text

AIとデータマイニングの違い • 予測・分類が出来る点で、データマイニングとは異なります Data Strategy Inc. | 10 0" 1" 2" 3" 4" 5" 0" 1" 2" 3" 4" 5" Model 猫では ない データマイニングは 過去のデータから傾向を見つける AIはデータに対して 予測や分類ができる

Slide 12

Slide 12 text

便利そうだが、⼤量のデータが必要 • 例えば「猫である」モデルを構築するには、⼤量の画像と 「この画像が猫か否か」を付与したデータ(ラベル付きデータ)が 必要になります Data Strategy Inc. | 11 Img_0001.jpg Img_0002.jpg Img_0003.jpg Img_0004.jpg Img_0005.jpg Img_0001.jpg, 1 Img_0002.jpg, 0 Img_0003.jpg, 1 Img_0004.jpg, 1 Img_0005.jpg, 0 … … ラベルデータ 画像データ

Slide 13

Slide 13 text

では、AIモデル構築に必要な 「⼤量のInput/Outputデータ」は どこから来るのでしょうか Data Strategy Inc. | 12

Slide 14

Slide 14 text

では、AIモデル構築に必要な 「⼤量のInput/Outputデータ」は どこから来るのでしょうか Data Strategy Inc. | 13 (苦労します)

Slide 15

Slide 15 text

例: ⾃動⾞のハンドルの適切な⾓度を推定するタスク Data Strategy Inc. | 14 • 膨⼤な画像とハンドル⾓度のデータをもとにして作ります (Udacityによって公開されているデータとタスクの例) 大量の画像とハンドル角度を 訓練データとして学習させる 訓練データにない画像でも ハンドル角度の予想が可能になる 出典:Udacity Self-Driving Nanodegree / Open Sourcing 223GB of Driving Data https://github.com/udacity/self-driving-car/tree/master/steering-models/community-models/rambo

Slide 16

Slide 16 text

例えばこんな⾵にデータを収集する必要性 • よって、⾃動運転を実現するためには「教師データ」を 収集する必要性があります Data Strategy Inc. | 15 出典: CarWatch “ボッシュ、年次記者会見で自動運転技術の開発状況などを紹介” http://car.watch.impress.co.jp/img/car/docs/604/660/html/14.jpg.html

Slide 17

Slide 17 text

では、データを貯めれば 何でもできるのか?というと 決してそんなことはありません Data Strategy Inc. | 16

Slide 18

Slide 18 text

何によって何を当てたいか、の設計⽅法が重要 • 「⼀⾒関係のないものから、何かすごい予測ができる」ことは ありえないとは⾔い切れませんが、そんな⽅法を発⾒できる可能 性は低く難易度も⾼いです Data Strategy Inc. | 17 利用データ 推定したいこと クレジットカードの 決済ログ 上級会員への 変更確率 次期更新時の 解約確率 子供が小学校に 入った確率 電力自由化に 関心がある確率 ???? ??

Slide 19

Slide 19 text

何によって、は現実的に考えた⽅が成果が出やすい • 「それはXXを推定するのに重要だね」と⾔える要素を集めて データに格納されていると、推定したいことが当たりやすく なります Data Strategy Inc. | 18 Attribute Information: 1) ID number 2) Diagnosis (M = malignant, B = benign) 3-32) Ten real-valued features are computed for each cell nucleus: a) radius (mean of distances from center to points on the perimeter) b) texture (standard deviation of gray-scale values) c) perimeter d) area e) smoothness (local variation in radius lengths) f) compactness (perimeter^2 / area - 1.0) g) concavity (severity of concave portions of the contour) h) concave points (number of concave portions of the contour) i) symmetry j) fractal dimension ("coastline approximation" – 1) 例:画像から抽出した32変数(数字データ)で乳がん有無を推定するタスク 出典: University of California,Irvine “Machine Learning Repositry” http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Diagnostic%29

Slide 20

Slide 20 text

その上で、どういう利⽤⽅法を⽬指すか決める必要性 Data Strategy Inc. | 19 • 「何によって何を当てたいか」を整理したら、技術的に出来る ことを踏まえて、現実的にどう応⽤するか(既存の業務プロセ スにどう組み込むか)を決める必要があります。 • 要求⽔準が上がれば開発コストも上がるため、まずは現実的な 利⽤⽅法を決める必要があります。 ü名刺登録アプリは、なぜ名刺のスキャンデータを 派遣の⼥性スタッフが⽬で⾒て⼊⼒しているのか? なぜ完全に機械化・⾃動化できないのか? üクルマの⾃動運転は、⼀般道より⾼速道のほうが 早く実現できると⾔われているが、なぜか? üAIが勝⼿に喋るユーザーサポートbotはまだ無いが、 Twitterアカウントは既に存在するのはなぜか?

Slide 21

Slide 21 text

例: InsightTech社による「ふーまん」の裏Twitter • ⾃然⾔語処理による⽇本語の⽂書⽣成は技術的に困難です。 ユーザー対応に適⽤するには難しいが、Twitterアカウントであ れば誤差も許容されます Data Strategy Inc. | 20

Slide 22

Slide 22 text

タスク設定だけでなく データを整理して 使いやすくすることも重要です Data Strategy Inc. | 21

Slide 23

Slide 23 text

必要なデータを整理する必要性 • データを収集したらキレイに整形する(前処理を⾏う)必要が あります。モデル構築より前処理に時間がかかることも多いで す Data Strategy Inc. | 22 <処理・加工の例> • 文字化け・特殊文字処理 • サンプリング • 異常値・外れ値の確認 • 平均値など基本統計量の確認 • データ間の相関関係の確認 • ユーザーIDとの紐付け • サイズ調整、ベクトル化(画像) • ・・・ データログ 必要なデータ

Slide 24

Slide 24 text

基幹システムがある場合は設計図に上⼿く組み込む • WEBサービスなどでデータベースが存在する場合は、必要な データを取り出せるように設計図に組み込むことで、前処理の 負荷をさげることも期待できます Data Strategy Inc. | 23 DB DB DB 基幹システム データ蓄積環境 (Storage) TABLE_X001_201701.csv TABLE_X001_201702.csv TABLE_X001_201703.csv ・・・ USER_ID_201701.csv USER_ID_201702.csv ・・・ 計算環境 (Computing) バッチ処理

Slide 25

Slide 25 text

タスクを設定して、データを収集して、 整形して、いざモデルを作れば 精度は出るのでしょうか? Data Strategy Inc. | 24

Slide 26

Slide 26 text

⼀般的なITシステム開発とは異なり 「これをすれば必ず出来る」ものではなく 試⾏錯誤をしても良い結果が得られない こともあります Data Strategy Inc. | 25

Slide 27

Slide 27 text

モデルを作る=数⼗〜数万次元空間での最適解を探す • アプローチ⼿法や設定すべきパラメータも⼤変多く、 計算が収束するまでの時間も読めないことがほとんどです Data Strategy Inc. | 26 データを数十〜数万次元の空間にプロットし分離をさせる。 さまざまなアプローチを試行錯誤する必要あり

Slide 28

Slide 28 text

最適なモデルとパラメータを得るには様々な困難を 乗り越える必要 • 同じ識別器(モデル)でも、設定によって過学習の問題も容易 に起きます Data Strategy Inc. | 27 モデルが 簡易 モデルが 複雑 出典: Scikit-learn “Machine Learning 102: Practical Advice” より引用・一部加筆 http://ogrisel.github.io/scikit-learn.org/sklearn-tutorial/tutorial/astronomy/practical.html

Slide 29

Slide 29 text

データ量や試⾏錯誤回数に応じた計算リソースも必要 • 計算リソースが潤沢にあれば試⾏錯誤できる回数も増えます。 データ量や計算機の性能をみて、現実的なラインに抑えないと 計算が終わらなくなります Data Strategy Inc. | 28 使用するモデル・ アルゴリズムの選定 モデルごとの パラメータ設定 データの低次元化 ・・・ 試行錯誤する回数 計算リソース (計算機のスペック) CPU? GPU? 分散処理? クラウド?

Slide 30

Slide 30 text

こうした不確実性が⾼い AI活⽤を具体的にすすめるには どうしたらよいのでしょうか Data Strategy Inc. | 29

Slide 31

Slide 31 text

①タスク設定を適切に⾏う • 業務への組み込みを意識しながら、技術的に実現可能性がある タスク設定をする必要があります。 • いきなりユーザーサポート(顧客対応)は難しいが、 社内のサポート担当者へAIによる分析結果を⽰すことは可能、 というケースも多いです。 Data Strategy Inc. | 30 サポートしてくれたら 便利なタスク (ex. 問合せ対応) 技術的に可能な タスク (ex. 社内担当者への レコメンド) 望ましい タスク設定

Slide 32

Slide 32 text

②⻑い視点で取り組む Data Strategy Inc. | 31 • すぐに結果が出るものではないため「年単位の時間をかける」 と決めて腰を据えることが重要と考えます。 研究開発と 精度検証 段階的運用 拡大 • スコープ設計 • データ分析と プロトタイプ開発 • 精度検証 • 一部業務にて 試験的に運用 • 課題評価 • 対象範囲の拡大 • 成果の拡大 6ヶ月? 12-18ヶ月? 全体を通じたスコープ設計とPDCAの継続 (結果が出ない中で、試行錯誤し結果につなげる技術力・胆力と環境) フェーズ 内容 期間 イメージ 成果

Slide 33

Slide 33 text

③チームでAI活⽤の必要性を共有する Data Strategy Inc. | 32 • 技術エンジニアが1⼈いれば解決できる問題ではありません。 互いに尊重しながら、対話を⾏うことが重要と考えます。 経営者 経営企画 分析 エンジニア 情報システム 担当 関係部署(ユーザーサポート担当、経理担当など) *技術的な理解が社内になく無理難題ばかりを投げつけられ、 分析エンジニアが寄り付かない状況も散⾒されます

Slide 34

Slide 34 text

まとめ Data Strategy Inc. | 33

Slide 35

Slide 35 text

AI活⽤の取組を始めるために • AIモデルの構築には、 • ⼤量のInput/Outputデータが必要 • データ収集に各社苦労している • 「何によって何を当てたいか」「どういう利⽤⽅法を ⽬指すか」の設計が重要 • それでも確実なモデルが構築できるはは分からない • 数⼗〜数万次元空間での最適解を探すため、過学習をはじめ とした多くの課題が存在 • 確実なAI活⽤を進めるには • タスク設定を適切に⾏う • ⻑い視点で取り組む • チームでAI活⽤の必要性を共有する Data Strategy Inc. | 34

Slide 36

Slide 36 text

最後に(すこしだけ宣伝) Data Strategy Inc. | 35

Slide 37

Slide 37 text

AIやデータを活用した 業務サポート可能性診断や 見直し検討、IoTなど 技術トレンドを踏まえた PoCを一緒に行います。 分析の進め方や分析方法、 モデル構築の再検討、 採用のみきわめや AIチーム立ち上げなどを 貴社メンバーの一員として 包括的にサポートします。 調査の進め方や発注方法、 広告や商品コンセプトの 開発方法、マーケティング 施策づくりについて サポートします。 サービスメニュー: 以下のようなお悩みを解決します ü AI, IoTと言われているが、自社の場合は どんな活用が可能か見て欲しい ü まずは自社でどんな活用可能性がありそうか 自社データを含めて診てほしい AI(人工知能) 活用方法診断 ü 既に技術活用の取組を始めているが、 効果が出ておらず外部の経験者に見て欲しい。 ü データ分析を効果的に進める方法や、 採用・組織設計も含めて全部教えて欲しい。 AI(人工知能) 活用アドバイザリー ü マーケティングリサーチを実施したが、 実際の打ち手や売上につながっていない ü お客さまが何を考えているのか把握して、 売上につながる商品コンセプトや広告を 考えたい マーケティング アドバイザリー Data Strategy Inc. | 36

Slide 38

Slide 38 text

お客さまの実際の声(頂いた声をそのまま掲載しております) Data Strategy Inc. | 37 ・調⼦のいい話をして、ࢿྉͷݟͤํͳͲͰͳΜͱͳ͘ޡຐԽ͢ͷͰ͸ͳ͘ɺग़དྷΔͱ͜Ζ͸΋ͪΖΜͰ͕͢ɺ ग़དྷͳ͍͜ͱ͸ग़དྷͳ͍ͱݴͬͯ௖͍ͨ͜ͱ、また、ग़དྷͳ͍ࣄʹؔ͠·ͯ͠΋Կނग़དྷͳ͍ͷ͔ͷཧ༝ͷઆ໌ɺ Կ͕͋Ε͹ग़དྷΔͷ͔ͷચ͍ग़͠ɺ୅ସҊͷ͝ఏࣔまで頂き⼤変助かりました。 ・泥臭いところから、ఘΊͣʹਐΊɺ͜͜·Ͱͷࣄ͸Ͱ͖Δという姿を⽰して頂き、分析とはこうあるべきだと いう姿勢を学ばせて頂きました。 ・クライアントのデータ、ビジネス、サービスに対するキャッチアップが⼤変早く、また把握されている内容も 正確なため、෼ੳ݁Ռʹର͢Δղऍ΋ɺҧ࿨ײͳ͘ɺ৽ͨͳൃݟ͕͋Δものでした。 (IT企業・ マネージャーさま) ・分析能⼒だけではなく、コミュニケーション、課題解決、およびわかりやすい説明、報告⽤の資料含めて⼤変助 かりました。 ・データを把握するスキルも⾼いのと、⼀⼈ではなくνʔϜͰͷۀ຿ͷ਱ߦも進んで実施いただき感謝しています。 (⼤⼿企業・ 管理職さま) ・データ分析やマーケティングに関して、説明してくださる内容が素⼈でも分かりやすく良かった。それ以外の部 分の知識も幅広くアドバイスをもらえて良かった。また、例えばWEBマーケティングの取組みなど、୯ʹΞυό ΠεΛ΋Β͑Δ͚ͩͰ͸ͳ͘ɺ࣮ࡍʹखΛಈ͔ͯ͠ɺࣄۀΛಈ͔ͯ͘͠Εͯྑ͔ͬͨ。 (公的機関・部⻑さま) ・客観的な⽬線でWEBサイトを改善していただき、⽬次の作り⽅、情報の検索性、۩ମతʹͳʹΛͲ͏͢Ε͹Α ͍ͷ͔ͱ͍ͬͨఏҊը໘まで頂きました。その通りに作成したら離脱率が8割から5割にさがり、成約件数も平均 で2倍、最⼤で3倍まで上がりました。情報が論理的に整理されたので、これまで獲れていなかった論理的な考え を好む男性が新たにお客様として来るようになりました。 (⾃営業・コーチさま)

Slide 39

Slide 39 text

ご相談はお気軽にご連絡ください Data Strategy Inc. | 38 ॳճ͝૬ஊ΍අ༻ݟੵ΋Γ͸ ແྉʹͯঝ͓ͬͯΓ·͢ (対⾯・オンラインも可能です)。 お気軽に [email protected] までご連絡ください。