Upgrade to Pro — share decks privately, control downloads, hide ads and more …

AI活用はじめの一歩 - 取組を始めるために必要なこと

AI活用はじめの一歩 - 取組を始めるために必要なこと

AI活用を進めたい企業の方向けに、「どうすればAI活用が進むのか」をビジネスの視点から書いています。
DataStrategy株式会社
http://datastrategy.jp

DataStrategy

July 08, 2017
Tweet

More Decks by DataStrategy

Other Decks in Technology

Transcript

  1. 深層学習が発展したあたりから”AI”が注⽬され出した のではないか • ⼈間の脳を模倣する研究から、特定のタスクを解くための研究 ⼿法として「機械学習・深層学習」へ発展 Data Strategy Inc. | 4

    人工知能 深層学習 (ディープラーニング) 機械学習 人間の脳をどうすれば模倣できるか 特定タスクに対して 人間が学習する能力を アルゴリズムで再現できないか 機械学習の手法である脳のニューロンを 模したモデル(ニューラルネットワーク)を使い 特定タスクに対する人間の学習能力を 再現できないか 1950~ 1980~ 2010~ 目安
  2. AIモデルの構築イメージ • ⼤量のInput/Outputデータを機械に「学習」させる必要があり ます(教師あり学習)。 Data Strategy Inc. | 9 過

    去 の デ タ Model 猫である 猫ではない 猫である 猫である 猫ではない 同じサイズの 画像データ Input Model Output Input/Outputの 組み合わせから AIを学習させる Model 猫ではない ü 未知のデータ(過去にModelに投入していないデータ)の判別ができる ü 教えられていないこと(例:犬)は、判別できない
  3. AIとデータマイニングの違い • 予測・分類が出来る点で、データマイニングとは異なります Data Strategy Inc. | 10 0" 1"

    2" 3" 4" 5" 0" 1" 2" 3" 4" 5" Model 猫では ない データマイニングは 過去のデータから傾向を見つける AIはデータに対して 予測や分類ができる
  4. 便利そうだが、⼤量のデータが必要 • 例えば「猫である」モデルを構築するには、⼤量の画像と 「この画像が猫か否か」を付与したデータ(ラベル付きデータ)が 必要になります Data Strategy Inc. | 11

    Img_0001.jpg Img_0002.jpg Img_0003.jpg Img_0004.jpg Img_0005.jpg Img_0001.jpg, 1 Img_0002.jpg, 0 Img_0003.jpg, 1 Img_0004.jpg, 1 Img_0005.jpg, 0 … … ラベルデータ 画像データ
  5. 例: ⾃動⾞のハンドルの適切な⾓度を推定するタスク Data Strategy Inc. | 14 • 膨⼤な画像とハンドル⾓度のデータをもとにして作ります (Udacityによって公開されているデータとタスクの例)

    大量の画像とハンドル角度を 訓練データとして学習させる 訓練データにない画像でも ハンドル角度の予想が可能になる 出典:Udacity Self-Driving Nanodegree / Open Sourcing 223GB of Driving Data https://github.com/udacity/self-driving-car/tree/master/steering-models/community-models/rambo
  6. 例えばこんな⾵にデータを収集する必要性 • よって、⾃動運転を実現するためには「教師データ」を 収集する必要性があります Data Strategy Inc. | 15 出典:

    CarWatch “ボッシュ、年次記者会見で自動運転技術の開発状況などを紹介” http://car.watch.impress.co.jp/img/car/docs/604/660/html/14.jpg.html
  7. 何によって何を当てたいか、の設計⽅法が重要 • 「⼀⾒関係のないものから、何かすごい予測ができる」ことは ありえないとは⾔い切れませんが、そんな⽅法を発⾒できる可能 性は低く難易度も⾼いです Data Strategy Inc. | 17

    利用データ 推定したいこと クレジットカードの 決済ログ 上級会員への 変更確率 次期更新時の 解約確率 子供が小学校に 入った確率 電力自由化に 関心がある確率 ???? ??
  8. 何によって、は現実的に考えた⽅が成果が出やすい • 「それはXXを推定するのに重要だね」と⾔える要素を集めて データに格納されていると、推定したいことが当たりやすく なります Data Strategy Inc. | 18

    Attribute Information: 1) ID number 2) Diagnosis (M = malignant, B = benign) 3-32) Ten real-valued features are computed for each cell nucleus: a) radius (mean of distances from center to points on the perimeter) b) texture (standard deviation of gray-scale values) c) perimeter d) area e) smoothness (local variation in radius lengths) f) compactness (perimeter^2 / area - 1.0) g) concavity (severity of concave portions of the contour) h) concave points (number of concave portions of the contour) i) symmetry j) fractal dimension ("coastline approximation" – 1) 例:画像から抽出した32変数(数字データ)で乳がん有無を推定するタスク 出典: University of California,Irvine “Machine Learning Repositry” http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Diagnostic%29
  9. その上で、どういう利⽤⽅法を⽬指すか決める必要性 Data Strategy Inc. | 19 • 「何によって何を当てたいか」を整理したら、技術的に出来る ことを踏まえて、現実的にどう応⽤するか(既存の業務プロセ スにどう組み込むか)を決める必要があります。

    • 要求⽔準が上がれば開発コストも上がるため、まずは現実的な 利⽤⽅法を決める必要があります。 ü名刺登録アプリは、なぜ名刺のスキャンデータを 派遣の⼥性スタッフが⽬で⾒て⼊⼒しているのか? なぜ完全に機械化・⾃動化できないのか? üクルマの⾃動運転は、⼀般道より⾼速道のほうが 早く実現できると⾔われているが、なぜか? üAIが勝⼿に喋るユーザーサポートbotはまだ無いが、 Twitterアカウントは既に存在するのはなぜか?
  10. 必要なデータを整理する必要性 • データを収集したらキレイに整形する(前処理を⾏う)必要が あります。モデル構築より前処理に時間がかかることも多いで す Data Strategy Inc. | 22

    <処理・加工の例> • 文字化け・特殊文字処理 • サンプリング • 異常値・外れ値の確認 • 平均値など基本統計量の確認 • データ間の相関関係の確認 • ユーザーIDとの紐付け • サイズ調整、ベクトル化(画像) • ・・・ データログ 必要なデータ
  11. 基幹システムがある場合は設計図に上⼿く組み込む • WEBサービスなどでデータベースが存在する場合は、必要な データを取り出せるように設計図に組み込むことで、前処理の 負荷をさげることも期待できます Data Strategy Inc. | 23

    DB DB DB 基幹システム データ蓄積環境 (Storage) TABLE_X001_201701.csv TABLE_X001_201702.csv TABLE_X001_201703.csv ・・・ USER_ID_201701.csv USER_ID_201702.csv ・・・ 計算環境 (Computing) バッチ処理
  12. 最適なモデルとパラメータを得るには様々な困難を 乗り越える必要 • 同じ識別器(モデル)でも、設定によって過学習の問題も容易 に起きます Data Strategy Inc. | 27

    モデルが 簡易 モデルが 複雑 出典: Scikit-learn “Machine Learning 102: Practical Advice” より引用・一部加筆 http://ogrisel.github.io/scikit-learn.org/sklearn-tutorial/tutorial/astronomy/practical.html
  13. データ量や試⾏錯誤回数に応じた計算リソースも必要 • 計算リソースが潤沢にあれば試⾏錯誤できる回数も増えます。 データ量や計算機の性能をみて、現実的なラインに抑えないと 計算が終わらなくなります Data Strategy Inc. | 28

    使用するモデル・ アルゴリズムの選定 モデルごとの パラメータ設定 データの低次元化 ・・・ 試行錯誤する回数 計算リソース (計算機のスペック) CPU? GPU? 分散処理? クラウド?
  14. ②⻑い視点で取り組む Data Strategy Inc. | 31 • すぐに結果が出るものではないため「年単位の時間をかける」 と決めて腰を据えることが重要と考えます。 研究開発と

    精度検証 段階的運用 拡大 • スコープ設計 • データ分析と プロトタイプ開発 • 精度検証 • 一部業務にて 試験的に運用 • 課題評価 • 対象範囲の拡大 • 成果の拡大 6ヶ月? 12-18ヶ月? 全体を通じたスコープ設計とPDCAの継続 (結果が出ない中で、試行錯誤し結果につなげる技術力・胆力と環境) フェーズ 内容 期間 イメージ 成果
  15. ③チームでAI活⽤の必要性を共有する Data Strategy Inc. | 32 • 技術エンジニアが1⼈いれば解決できる問題ではありません。 互いに尊重しながら、対話を⾏うことが重要と考えます。 経営者

    経営企画 分析 エンジニア 情報システム 担当 関係部署(ユーザーサポート担当、経理担当など) *技術的な理解が社内になく無理難題ばかりを投げつけられ、 分析エンジニアが寄り付かない状況も散⾒されます
  16. AI活⽤の取組を始めるために • AIモデルの構築には、 • ⼤量のInput/Outputデータが必要 • データ収集に各社苦労している • 「何によって何を当てたいか」「どういう利⽤⽅法を ⽬指すか」の設計が重要

    • それでも確実なモデルが構築できるはは分からない • 数⼗〜数万次元空間での最適解を探すため、過学習をはじめ とした多くの課題が存在 • 確実なAI活⽤を進めるには • タスク設定を適切に⾏う • ⻑い視点で取り組む • チームでAI活⽤の必要性を共有する Data Strategy Inc. | 34
  17. AIやデータを活用した 業務サポート可能性診断や 見直し検討、IoTなど 技術トレンドを踏まえた PoCを一緒に行います。 分析の進め方や分析方法、 モデル構築の再検討、 採用のみきわめや AIチーム立ち上げなどを 貴社メンバーの一員として

    包括的にサポートします。 調査の進め方や発注方法、 広告や商品コンセプトの 開発方法、マーケティング 施策づくりについて サポートします。 サービスメニュー: 以下のようなお悩みを解決します ü AI, IoTと言われているが、自社の場合は どんな活用が可能か見て欲しい ü まずは自社でどんな活用可能性がありそうか 自社データを含めて診てほしい AI(人工知能) 活用方法診断 ü 既に技術活用の取組を始めているが、 効果が出ておらず外部の経験者に見て欲しい。 ü データ分析を効果的に進める方法や、 採用・組織設計も含めて全部教えて欲しい。 AI(人工知能) 活用アドバイザリー ü マーケティングリサーチを実施したが、 実際の打ち手や売上につながっていない ü お客さまが何を考えているのか把握して、 売上につながる商品コンセプトや広告を 考えたい マーケティング アドバイザリー Data Strategy Inc. | 36
  18. お客さまの実際の声(頂いた声をそのまま掲載しております) Data Strategy Inc. | 37 ・調⼦のいい話をして、ࢿྉͷݟͤํͳͲͰͳΜͱͳ͘ޡຐԽ͢ͷͰ͸ͳ͘ɺग़དྷΔͱ͜Ζ͸΋ͪΖΜͰ͕͢ɺ ग़དྷͳ͍͜ͱ͸ग़དྷͳ͍ͱݴͬͯ௖͍ͨ͜ͱ、また、ग़དྷͳ͍ࣄʹؔ͠·ͯ͠΋Կނग़དྷͳ͍ͷ͔ͷཧ༝ͷઆ໌ɺ Կ͕͋Ε͹ग़དྷΔͷ͔ͷચ͍ग़͠ɺ୅ସҊͷ͝ఏࣔまで頂き⼤変助かりました。 ・泥臭いところから、ఘΊͣʹਐΊɺ͜͜·Ͱͷࣄ͸Ͱ͖Δという姿を⽰して頂き、分析とはこうあるべきだと

    いう姿勢を学ばせて頂きました。 ・クライアントのデータ、ビジネス、サービスに対するキャッチアップが⼤変早く、また把握されている内容も 正確なため、෼ੳ݁Ռʹର͢Δղऍ΋ɺҧ࿨ײͳ͘ɺ৽ͨͳൃݟ͕͋Δものでした。 (IT企業・ マネージャーさま) ・分析能⼒だけではなく、コミュニケーション、課題解決、およびわかりやすい説明、報告⽤の資料含めて⼤変助 かりました。 ・データを把握するスキルも⾼いのと、⼀⼈ではなくνʔϜͰͷۀ຿ͷ਱ߦも進んで実施いただき感謝しています。 (⼤⼿企業・ 管理職さま) ・データ分析やマーケティングに関して、説明してくださる内容が素⼈でも分かりやすく良かった。それ以外の部 分の知識も幅広くアドバイスをもらえて良かった。また、例えばWEBマーケティングの取組みなど、୯ʹΞυό ΠεΛ΋Β͑Δ͚ͩͰ͸ͳ͘ɺ࣮ࡍʹखΛಈ͔ͯ͠ɺࣄۀΛಈ͔ͯ͘͠Εͯྑ͔ͬͨ。 (公的機関・部⻑さま) ・客観的な⽬線でWEBサイトを改善していただき、⽬次の作り⽅、情報の検索性、۩ମతʹͳʹΛͲ͏͢Ε͹Α ͍ͷ͔ͱ͍ͬͨఏҊը໘まで頂きました。その通りに作成したら離脱率が8割から5割にさがり、成約件数も平均 で2倍、最⼤で3倍まで上がりました。情報が論理的に整理されたので、これまで獲れていなかった論理的な考え を好む男性が新たにお客様として来るようになりました。 (⾃営業・コーチさま)