Upgrade to Pro — share decks privately, control downloads, hide ads and more …

初夏のIBM Dojo #6 Auto AI を使ったらくらく機械学習 / IBM Dojo AutoAI ML 20200617

初夏のIBM Dojo #6 Auto AI を使ったらくらく機械学習 / IBM Dojo AutoAI ML 20200617

2020年6月17日開催の初夏のIBM Dojo #6 Auto AI を使ったらくらく機械学習の資料です。

Kyoko Nishito

June 17, 2020
Tweet

More Decks by Kyoko Nishito

Other Decks in Technology

Transcript

  1. 初夏のIBM Dojo #6
    Auto AI を使ったらくらく機械学習
    Kyoko Nishito
    Developer Advocate
    Tokyo City Team

    View Slide

  2. Kyoko Nishito
    IBM Developer Advocate
    2
    KyokoNishito

    View Slide

  3. 質問&ライブ投票参加
    はこちら
    slido.com
    #dojo617
    質問タブで質問⼊⼒
    ⾃分も知りたい質問には
    「いいね」をプッシュ!
    絵⽂字は表⽰されません
    スマホでアクセスして
    ぜひ参加お願いします︕
    6/17 Auto AI を使ったらくらく機械学習

    View Slide

  4. 本⽇のタイムテーブル
    14:00-14:05
    (5min)
    オープニング
    資料ダウンロード,出席登録など
    14:05-15:00
    (55min)
    Watson Studio & Auto AI ⼊⾨

    15:00-15:15
    (15min)
    課題の説明とQ&A

    View Slide

  5. 本⽇の資料
    本⽇の資料はこちらからPCにダウンロードお願いし
    ます。URLをクリックしたり、コマンドをコピペしたりでき
    ますので、サイトでみるのではなく、ダウンロードをお勧めし
    ます。(connpassの資料にもリンクあり)
    http://ibm.biz/dojo20200617doc

    View Slide

  6. 出席登録
    こちらのURLにアクセスして、IBM Cloudにログイン
    お願いします。
    http://ibm.biz/dojo0617
    アカウント未登録の⽅も
    こちらから登録お願いします。

    View Slide

  7. 新しい取り組み“バッジ取得プログラム”のご案内
    7
    IBM Cloud & AI develop Basic
    Online Developer Dojo
    ” IBM Cloud & AI develop Basic Online Developer badge“について
    - 2020年6⽉1⽇より開始のIBM Developer Dojo 12回シリーズと同様の内容のIBM Developer Dojoのクラスが対象
    https://www.ibm.com/jp-ja/partnerworld/events/developer-dojo
    - スキルアップのため全クラスの受講をお奨めします。
    - 12回のクラスのうちPAYGアカウントまたはサブスクリプションが必要としない8つのクラスの課題を実施
    - 8クラスのうち5クラスの課題について指定された結果を⾃分のアカウントが⾒えるようにスクリーンショットを撮影
    - 5クラス分の課題のスクリーンショットをPDFにして以下の宛先に送付
    - 提出した課題が承認されるとAcclaimからバッジが発⾏されます。
    ※バッジ発⾏のためにこれ以外の処理が発⽣する場合、別途ご連絡させていただきます
    2020年6⽉1⽇
    お問い合わせは、Online Developer Dojo バッジ事務局
    (ビジネス・パートナープログラム ヘルプデスク [email protected]

    View Slide

  8. ハンズオン事前準備
    1. IBM Cloudアカウント(無料)の取得
    2. Webブラウザー Chrome または Firefoxの導⼊

    View Slide

  9. 学習の⽬的とゴール
    ⽬的
    Watson Studio概要について理解し、AutoAIを使えるように
    なる
    ゴール
    AutoAIを使って機械学習モデルを作成できるようになる
    このコースを学ぶ⽅の想定スキル
    EXCEL等で表データを使ったことのあるWatson Studio初⼼者
    の⽅

    View Slide

  10. ⽬次
    1. 機械学習
    2. Watson Studio概要
    3. Watson Studio 注⽬機能
    4. Auto AI
    5. Auto AI 課題DEMO
    6. 課題
    7. まとめ

    View Slide

  11. 1. 機械学習

    View Slide

  12. ⼈⼯知能(AI)のサブセット(部分集合)
    12
    ディープ
    ラーンニング
    (深層学習)
    ⼈⼯知能
    機械学習 機械学習は⼈⼯知能(AI)のサブセット
    ディープラーンニングは機械学習のサブセット

    View Slide

  13. パターン認識と統計から進化した
    機械学習は、
    ルールベースのアルゴリズムに従う
    のではなく、
    データから分類と予測を⾏うための
    モデル構築を⾏うことです。
    13

    View Slide

  14. 機械学習 Machine Learning
    14 14
    課題: ⼼不全がおこるかどうかを判断する
    *BMI: 体重kg÷(⾝⻑m*⾝⻑m)
    実⾏:
    モデルは⼼不全の有無
    を予測
    学習:
    学習し結果予測モデル作成のために
    データセットを利⽤
    ⼼拍数 BMI 年齢 性別 結果
    93 25 49 F False
    108 24 32 M False
    80 31 60 M True
    93 27 58 F True
    ⼊⼒:
    ⼼拍数,
    BMI*, 年齢,
    性別

    View Slide

  15. 今までのやり⽅ -- Traditional
    15
    データ
    ルール
    if BPM-BMI > 60:
    result = True
    else:
    result = False
    結果
    アルゴリズム

    View Slide

  16. 機械学習 Machine Learning
    データ
    ルール
    アルゴリズム(モデル)
    結果 (学習済モデル)
    学習
    (パラメータ内部調整)

    View Slide

  17. 機械学習 Machine Learning
    17
    データ
    ルール
    アルゴリズム(モデル)
    結果 (学習済モデル)
    学習
    (パラメータ内部調整)
    ルール
    (学習済モデル)
    予測したい
    データ
    予測結果

    View Slide

  18. 機械学習
    教師あり学習 教師なし学習 強化学習
    分類
    回帰
    クラスタ分析
    次元削減
    報酬
    (Reward)

    View Slide

  19. 教師あり学習
    機械学習
    教師なし学習 強化学習
    回帰
    Regression
    分類
    Classification
    連続した数値を推定
    Watson Studioの
    AutoAI機能で
    プログラミングなしで
    モデル作成が可能!
    AdaBoost
    Regression
    Elastic Net with
    Cross-
    Validation
    Nearest
    Neighbor
    Analysis (KNN)
    Lasso Lars with
    Cross-
    Validation
    MLP
    Regression
    Orthogonal
    Matching
    Pursuit with
    Cross-
    Validation
    Random Forest
    Regression
    Theil-Sen
    Regression
    ARD
    Regression
    Elastic Net Kernel Ridge Lasso Lars
    MultiTask
    Elastic Net CV
    Orthogonal
    Matching
    Pursuit
    RANSAC
    Regression
    XGBoost
    Regression
    Bayesian Ridge
    Regression
    Gaussian
    Process
    Lars with
    Cross-
    Validation
    Lasso Lars IC
    MultiTask
    Elastic Net
    Passive-
    Aggressive
    Regression
    Ridge with
    Cross-
    Validation
    CCA
    Gaussian
    Process
    Regression
    Lars
    LGBM
    Regression
    Multi Task
    Lasso CV
    PLS Canonical Ridge
    Decision Tree
    Regression
    Gradient
    Boosting
    Regression
    Lasso with
    Cross-
    Validation
    Linear
    Regression
    Multi Task
    Lasso
    PLS Regression
    SGD
    Regression
    Extra Trees
    Regression
    Huber
    Regression
    Lasso
    Linear Support
    Vector
    Regression
    Nu SVR
    Radius
    Neighbors
    Regression
    Support Vector
    Regression
    AdaBoost Classifier
    Gaussian Naïve
    Bayes Classifier
    Label Spreading Logistic Regression
    Passive Aggressive
    Classifier
    Ridge Classifier
    with Cross-
    Validation
    Bernoulli Naïve
    Bayes Classifier
    Gaussian Process
    Classifier
    LGBM Classifier MLP Classifier Perceptron Ridge Classifier
    Calibrated
    Classifier with
    Cross-Validation
    Gradient Boosted
    Tree Classifier
    Linear Discriminant
    Analysis
    Multinomial Naïve
    Bayes Classifier
    Quadratic
    Discriminant
    Analysis
    SGD Classifier
    Decision Tree
    Classifier
    Nearest Neighbor
    Analysis (KNN)
    Classifier
    Linear Support
    Vector Classifier
    Nearest Centroid
    Radius Neighbors
    Classifier
    Support Vector
    Classifier
    Extra Trees
    Classifier
    Label Propagation
    Logistic Regression
    with Cross-
    Validation
    Nu Support Vector
    Classifier
    Random Forest
    Classifier
    XGBoost Classifier
    分類クラスを推定

    View Slide

  20. (参考) AutoAIでサポートしているモデル(回帰)
    回帰型モデルでは、次の44種類のモデルをサポートしています。
    AdaBoost
    Regression
    Elastic Net
    with Cross-
    Validation
    Nearest
    Neighbor
    Analysis
    (KNN)
    Lasso Lars
    with Cross-
    Validation
    MLP
    Regression
    Orthogonal
    Matching
    Pursuit with
    Cross-
    Validation
    Random
    Forest
    Regression
    Theil-Sen
    Regression
    ARD
    Regression
    Elastic Net Kernel Ridge Lasso Lars
    MultiTask
    Elastic Net
    CV
    Orthogonal
    Matching
    Pursuit
    RANSAC
    Regression
    XGBoost
    Regression
    Bayesian
    Ridge
    Regression
    Gaussian
    Process
    Lars with
    Cross-
    Validation
    Lasso Lars IC
    MultiTask
    Elastic Net
    Passive-
    Aggressive
    Regression
    Ridge with
    Cross-
    Validation
    CCA
    Gaussian
    Process
    Regression
    Lars
    LGBM
    Regression
    Multi Task
    Lasso CV
    PLS Canonical Ridge
    Decision Tree
    Regression
    Gradient
    Boosting
    Regression
    Lasso with
    Cross-
    Validation
    Linear
    Regression
    Multi Task
    Lasso
    PLS
    Regression
    SGD
    Regression
    Extra Trees
    Regression
    Huber
    Regression
    Lasso
    Linear
    Support
    Vector
    Regression
    Nu SVR
    Radius
    Neighbors
    Regression
    Support
    Vector
    Regression

    View Slide

  21. (参考) AutoAIでサポートしているモデル(分類)
    分類型モデルでは、次の30種類のモデルをサポートしています。
    AdaBoost
    Classifier
    Gaussian Naïve
    Bayes Classifier
    Label Spreading
    Logistic
    Regression
    Passive
    Aggressive
    Classifier
    Ridge Classifier
    with Cross-
    Validation
    Bernoulli Naïve
    Bayes Classifier
    Gaussian Process
    Classifier
    LGBM Classifier MLP Classifier Perceptron Ridge Classifier
    Calibrated
    Classifier with
    Cross-Validation
    Gradient Boosted
    Tree Classifier
    Linear
    Discriminant
    Analysis
    Multinomial Naïve
    Bayes Classifier
    Quadratic
    Discriminant
    Analysis
    SGD Classifier
    Decision Tree
    Classifier
    Nearest Neighbor
    Analysis (KNN)
    Classifier
    Linear Support
    Vector Classifier
    Nearest Centroid
    Radius Neighbors
    Classifier
    Support Vector
    Classifier
    Extra Trees
    Classifier
    Label Propagation
    Logistic
    Regression with
    Cross-Validation
    Nu Support
    Vector Classifier
    Random Forest
    Classifier
    XGBoost Classifier

    View Slide

  22. 2. Watson Studio概要

    View Slide

  23. Watson Studio 概念図
    エンタープライズ・カタログ (メタデータや分析資産を共有し、だれもが使える状態に)
    データソース
    構造化
    パブリック
    オンプレミス
    プライベート
    データ加⼯/品質確認
    (プレパレーション)
    AI/マシン
    ラーニング
    データ可視化
    ダッシュボード
    データへのアクセス
    データ蓄積
    整える 分析活⽤する
    つなぐ
    データ
    サインティスト
    ビジネスプロセス
    スコアリング
    結果
    提供者の視点 利⽤者の視点
    Watson Studio
    チームで協働する
    データ分析

    View Slide

  24. Watson Studioの特徴 –分析の全プロセスで⼀貫して使えるツール -
    データソース カタログ
    抽出
    加⼯・結合 テーブル作成
    (BIモデル
    作成)
    データ
    可視化
    機械学習
    モデル作成
    特徴点
    抽出
    Tool A
    Tool B
    Tool C
    Watson
    Studio
    ガバナンス
    再利⽤
    基盤担当
    データ
    エンジニア
    データサイエンティスト
    アプリ開発者
    データ
    ガバナンス担当
    つなぐ 整える 分析活⽤する
    チームで協働する

    View Slide

  25. つなぐ︓データ提供元の選択 〜収集・蓄積・仮想化〜
    IBMのデータベースソリューション
    他社のデータベースソリューション
    様々なデータベースへのコネクタを
    使って企業内のデータを仮想的に
    統合活⽤する

    View Slide

  26. 整える︓データ準備 (探索・確認・加⼯) の効率化
    データの品質や分布を可視化
    ⽋損値や外れ値を把握・修正
    ユーザー⾃⾝が、様々な
    データをGUIで簡単に加⼯
    • 検索機能をつかって探し出す
    • 他のユーザが作成した加⼯デー
    タ等を共有・再利⽤が出来る
    ⽬的に合う正しいデータを
    探し取り出す
    データの特徴・分布状況を
    簡単に確認
    データ加⼯や結合を容易に
    ① データカタログ ② データプロファイル ③ セルフETL

    View Slide

  27. 分析する︓利⽤者のレベル・経験に即したツールの提供
    SPSS
    Modeler
    AutoAI
    GUI コーディング

    View Slide

  28. 様々な分析ツールを選択可能
    従来のデータ分析の世界では、分析者により利⽤するツールが異なり、チームメンバー間でのコラボ
    レーションが難しいという課題がありました。
    Watson Studioでは、データ分析で標準的なツールを⼀通り備えており、どの分析者も⾃分にとって
    慣れた環境をクラウド上に持つことで分析を⾏えます。
    SPSS Modeler
    Jupyter Notebook
    +Python
    R Studio

    View Slide

  29. 3. Watson Studio注⽬機能

    View Slide

  30. Watson Studio 機能
    • カタログ機能: Connection登録
    • カタログ機能: テーブル登録
    • カタログ機能: ⽂書
    • Refinery: データ分析
    • Refinery: データ整形
    • Cognos Service: BI Tool
    • 機械学習⽤GUIツール (AutoAI)
    • SPSS modeler機能
    • R Studio機能
    • Jupyter Notebook機能
    • 深層学習⽤GUIツール (Neural Network
    Designer)
    • 深層学習⽤GUIツール (Experiment
    Builder)
    • 深層学習⽤の実験環境(HPO)の提供
    • Decision Optimizer
    • Machine Learning: モデル管理機能
    • Machine Learning: Webサービス化
    • Machine Learning: モデルの再評価、再学
    習、再配置
    • Visual Recognition Model作成ツール
    • Natural Language Classifier model作成
    ツール
    • NeuNetS(学習データ(イメージ)に応じて最
    適な深層学習モデルを⽣成)

    View Slide

  31. Watson Studio 機能
    • カタログ機能: Connection登録
    • カタログ機能: テーブル登録
    • カタログ機能: ⽂書
    • Refinery: データ分析
    • Refinery: データ整形
    • Cognos Service: BI Tool
    • 機械学習⽤GUIツール (AutoAI)
    • SPSS modeler機能
    • R Studio機能
    • Jupyter Notebook機能
    • 深層学習⽤GUIツール (Neural Network
    Designer)
    • 深層学習⽤GUIツール (Experiment
    Builder)
    • 深層学習⽤の実験環境(HPO)の提供
    • Decision Optimizer
    • Machine Learning: モデル管理機能
    • Machine Learning: Webサービス化
    • Machine Learning: モデルの再評価、再学
    習、再配置
    • Visual Recognition Model作成ツール
    • Natural Language Classifier model作成
    ツール
    • NeuNetS(学習データ(イメージ)に応じて最
    適な深層学習モデルを⽣成)
    今回は上記⿊字機能を
    ご紹介します

    View Slide

  32. Refinery (データ分析)
    Knowledge CatalogではRefineryというツールがあり、Studio上からシームレスに呼出し可能です。
    Refineryの持つデータ分析機能を使うと、解析対象のデータの項⽬別の状況を視覚的に確認できます。
    Knowledge Catalog

    View Slide

  33. Refinery (データ精製=データ整形)
    Refineryはデータ整形機能を持っています。下記のような処理をプログラミングなしに実現可能です。
    また⼀度実⾏した⼿順を覚えて、同じ処理を⾃動で再実⾏することもできます(スケジュール機能)。
    Knowledge Catalog
    四則計算
    属性変換
    フィル
    ター
    関数計算
    除去
    リネーム
    ソート(昇
    順)
    ソート(降
    順)
    表示マス
    キング
    テキスト
    処理
    欠損値へ変

    重複行除去
    空白行除去
    欠損値の置

    部分文字列
    置換
    日時データ
    抽出
    集約
    条件置換
    ジョイン
    サンプル抽

    列分割
    連結
    ストップ
    ワード除去
    形態素解析

    View Slide

  34. 機械学習⽤GUIツール (AutoAI)
    • 機械学習モデルに関してはAutoAIという機能があり、機械学習に詳しくないユーザーもCSVフ
    ァイルの準備とマウス操作で簡単にモデルを作ることが可能です。

    View Slide

  35. Jupyter Notebook機能
    Jupyter Notebookの実⾏環境をクラウド上に持たせることができます。
    サポートしている⾔語はPython 3.6とR、及びScalaです。
    Python 3.6の場合、次のライブラリは事前導⼊済みですぐに使える状態です。
    Tensorflow、Keras、Caffe、scikit-learn、Spark Mlib、XGBoost、Numpy、Pandas、
    matplotlib等。
    事前導⼊されていないライブラリもpipコマンドで導⼊可能なものであれば、追加導⼊して
    利⽤可能となります。

    View Slide

  36. Decision Optimizer
    従来 CPLEXという製品名で提供されていた最適化ソリューションもDecision Optimizer
    という名前でWatson Studioから利⽤可能になりました。
    「数独」を解いた例 「巡回セールスマン問題」を解いた例
    https://qiita.com/makaishi2/items/78570f9283c0bc6c7e6c
    https://qiita.com/makaishi2/items/d1cc9a3f49f640a3b649

    View Slide

  37. 4. AutoAI

    View Slide

  38. AutoAIとは
    AutoAIは従来型の機械学習モデルを対象として、前処理、モデル選定、パラメータ
    チューニングなど含めたモデル最適化を⾃動的に⾏います。

    View Slide

  39. AutoAIの⾃動学習
    データ前処理
    効率のいいモデル作成に必須の処理である、⽋損値の補間、データのエンコードなどを、最適
    な形で⾃動的に⾏います。
    モデル選定
    モデル選定に関しては、少ないデータで簡易的なモデルを作成し、有⼒な候補のモデルを絞り
    込む⽅式を採⽤しています。この⽅法により、少ない処理時間で効率よく精度の⾼いモデルを
    選定することが可能です。候補となるモデル数は 分類型: 30種類 回帰型: 44種類です。
    特徴量最適化
    AutoAIでは、強化学習の仕組みを利⽤して、しらみつぶしではない効率のいい⽅法により、
    精度の最適化をするための特徴量チューニングを⾏います。
    ハイパーパラメータ最適化
    モデルの精度に影響のある、ハイパーパラメータの最適化についても、計算資源をあまり使わ
    ない効率のいい⽅法で⾏います。
    参照: https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/autoai-overview.html?audience=wdp

    View Slide

  40. AutoAIの⾃動学習
    AutoAIは、①⼊⼒となるCSVファイルと②⽬的変数だけ指定すると、あとはすべて⾃動的に最
    適な機械学習モデルを⽣成します。



    View Slide

  41. AutoAIの⾃動学習
    AutoAIの処理は「パイプライン」という形で、左から右に流れていきます。
    現在、どの処理が⾏われているかは、Web画⾯で確認可能です。
    データ前処理 モデル選定
    パラメータ
    最適化
    特徴量
    最適化

    View Slide

  42. AutoAIの⾃動学習
    最新版では、次のような画⾯で、パイプライン処理の状況を表⽰することも可能になりました。

    View Slide

  43. AutoAIの⾃動学習
    ⾃動的に作られた8つのモデルは、事前設定した評価項⽬により順位付けされて表⽰されます。

    View Slide

  44. AutoAIの⾃動学習
    「Pipneline comparison」のタブをクリックすると、評価基準ごとの順位を視覚的に確認可能です。

    View Slide

  45. AutoAIの⾃動学習
    個別の⾏をクリックすると、各モデルの詳細情報が表⽰されます。
    ①ROCカーブというモデルの精度を評価するために利⽤されるグラフや、②どのような特徴量
    最適化を⾏ったか、あるいは、③特徴量ごとの寄与度などが表⽰可能です。



    View Slide

  46. (参考) AutoAIでサポートしているモデル(回帰)
    回帰型モデルでは、次の44種類のモデルをサポートしています。
    AdaBoost
    Regression
    Elastic Net
    with Cross-
    Validation
    Nearest
    Neighbor
    Analysis
    (KNN)
    Lasso Lars
    with Cross-
    Validation
    MLP
    Regression
    Orthogonal
    Matching
    Pursuit with
    Cross-
    Validation
    Random
    Forest
    Regression
    Theil-Sen
    Regression
    ARD
    Regression
    Elastic Net Kernel Ridge Lasso Lars
    MultiTask
    Elastic Net
    CV
    Orthogonal
    Matching
    Pursuit
    RANSAC
    Regression
    XGBoost
    Regression
    Bayesian
    Ridge
    Regression
    Gaussian
    Process
    Lars with
    Cross-
    Validation
    Lasso Lars IC
    MultiTask
    Elastic Net
    Passive-
    Aggressive
    Regression
    Ridge with
    Cross-
    Validation
    CCA
    Gaussian
    Process
    Regression
    Lars
    LGBM
    Regression
    Multi Task
    Lasso CV
    PLS Canonical Ridge
    Decision Tree
    Regression
    Gradient
    Boosting
    Regression
    Lasso with
    Cross-
    Validation
    Linear
    Regression
    Multi Task
    Lasso
    PLS
    Regression
    SGD
    Regression
    Extra Trees
    Regression
    Huber
    Regression
    Lasso
    Linear
    Support
    Vector
    Regression
    Nu SVR
    Radius
    Neighbors
    Regression
    Support
    Vector
    Regression

    View Slide

  47. (参考) AutoAIでサポートしているモデル(分類)
    分類型モデルでは、次の30種類のモデルをサポートしています。
    AdaBoost
    Classifier
    Gaussian Naïve
    Bayes Classifier
    Label Spreading
    Logistic
    Regression
    Passive
    Aggressive
    Classifier
    Ridge Classifier
    with Cross-
    Validation
    Bernoulli Naïve
    Bayes Classifier
    Gaussian Process
    Classifier
    LGBM Classifier MLP Classifier Perceptron Ridge Classifier
    Calibrated
    Classifier with
    Cross-Validation
    Gradient Boosted
    Tree Classifier
    Linear
    Discriminant
    Analysis
    Multinomial Naïve
    Bayes Classifier
    Quadratic
    Discriminant
    Analysis
    SGD Classifier
    Decision Tree
    Classifier
    Nearest Neighbor
    Analysis (KNN)
    Classifier
    Linear Support
    Vector Classifier
    Nearest Centroid
    Radius Neighbors
    Classifier
    Support Vector
    Classifier
    Extra Trees
    Classifier
    Label Propagation
    Logistic
    Regression with
    Cross-Validation
    Nu Support
    Vector Classifier
    Random Forest
    Classifier
    XGBoost Classifier

    View Slide

  48. 5. Auto AI 課題DEMO

    View Slide

  49. 4. Auto AI 課題DEMO
    1. データ準備
    2. Watson Studio のセットアップ
    3. Watson Studio の起動
    4. Watson Studio Projectの作成
    5. Machine Learningサービスの作成と追加
    6. Auto AI モデル作成
    7. Auto AI Deploy & テスト

    View Slide

  50. 4. Auto AI 課題Demo
    1. データ準備
    2. Watson Studio のセットアップ
    3. Watson Studio の起動
    4. Watson Studio Projectの作成
    5. Machine Learningサービスの作成と追加
    6. Auto AI モデル作成
    7. Auto AI Deploy & テスト

    View Slide

  51. 1. データ準備
    架空の電話会社の顧客データ customer_churn.csv
    を以下からダウンロードし、⾃分のPCに保存します︓
    https://ibm.box.com/v/dojo2020-customer-churn-data
    右上のダウンロードボタンをクリックして保存します。

    View Slide

  52. 1. データ準備
    架空の電話会社の顧客データ customer_churn.csv
    このファイルには顧客の属性と契約を解約したかしないか(CHURN)のデー
    タがあります。
    このデータからCHURNを予測するモデルを作ります。

    View Slide

  53. 4. Auto AI 課題Demo
    1. データ準備
    2. Watson Studio のセットアップ
    3. Watson Studio の起動
    4. Watson Studio Projectの作成
    5. サービスの作成と追加
    6. Auto AI モデル作成
    7. Auto AI Deploy & テスト

    View Slide

  54. 54
    2. Watson Studioのセットアップ
    • IBM Cloud ログイン
    アカウントをすでにお持ちの⽅は、
    IBMidを⼊⼒してこちらからログインしてください
    https://cloud.ibm.com/loginにアクセスしてログインします。
    • IBM Cloud ライトアカウント作成
    アカウントをお持ちでない⽅は、
    ご登録をお願いします

    View Slide

  55. 1. 「カタログ」をクリック
    55
    2. Watson Studioのセットアップ
    55

    View Slide

  56. 2.左側のメニューから「サービス」→カテゴリ「AI」 をクリックし、
    Watson Studio をクリック
    2. Watson Studioのセットアップ

    View Slide

  57. 3. リージョンの選択は「ダラス」を選択。プランは「ライト」を確認
    して、右側の「作成」をクリック
    2. Watson Studioのセットアップ

    View Slide

  58. 4. 以下の画⾯が表⽰されたら作成完了です!
    2. Watson Studioのセットアップ
    バッジプログラム申請
    キャプチャー画⾯

    View Slide

  59. 4. Auto AI 課題Demo
    1. Watson Studio のセットアップ
    2. Watson Studio の起動
    3. Watson Studio Projectの作成
    4. サービスの作成と追加
    5. Auto AI モデル作成
    6. Auto AI Deploy & テスト

    View Slide

  60. 60
    1. ダッシュボードを表⽰ (左上のIBM Cloudロゴをクリック)
    2. リソースの要約「Services」 →「Services」からWatson Studioのサー
    ビスを選択
    3. Watson Studioの起動
    もし右側にこ
    のような画⾯
    がでてきたら、
    「全詳細の表
    ⽰」をクリッ
    クする

    View Slide

  61. 61
    3. Get Startedを選択して起動
    3. Watson Studioの起動

    View Slide

  62. 4. Auto AI 課題Demo
    1. データ準備
    2. Watson Studio のセットアップ
    3. Watson Studio の起動
    4. Watson Studio Projectの作成
    5. サービスの作成と追加
    6. Auto AI モデル作成
    7. Auto AI Deploy & テスト

    View Slide

  63. 63
    1. [プロジェクトの作成]をクリックします。
    2. [空のプロジェクトを作成]をクリックします。
    4. Projectの作成

    View Slide

  64. 64
    3. 名前に任意のプロジェクト名を⼊れます。
    (Tutorialでなるべく作成してください(違う名前でもOKです))
    4. 「ストレージの定義」が表⽰されてない場合は、 下にスクロールして、
    「ストレージの定義」を表⽰させます(ブラウザー表⽰が横⻑の場合は右
    側に表⽰されています)。
    4. プロジェクトの作成

    View Slide

  65. 5A. Object Storage未作成の場合:
    5A-1. ストレージの定義 の①ストレージ・サービスの選択から「追加」
    をクリックします。
    4.プロジェクトの作成

    View Slide

  66. 66
    5A-2. Cloud Object Storageの画⾯が表⽰されるので下にスクロールします。
    5A-3. Liteが選択されていることを確認して[Create]をクリックします。
    5A-4. Confirm Creationのダイアログはそのまま[Confirm]をクリックします。
    下にスクロール
    4.プロジェクトの作成

    View Slide

  67. 67
    5A-5 新規プロジェクトの画⾯になるので、ストレージの定義 の②最新表
    ⽰をクリックします。
    5A-6 ストレージが表⽰された後、[作成]をクリックします。
    4.プロジェクトの作成

    View Slide

  68. 68
    5B. Object Storage作成済の場合:
    5B-1 [作成]をクリック
    ただしObject Storageを複数作成している場合は、使⽤したいObject
    Storageを選択後に[作成]をクリック
    4.プロジェクトの作成

    View Slide

  69. 69
    6. プロジェクトの画⾯が表⽰されます
    4.プロジェクトの作成

    View Slide

  70. 4. Auto AI 課題Demo
    1. データ準備
    2. Watson Studio のセットアップ
    3. Watson Studio の起動
    4. Watson Studio Projectの作成
    5. サービスの作成と追加
    6. Auto AI モデル作成
    7. Auto AI Deploy & テスト

    View Slide

  71. 5. サービスの作成と追加
    71
    1. [設定]をクリックします。
    2.関連サービスの[サービスの追加]をクリックして
    [Watson]を選択

    View Slide

  72. 3. Machine Learningの[Add]をクリック
    4A: [New]のタブが選択された画⾯が表⽰された場合
    1. スクロールしてPLANでLiteが選択されていることを確認して⼀番下
    の[Create]をクリック 。
    2. Confirmの画⾯でRegionがDallasになっていることを確認して
    [Confirm]をクリック
    5. サービスの作成と追加
    72
    スクロール
    スクロール

    View Slide

  73. 5. サービスの作成と追加
    73
    4B[Existing]のタブが選択された画⾯が表⽰された場合
    Existing Service Instance のドロップダウンから、使⽤するMachine
    Learningのサービスを選択して[Select]をクリック 。
    [Existing]のタブが選択された画⾯が表⽰されたにもかかわらず、「Existing
    Service Instance」の下に「 No existing service instances found 」が表⽰された
    場合は、「CLOUD FOUNDRY ORG」のドロップダウンを開き、値を選択してみて
    ください。。

    View Slide

  74. 5. サービスの作成と追加
    74
    5. [設定] の画⾯に戻ります。
    Associated servicesに追加したサービスのインスタンスが追加されてい
    ることを確認します。

    View Slide

  75. 4. Auto AI 課題Demo
    1. データ準備
    2. Watson Studio のセットアップ
    3. Watson Studio の起動
    4. Watson Studio Projectの作成
    5. サービスの作成と追加
    6. Auto AI モデル作成
    7. Auto AI Deploy & テスト

    View Slide

  76. 6. Auto AI モデル作成
    76
    1. 画⾯の右上にある`プロジェクトに追加`をクリックします。
    2. 表⽰されたウィンドウの[AutoAI 実験]をクリックします。

    View Slide

  77. 6. Auto AI モデル作成
    77
    3. 名前 : Churn Analysisを⼊⼒し、
    ⾃分のWatson Machine Learning サービスインスタンスがセットされてい
    るのを確認して、[作成]をクリック

    View Slide

  78. 6. Auto AI モデル作成
    78
    4. 「1. データのダウンロード」でダウンロードしたcustomer_churn.csv
    をドラッグ&ドロップして データをアップロードします。
    customer_churn.csv
    ドラッグ&ドロップ

    View Slide

  79. 6. Auto AI モデル作成
    79
    5. 「予測列の選択」から予測したい項⽬をクリックします。CHURNを選
    択します。
    6. 「 実験の実⾏」をクリックして、モデル作成を開始します。

    View Slide

  80. 6. Auto AI モデル作成
    80
    7. 実⾏は複数のステップを経て、8つのモデルを⽣成します。このプロセ
    スには5〜15分かかります(このデータの場合, 時間はデータの量によりま
    す)。「 実験完了 」が表⽰されるまで待ちます。

    View Slide

  81. 6. Auto AI モデル作成
    81
    8. 下にスクロールすると、作成されたモデルの特性がわかります。⼀番
    上のモデルが設定された基準で最もよいモデルとなります。
    ⼀番上の⾏をクリックして特性を⾒てみます。
    評価基準(変更可能)
    クリック

    View Slide

  82. 6. Auto AI モデル作成
    9.モデル評価、混同マトリックス、適合率/再現率(PR)曲線、モデル情報、
    特徴量の重要度など、さまざまなメトリックを確認できます。
    確認後、画⾯の左上にある「Churn Analysisに戻る]をクリックします。
    82
    機能の重要度=特徴量の重要度

    View Slide

  83. 6. Auto AI モデル作成
    10. ⼀番評価の⾼いモデルを保存します。
    ⼀番上のモデルの⾏にマウスカーソルを合わせると「名前を付けて保存」
    というボタンが表⽰されるので、それをクリックします。
    83

    View Slide

  84. 6. Auto AI モデル作成
    11. ドロップダウンに表⽰された「モデル」をクリックします。
    84

    View Slide

  85. 6. Auto AI モデル作成
    11.モデル名をChurn Analysis Modelに変更して、「保存 」ボタンをク
    リックします。保存が完了すると右上に以下の右のようなウィンドウが表
    ⽰されるので「 プロジェクトに表⽰ 」をクリックします。
    85
    もし、この表⽰が消えてしまった場合は次⾴参照

    View Slide

  86. 6. Auto AI モデル作成
    11A. 「プロジェクトに表⽰ 」が消えてしまった場合は、上部ナビゲー
    ションよりプロジェクト名をクリック、資産タブをクリック、下にスク
    ロールして、モデルの下の設定したモデル名をクリック
    86

    View Slide

  87. 4. Auto AI 課題Demo
    1. データ準備
    2. Watson Studio のセットアップ
    3. Watson Studio の起動
    4. Watson Studio Projectの作成
    5. サービスの作成と追加
    6. Auto AI モデル作成
    7. Auto AI Deploy & テスト

    View Slide

  88. 7. Auto AI Deploy & テスト
    1. 「 Deployments」タブをクリックします。
    88

    View Slide

  89. 7. Auto AI Deploy & テスト
    2. 右にある「デプロイメントの追加」をクリックします。
    89

    View Slide

  90. 7. Auto AI Deploy & テスト
    3. 名前に「 Churn model deployment」と⼊⼒後、「保存」ボタンをク
    リックします。
    90

    View Slide

  91. 7. Auto AI Deploy & テスト
    4. 「デプロイメント」タブに⾃動で戻ります。状況が、初期化中から準備
    完了に変わったら「Churn model deployment 」をクリックします。
    1分待っても変わらない場合はリロードしてみてください。
    91

    View Slide

  92. 7. Auto AI Deploy & テスト
    5. 「概要」タブでデプロイメントの詳細を確認できます。 「実装」タブ
    をクリックします。そのタブの下に、スコアリングエンドポイントが表⽰
    され、Java、JavaScript、Pythonなどの5つの⾔語のコードスニペットも
    提供されます。
    92

    View Slide

  93. 7. Auto AI Deploy & テスト
    6. [テスト]タブをクリックします。そのままフォームでデータを⼊れても
    できますが、今回はJSON inputアイコンをクリックして、JSONで⼊⼒し
    ます。以下の右のJSONデータを⼊⼒エリアにコピぺしします。
    93
    {"input_data": [{ "fields":
    [ "ID", "Gender", "Status",
    "Children", "Est Income",
    "Car Owner", "Age",
    "LongDistance",
    "International", "Local",
    "Dropped", "Paymethod",
    "LocalBilltype",
    "LongDistanceBilltype",
    "Usage", "RatePlan" ],
    "values": [[ 6, "M", "M", 2,
    29616, "N", 49.42, 29.78, 0,
    45.5, 0, "CH", "FreeLocal",
    "Standard", 75.29, 2 ]] }] }
    コピー&
    ペースト
    する

    View Slide

  94. 7. Auto AI Deploy & テスト
    6-参考: コピペしたJSONは以下のように項⽬名が"fields"に、その値が
    "values"に⼊っています。この属性の顧客が解約するかしないか(CHURN)
    を予測します。(customer_churn.csv ID=6のデータと同じです)
    94

    View Slide

  95. 7. Auto AI Deploy & テスト
    7. 「予測」ボタンをクリックします。
    右側に予測結果が表⽰されます。
    この場合、予測値はFで確率(probability)は0.9999555620264015です。
    95
    customer_churn.csv
    ID=6のCHURNの値と
    ⽐べてみましょう。

    View Slide

  96. 6. 課題

    View Slide

  97. 課題1.
    http://ibm.biz/dojo20200617doc
    この資料:
    先ほど実施の「 4. Auto AI 課題Demo 」
    を完了しましょう

    View Slide

  98. バッジプログラム申請 課題のご案内
    今回の参加課題は課題1の
    Watson Studioの管理画⾯(アカウント名表⽰あり)
    です。
    アカウント名表示が途中で省
    略されていてもOKです。

    View Slide

  99. 課題2(オプション)
    チュートリアル: IBM Watson Studio AutoAI: Modeling
    for the rest of us
    https://www.ibm.com/cloud/garage/dte/tutorial/ibm-watson-studio-
    autoai-modeling-rest-us
    のCreate an AutoAI model for regression 部分
    (それより前のセクションは当講義の内容です)
    ⽇本語解説へのLink: http://ibm.biz/WatsonStudioTutrialJP
    尚、⽇本語解説の画⾯イメージは英語版になります。

    View Slide

  100. 課題3(オプション)
    チュートリアル: IBM Watson Studio AutoAI: Modeling
    for the rest of us
    https://www.ibm.com/cloud/garage/dte/tutorial/ibm-watson-studio-
    autoai-modeling-rest-us
    のAccessing a model through a notebook 部分
    ⽇本語解説へのLink: http://ibm.biz/WatsonStudioTutrialJP

    View Slide

  101. 参考リンク
    IBM Watson Studio ラーニング・パス
    https://www.ibm.com/developerworks/jp/library/introduction-watson-
    studio/index.html
    レベル別に101〜401まで4つのチュートリアルがあります。
    201は本⽇の内容とほぼ同じですのでスキップ可能です。

    View Slide

  102. 7. まとめ
    • Watson Studioのはデータ分析の全プロセスで⼀
    貫して使えるツール
    • AutoAIで簡単に機械学習モデルが作成できる

    View Slide

  103. IBM Code Patterns
    https://ibm.biz/ibmcodejp
    解説 + デモ動画 + ソースコードが揃ったアプリ開発パターン集

    View Slide

  104. 開発者向けサイト IBM Developer
    https://ibm.biz/IBMDevJP
    最新情報やスキルアップに役⽴つ6,000を超える技術記事を提供

    View Slide

  105. #CallforCode

    View Slide

  106. 2020 Call for Code グローバル・チャレンジ
    今回のテーマは「気候変動」と「COVID-19」
    • IBM Cloudを活⽤したアプリ開発コンテスト
    • 「⼀般向け*」と「IBMer向け」に開催
    4/27 (⽉)
    ⼀般
    COVID19
    早期締切
    3/22 (⽇)
    応募受付
    開始
    審査期間
    8〜9⽉ 10⽉
    最優秀賞
    チーム発表
    6/30 (⽕)
    IBM社員
    応募受付
    最終締切
    7/31 (⾦)
    ⼀般
    応募受付
    最終締切
    * IBM Corporationとその法⼈、それらが所有する⼦会社の51%以上および、
    Red Hat Inc.とそのすべての⼦会社は「⼀般向け」Call for Code 2020には
    参加できませんのでご注意ください。IBM社員は詳しくは社内w3サイトで。
    #CallforCode

    View Slide

  107. callforcode.org
    ⽇本語情報
    https://ibm.biz/c4cjapan
    ⽇本語
    English
    #CallforCode
    Dojo 番外編
    マスクずれてるよ︕︖
    今晩19:00-20:30
    https://ibm-
    developer.connpass.com/event/179420/

    View Slide

  108. 質問&アンケート⼊⼒
    はこちら
    slido.com
    #dojo617
    質問タブで質問⼊⼒
    ⾃分も知りたい質問には
    「いいね」をプッシュ!
    絵⽂字は表⽰されません
    スマホまたはPCでアクセスして
    ぜひ⼊⼒お願いします︕
    6/17 Auto AI を使ったらくらく機械学習

    View Slide

  109. 免責事項
    109
    IBM Developer Dojoは開発者の⽅を対象に、IBM Cloudを主とした技術情報をお伝えする⽬的で開催しています。
    講師や運営スタッフにより、開催毎に最適と判断した内容でお届けしています。
    現在、ハンズオンを伴う講義はお客様の費⽤負担がない環境と⼿順でご案内しています。講義終了後、不要に
    なりました制作物はお客様ご⾃⾝で削除をお願いいたします。クレジットカードの登録が伴わない場合、費⽤は
    ⼀切発⽣致しませんが、ご登録いただいたお客様はご注意ください。
    講師陣はみなさまの利⽤状況を個別に確認することはできません。
    ご理解とご協⼒をお願いいたします。
    利⽤したサービスの削除⽅法については講義の中でご案内します。
    ご不明な点がございましたら、当⽇確認をお願いいたします。
    講義終了後、 IBM Developer Dojoに関するお問い合わせは「Slack」にお願いします。それ以外のIBM Cloudの
    お問い合わせにつきましては、弊社サポートセンターまで、次のいづれかの⽅法でお問い合わせください。
    IBM Cloudダッシュボードの「サポート」メニューから「Case」を作成し、英語でご記⼊ください
    IBM Cloudサポートセンター「相談する」ボタンからチャットまたは電話でご連絡ください
    https://www.ibm.com/jp-ja/cloud/support
    ご参加ありがとうございました。

    View Slide

  110. View Slide