Slide 1

Slide 1 text

夏のIBM Dojo #6 Analytics / Watson Studio Kyoko Nishito Developer Advocate Tokyo City Team

Slide 2

Slide 2 text

Speaker ⻄⼾ 京⼦ Kyoko Nishito IBM Developer Advocate KyokoNishito

Slide 3

Slide 3 text

タイムテーブル 14:00-14:05 (5min) オープニング 資料ダウンロード,出席登録など ⽇本アイ・ビー・エム株式会社 デベロッパーアドボケイト ⻄⼾ 京⼦ 14:05-15:00 (55min) 夏のIBM Dojo #6 Analytics / Watson Studio <座学+DEMO> ⽇本アイ・ビー・エム株式会社 デベロッパーアドボケイト ⻄⼾ 京⼦ 15:00-17:00 (120min) Watson Studio コードチャレンジ <ワークショップ> ⽇本アイ・ビー・エム株式会社 デベロッパーアドボケイト ⻄⼾ 京⼦ 17:00-17:30 (30min) クローズ

Slide 4

Slide 4 text

本⽇の資料 本⽇の資料はこちらからダウンロードお願いします。 URLをクリックしたり、コマンドをコピペしたりできますので、 サイトでみるのではなく、ダウンロードをお勧めします。 http://ibm.biz/dojo20190918doc

Slide 5

Slide 5 text

出席登録 こちらのURLにアクセスして、IBM Cloudにログイン お願いします。 アカウント未登録の⽅もこちらから登録お願いします。 https://ibm.biz/BdzVUW

Slide 6

Slide 6 text

事前準備 1. IBM Cloudアカウント(無料)の取得 2. Webブラウザー Chrome または Firefoxの導⼊

Slide 7

Slide 7 text

学習の⽬的とゴール ⽬的 Watson Studio概要について理解し、AutoAIを使えるように なる ゴール AutoAIを使って機械学習モデルを作成できるようになる このコースを学ぶ⽅の想定スキル EXCEL等で表データを使ったことのあるWatson Studio初⼼者 の⽅

Slide 8

Slide 8 text

本⽇の内容 1. 機械学習 2. Watson Studio概要 3. Watson Studio 注⽬機能 4. Auto AI 5. Auto AI DEMO

Slide 9

Slide 9 text

1. 機械学習

Slide 10

Slide 10 text

⼈⼯知能(AI)のサブセット(部分集合) 10 ディープ ラーンニング (深層学習) ⼈⼯知能 機械学習 機械学習は⼈⼯知能(AI)のサブセット ディープラーンニングは機械学習のサブセット

Slide 11

Slide 11 text

パターン認識と統計から進化した 機械学習は、 ルールベースのアルゴリズムに従う のではなく、 データから分類と予測を⾏うための モデル構築を⾏うことです。 11

Slide 12

Slide 12 text

機械学習 Machine Learning 12 12 課題: ⼼不全がおこるかどうかを判断する *BMI: 体重kg÷(⾝⻑m*⾝⻑m) 実⾏: モデルは⼼不全の有無 を予測 学習: 学習し結果予測モデル作成のために データセットを利⽤ ⼼拍数 BMI 年齢 性別 結果 93 25 49 F False 108 24 32 M False 80 31 60 M True 93 27 58 F True ⼊⼒: ⼼拍数, BMI*, 年齢, 性別

Slide 13

Slide 13 text

今までのやり⽅ -- Traditional 13 データ ルール if BPM-BMI > 60: result = True else: result = False 結果 アルゴリズム

Slide 14

Slide 14 text

機械学習 Machine Learning データ ルール アルゴリズム(モデル) 結果 (学習済モデル) 学習 (パラメータ内部調整)

Slide 15

Slide 15 text

機械学習 Machine Learning 15 データ ルール アルゴリズム(モデル) 結果 (学習済モデル) 学習 (パラメータ内部調整) ルール (学習済モデル) 予測したい データ 予測結果

Slide 16

Slide 16 text

機械学習 教師あり学習 教師なし学習 強化学習 分類 回帰 ニューラル ネットワーク クラスタ分析 次元削減 ニューラル ネットワーク 報酬 (Reward)

Slide 17

Slide 17 text

教師あり学習 機械学習 教師なし学習 強化学習 回帰 Regression 分類 Classification ニューラル ネットワーク 連続した数値を推定 Watson Studioの AutoAI機能で プログラミングなしで モデル作成が可能! AdaBoost Regression Elastic Net with Cross- Validation Nearest Neighbor Analysis (KNN) Lasso Lars with Cross- Validation MLP Regression Orthogonal Matching Pursuit with Cross- Validation Random Forest Regression Theil-Sen Regression ARD Regression Elastic Net Kernel Ridge Lasso Lars MultiTask Elastic Net CV Orthogonal Matching Pursuit RANSAC Regression XGBoost Regression Bayesian Ridge Regression Gaussian Process Lars with Cross- Validation Lasso Lars IC MultiTask Elastic Net Passive- Aggressive Regression Ridge with Cross- Validation CCA Gaussian Process Regression Lars LGBM Regression Multi Task Lasso CV PLS Canonical Ridge Decision Tree Regression Gradient Boosting Regression Lasso with Cross- Validation Linear Regression Multi Task Lasso PLS Regression SGD Regression Extra Trees Regression Huber Regression Lasso Linear Support Vector Regression Nu SVR Radius Neighbors Regression Support Vector Regression AdaBoost Classifier Gaussian Naïve Bayes Classifier Label Spreading Logistic Regression Passive Aggressive Classifier Ridge Classifier with Cross- Validation Bernoulli Naïve Bayes Classifier Gaussian Process Classifier LGBM Classifier MLP Classifier Perceptron Ridge Classifier Calibrated Classifier with Cross-Validation Gradient Boosted Tree Classifier Linear Discriminant Analysis Multinomial Naïve Bayes Classifier Quadratic Discriminant Analysis SGD Classifier Decision Tree Classifier Nearest Neighbor Analysis (KNN) Classifier Linear Support Vector Classifier Nearest Centroid Radius Neighbors Classifier Support Vector Classifier Extra Trees Classifier Label Propagation Logistic Regression with Cross- Validation Nu Support Vector Classifier Random Forest Classifier XGBoost Classifier 分類クラスを推定

Slide 18

Slide 18 text

(参考) AutoAIでサポートしているモデル(回帰) 回帰型モデルでは、次の44種類のモデルをサポートしています。 AdaBoost Regression Elastic Net with Cross- Validation Nearest Neighbor Analysis (KNN) Lasso Lars with Cross- Validation MLP Regression Orthogonal Matching Pursuit with Cross- Validation Random Forest Regression Theil-Sen Regression ARD Regression Elastic Net Kernel Ridge Lasso Lars MultiTask Elastic Net CV Orthogonal Matching Pursuit RANSAC Regression XGBoost Regression Bayesian Ridge Regression Gaussian Process Lars with Cross- Validation Lasso Lars IC MultiTask Elastic Net Passive- Aggressive Regression Ridge with Cross- Validation CCA Gaussian Process Regression Lars LGBM Regression Multi Task Lasso CV PLS Canonical Ridge Decision Tree Regression Gradient Boosting Regression Lasso with Cross- Validation Linear Regression Multi Task Lasso PLS Regression SGD Regression Extra Trees Regression Huber Regression Lasso Linear Support Vector Regression Nu SVR Radius Neighbors Regression Support Vector Regression

Slide 19

Slide 19 text

(参考) AutoAIでサポートしているモデル(分類) 分類型モデルでは、次の30種類のモデルをサポートしています。 AdaBoost Classifier Gaussian Naïve Bayes Classifier Label Spreading Logistic Regression Passive Aggressive Classifier Ridge Classifier with Cross- Validation Bernoulli Naïve Bayes Classifier Gaussian Process Classifier LGBM Classifier MLP Classifier Perceptron Ridge Classifier Calibrated Classifier with Cross-Validation Gradient Boosted Tree Classifier Linear Discriminant Analysis Multinomial Naïve Bayes Classifier Quadratic Discriminant Analysis SGD Classifier Decision Tree Classifier Nearest Neighbor Analysis (KNN) Classifier Linear Support Vector Classifier Nearest Centroid Radius Neighbors Classifier Support Vector Classifier Extra Trees Classifier Label Propagation Logistic Regression with Cross-Validation Nu Support Vector Classifier Random Forest Classifier XGBoost Classifier

Slide 20

Slide 20 text

2. Watson Studio概要

Slide 21

Slide 21 text

Watson Studio 概念図 エンタープライズ・カタログ (メタデータや分析資産を共有し、だれもが使える状態に) データソース 構造化 パブリック オンプレミス プライベート データ加⼯/品質確認 (プレパレーション) AI/マシン ラーニング データ可視化 ダッシュボード データへのアクセス データ蓄積 整える 分析活⽤する つなぐ データ サインティスト ビジネスプロセス スコアリング 結果 提供者の視点 利⽤者の視点 Watson Studio チームで協働する データ分析

Slide 22

Slide 22 text

Watson Studioの特徴 –分析の全プロセスで⼀貫して使えるツール - データソース カタログ 抽出 加⼯・結合 テーブル作成 (BIモデル 作成) データ 可視化 機械学習 モデル作成 特徴点 抽出 Tool A Tool B Tool C Watson Studio ガバナンス 再利⽤ 基盤担当 データ エンジニア データサイエンティスト アプリ開発者 データ ガバナンス担当 つなぐ 整える 分析活⽤する チームで協働する

Slide 23

Slide 23 text

つなぐ︓データ提供元の選択 〜収集・蓄積・仮想化〜 IBMのデータベースソリューション 他社のデータベースソリューション 様々なデータベースへのコネクタを 使って企業内のデータを仮想的に 統合活⽤する

Slide 24

Slide 24 text

整える︓データ準備 (探索・確認・加⼯) の効率化 データの品質や分布を可視化 ⽋損値や外れ値を把握・修正 ユーザー⾃⾝が、様々な データをGUIで簡単に加⼯ • 検索機能をつかって探し出す • 他のユーザが作成した加⼯デー タ等を共有・再利⽤が出来る ⽬的に合う正しいデータを 探し取り出す データの特徴・分布状況を 簡単に確認 データ加⼯や結合を容易に ① データカタログ ② データプロファイル ③ セルフETL

Slide 25

Slide 25 text

分析する︓利⽤者のレベル・経験に即したツールの提供 SPSS Modeler AutoAI GUI コーディング

Slide 26

Slide 26 text

様々な分析ツールを選択可能 従来のデータ分析の世界では、分析者により利⽤するツールが異なり、チームメンバー間でのコラボ レーションが難しいという課題がありました。 Watson Studioでは、データ分析で標準的なツールを⼀通り備えており、どの分析者も⾃分にとって 慣れた環境をクラウド上に持つことで分析を⾏えます。 SPSS Modeler Jupyter Notebook +Python R Studio

Slide 27

Slide 27 text

3. Watson Studio注⽬機能

Slide 28

Slide 28 text

Watson Studio 機能 • カタログ機能: Connection登録 • カタログ機能: テーブル登録 • カタログ機能: ⽂書 • Refinery: データ分析 • Refinery: データ整形 • Cognos Service: BI Tool • 機械学習⽤GUIツール (AutoAI) • SPSS modeler機能 • R Studio機能 • Jupyter Notebook機能 • 深層学習⽤GUIツール (Neural Network Designer) • 深層学習⽤GUIツール (Experiment Builder) • 深層学習⽤の実験環境(HPO)の提供 • Decision Optimizer • Machine Learning: モデル管理機能 • Machine Learning: Webサービス化 • Machine Learning: モデルの再評価、再学 習、再配置 • Visual Recognition Model作成ツール • Natural Language Classifier model作成 ツール • NeuNetS(学習データ(イメージ)に応じて最 適な深層学習モデルを⽣成)

Slide 29

Slide 29 text

Watson Studio 機能 • カタログ機能: Connection登録 • カタログ機能: テーブル登録 • カタログ機能: ⽂書 • Refinery: データ分析 • Refinery: データ整形 • Cognos Service: BI Tool • 機械学習⽤GUIツール (AutoAI) • SPSS modeler機能 • R Studio機能 • Jupyter Notebook機能 • 深層学習⽤GUIツール (Neural Network Designer) • 深層学習⽤GUIツール (Experiment Builder) • 深層学習⽤の実験環境(HPO)の提供 • Decision Optimizer • Machine Learning: モデル管理機能 • Machine Learning: Webサービス化 • Machine Learning: モデルの再評価、再学 習、再配置 • Visual Recognition Model作成ツール • Natural Language Classifier model作成 ツール • NeuNetS(学習データ(イメージ)に応じて最 適な深層学習モデルを⽣成) 今回は上記⿊字機能を ご紹介します

Slide 30

Slide 30 text

Refinery (データ分析) Knowledge CatalogではRefineryというツールがあり、Studio上からシームレスに呼出し可能です。 Refineryの持つデータ分析機能を使うと、解析対象のデータの項⽬別の状況を視覚的に確認できます。 Knowledge Catalog

Slide 31

Slide 31 text

Refinery (データ整形) Refineryはデータ整形機能を持っています。下記のような処理をプログラミングなしに実現可能です。 また⼀度実⾏した⼿順を覚えて、同じ処理を⾃動で再実⾏することもできます(スケジュール機能)。 Knowledge Catalog 四則計算 属性変換 フィル ター 関数計算 除去 リネーム ソート(昇 順) ソート(降 順) 表示マス キング テキスト 処理 欠損値へ変 換 重複行除去 空白行除去 欠損値の置 換 部分文字列 置換 日時データ 抽出 集約 条件置換 ジョイン サンプル抽 出 列分割 連結 ストップ ワード除去 形態素解析

Slide 32

Slide 32 text

機械学習⽤GUIツール (AutoAI) • 機械学習モデルに関してはAutoAIという機能があり、機械学習に詳しくないユーザーもCSVフ ァイルの準備とマウス操作で簡単にモデルを作ることが可能です。

Slide 33

Slide 33 text

Jupyter Notebook機能 Jupyter Notebookの実⾏環境をクラウド上に持たせることができます。 サポートしている⾔語はPython 3.6とR、及びScalaです。 Python 3.6の場合、次のライブラリは事前導⼊済みですぐに使える状態です。 Tensorflow、Keras、Caffe、scikit-learn、Spark Mlib、XGBoost、Numpy、Pandas、 matplotlib等。 事前導⼊されていないライブラリもpipコマンドで導⼊可能なものであれば、追加導⼊して 利⽤可能となります。

Slide 34

Slide 34 text

Decision Optimizer 従来 CPLEXという製品名で提供されていた最適化ソリューションもDecision Optimizer という名前でWatson Studioから利⽤可能になりました。 「数独」を解いた例 「巡回セールスマン問題」を解いた例 https://qiita.com/makaishi2/items/78570f9283c0bc6c7e6c https://qiita.com/makaishi2/items/d1cc9a3f49f640a3b649

Slide 35

Slide 35 text

4. AutoAI

Slide 36

Slide 36 text

AutoAIとは AutoAIは従来型の機械学習モデルを対象として、前処理、モデル選定、パラメータ チューニングなど含めたモデル最適化を⾃動的に⾏います。

Slide 37

Slide 37 text

AutoAIの⾃動学習 データ前処理 効率のいいモデル作成に必須の処理である、⽋損値の補間、データのエンコードなどを、最適 な形で⾃動的に⾏います。 モデル選定 モデル選定に関しては、少ないデータで簡易的なモデルを作成し、有⼒な候補のモデルを絞り 込む⽅式を採⽤しています。この⽅法により、少ない処理時間で効率よく精度の⾼いモデルを 選定することが可能です。候補となるモデル数は 分類型: 30種類 回帰型: 44種類です。 特徴量最適化 AutoAIでは、強化学習の仕組みを利⽤して、しらみつぶしではない効率のいい⽅法により、 精度の最適化をするための特徴量チューニングを⾏います。 ハイパーパラメータ最適化 モデルの精度に影響のある、ハイパーパラメータの最適化についても、計算資源をあまり使わ ない効率のいい⽅法で⾏います。 参照: https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/autoai-overview.html?audience=wdp

Slide 38

Slide 38 text

AutoAIの⾃動学習 AutoAIは、①⼊⼒となるCSVファイルと②⽬的変数だけ指定すると、あとはすべて⾃動的に最 適な機械学習モデルを⽣成します。 ① ② ③

Slide 39

Slide 39 text

AutoAIの⾃動学習 AutoAIの処理は「パイプライン」という形で、左から右に流れていきます。 現在、どの処理が⾏われているかは、下の画⾯で確認可能です。 データ前処理 モデル選定 パラメータ 最適化 特徴量 最適化

Slide 40

Slide 40 text

AutoAIの⾃動学習 ⾃動的に作られた4つのモデルは、事前設定した評価項⽬により順位付けされて表⽰されます。

Slide 41

Slide 41 text

AutoAIの⾃動学習 個別の⾏をクリックすると、各モデルの詳細情報が表⽰されます。 ①ROCカーブというモデルの精度を評価するために利⽤されるグラフや、②どのような特徴量 最適化を⾏ったか、あるいは、③特徴量ごとの寄与度などが表⽰可能です。 ② ③ ①

Slide 42

Slide 42 text

(参考) AutoAIでサポートしているモデル(回帰) 回帰型モデルでは、次の44種類のモデルをサポートしています。 AdaBoost Regression Elastic Net with Cross- Validation Nearest Neighbor Analysis (KNN) Lasso Lars with Cross- Validation MLP Regression Orthogonal Matching Pursuit with Cross- Validation Random Forest Regression Theil-Sen Regression ARD Regression Elastic Net Kernel Ridge Lasso Lars MultiTask Elastic Net CV Orthogonal Matching Pursuit RANSAC Regression XGBoost Regression Bayesian Ridge Regression Gaussian Process Lars with Cross- Validation Lasso Lars IC MultiTask Elastic Net Passive- Aggressive Regression Ridge with Cross- Validation CCA Gaussian Process Regression Lars LGBM Regression Multi Task Lasso CV PLS Canonical Ridge Decision Tree Regression Gradient Boosting Regression Lasso with Cross- Validation Linear Regression Multi Task Lasso PLS Regression SGD Regression Extra Trees Regression Huber Regression Lasso Linear Support Vector Regression Nu SVR Radius Neighbors Regression Support Vector Regression

Slide 43

Slide 43 text

(参考) AutoAIでサポートしているモデル(分類) 分類型モデルでは、次の30種類のモデルをサポートしています。 AdaBoost Classifier Gaussian Naïve Bayes Classifier Label Spreading Logistic Regression Passive Aggressive Classifier Ridge Classifier with Cross- Validation Bernoulli Naïve Bayes Classifier Gaussian Process Classifier LGBM Classifier MLP Classifier Perceptron Ridge Classifier Calibrated Classifier with Cross-Validation Gradient Boosted Tree Classifier Linear Discriminant Analysis Multinomial Naïve Bayes Classifier Quadratic Discriminant Analysis SGD Classifier Decision Tree Classifier Nearest Neighbor Analysis (KNN) Classifier Linear Support Vector Classifier Nearest Centroid Radius Neighbors Classifier Support Vector Classifier Extra Trees Classifier Label Propagation Logistic Regression with Cross-Validation Nu Support Vector Classifier Random Forest Classifier XGBoost Classifier

Slide 44

Slide 44 text

4. Auto AI Demo

Slide 45

Slide 45 text

4. Auto AI Demo 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動 4. Watson Studio Projectの作成 5. Machine Learningサービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

Slide 46

Slide 46 text

4. Auto AI Demo 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動 4. Watson Studio Projectの作成 5. Machine Learningサービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

Slide 47

Slide 47 text

1. データ準備 架空の電話会社の顧客データ customer_churn.csv を以下からダウンロードし、⾃分のPCに保存します︓ http://ibm.biz/dxdojo2019data 右上のダウンロードボタンをクリックして保存します。

Slide 48

Slide 48 text

1. データ準備 架空の電話会社の顧客データ customer_churn.csv このファイルには顧客の属性と契約を解約したかしないか(CHURN)のデー タがあります。 このデータからCHURNを予測するモデルを作ります。

Slide 49

Slide 49 text

4. Auto AI Demo 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動 4. Watson Studio Projectの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

Slide 50

Slide 50 text

50 2. Watson Studioのセットアップ https://cloud.ibm.com/ にアクセスして ログインしてください

Slide 51

Slide 51 text

1. 「カタログ」をクリック 51 2. Watson Studioのセットアップ

Slide 52

Slide 52 text

52 2. リソースの作成 Watson Studio (カテゴリ AI) デプロイする地域/ロケーションの選択は「ダラス」を選択 →Lite Planを確認して[作成]をクリック 2. Watson Studioのセットアップ

Slide 53

Slide 53 text

4. Auto AI Demo 1. Watson Studio のセットアップ 2. Watson Studio の起動 3. Watson Studio Projectの作成 4. サービスの作成と追加 5. Auto AI モデル作成 6. Auto AI Deploy & テスト

Slide 54

Slide 54 text

54 1. ダッシュボードを表⽰ (左上のIBM Cloudロゴをクリック) 2. サービスからWatson Studioのサービスを選択 3. Get Startedを選択して起動 3. Watson Studioの起動 もし右側にこのような画⾯がでてきたら、 「全詳細の表⽰」をクリックする

Slide 55

Slide 55 text

4. Auto AI Demo 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動 4. Watson Studio Projectの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

Slide 56

Slide 56 text

56 1. [Create a Project]をクリックします。 2. [Create an empty project]をクリックします。 4. Projectの作成

Slide 57

Slide 57 text

57 3. Nameに任意のProject名を⼊れます。 (Tutorialでなるべく作成してください(違う名前でもOKです)) 4. 「Define storage」が表⽰されてない場合は、 下にスクロールして、 「Define storage」を表⽰させます(ブラウザー表⽰が横⻑の場合は右側 に表⽰されています)。 4. Projectの作成 Tutorial

Slide 58

Slide 58 text

5A. Object Storage未作成の場合: 5A-1. Define Storage の①Select storage serviceから[Add]をクリックし ます。 4. Projectの作成

Slide 59

Slide 59 text

4. Projectの作成 59 5A-2. Cloud Object Storageの画⾯が表⽰されるので下にスクロールします。 5A-3. Liteが選択されていることを確認して[Create]をクリックします。 5A-4. Confirm Creationのダイアログはそのまま[Confirm]をクリックします。 下にスクロール

Slide 60

Slide 60 text

4. Projectの作成 60 5A-5. New Projectの画⾯になるので、 Define Storage の②Refreshをク リックします 。 5A-6. Storageが表⽰された後、[Create]をクリックします。

Slide 61

Slide 61 text

4. Projectの作成 61 5B. Object Storage作成済の場合: 5B-1. [Create]をクリック ただしObject Storageを複数作成している場合は、使⽤したいObject Storageを選択後に[Create]をクリック

Slide 62

Slide 62 text

4. Projectの作成 62 6. Projectの画⾯が表⽰されます Tutorial

Slide 63

Slide 63 text

4. Auto AI Demo 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動 4. Watson Studio Projectの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

Slide 64

Slide 64 text

5. サービスの作成と追加 64 1. [Settings]をクリックします。 2. Associated servicesから[+Add services]をクリックして [Watson]を選択

Slide 65

Slide 65 text

3. Machine Learningの[Add]をクリック 4A: [New]のタブが選択された画⾯が表⽰された場合 1. スクロールしてPLANでLiteが選択されていることを確認して⼀番下 の[Create]をクリック 。 2. Confirmの画⾯でRegionがDallasになっていることを確認して [Confirm]をクリック 5. サービスの作成と追加 65 スクロール スクロール

Slide 66

Slide 66 text

5. サービスの作成と追加 66 4B[Existing]のタブが選択された画⾯が表⽰された場合 Existing Service Instance のドロップダウンから、使⽤するMachine Learningのサービスを選択して[Select]をクリック 。 [Existing]のタブが選択された画⾯が表⽰されたにもかかわらず、「Existing Service Instance」の下に「 No existing service instances found 」が表⽰された 場合は、「CLOUD FOUNDRY ORG」のドロップダウンを開き、値を選択してみて ください。。

Slide 67

Slide 67 text

5. サービスの作成と追加 67 5. [Settings] の画⾯に戻ります。 Associated servicesに追加したサービスのインスタンスが追加されてい ることを確認します。

Slide 68

Slide 68 text

4. Auto AI Demo 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動 4. Watson Studio Projectの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

Slide 69

Slide 69 text

6. Auto AI モデル作成 69 1. 右上の[ Add to Project ]をクリックします。 2. 表⽰されたウィンドウの[AutoAI experiment]をクリックします。

Slide 70

Slide 70 text

6. Auto AI モデル作成 70 3. Asset name : Churn Analysisを⼊⼒し、 ⾃分のWatson Machine Learning Service Instanceがセットされているの を確認して、[Create]をクリック スクロール

Slide 71

Slide 71 text

6. Auto AI モデル作成 71 4. 「1. データのダウンロード」でダウンロードしたcustomer_churn.csv をドラッグ&ドロップして データをアップロードします。 customer_churn.csv ドラッグ&ドロップ

Slide 72

Slide 72 text

6. Auto AI モデル作成 72 5. 「 Select column to predict」から予測したい項⽬をクリックします。 CHURNを選択します。 6. 「 Run experiment」をクリックして、モデル作成を開始します。

Slide 73

Slide 73 text

6. Auto AI モデル作成 73 7. 実⾏は複数のステップを経て、4つのモデルを⽣成します。このプロセ スには3〜5分かかります(このデータの場合, 時間はデータの量によりま す)。「Run Finished」が表⽰されるまで待ちます。

Slide 74

Slide 74 text

6. Auto AI モデル作成 74 8. 下にスクロールすると、作成されたモデルの特性がわかります。⼀番 上のモデルが設定された基準で最もよいモデルとなります。 ⼀番上の⾏をクリックして特性を⾒てみます。 評価基準(変更可能) クリック

Slide 75

Slide 75 text

6. Auto AI モデル作成 9.モデル評価、混同⾏列、PR曲線、モデル情報、特徴量の重要性など、 さまざまなメトリックを確認できます。 確認後、画⾯の左上にある[Back to Churn Analysis]をクリックします。 75

Slide 76

Slide 76 text

6. Auto AI モデル作成 10. ⼀番評価の⾼いモデルを保存します。 ⼀番上のモデルの⾏にマウスカーソルを合わせると「Save as model」と いうボタンが表⽰されるので、それをクリックします。 76

Slide 77

Slide 77 text

6. Auto AI モデル作成 11. Model nameをChurn Analysis Modelに変更して、「Save 」ボタンを クリックします。Saveが完了すると右上に以下の右のようなウィンドウが 表⽰されるので「 View in project 」をクリックします。 77

Slide 78

Slide 78 text

4. Auto AI Demo 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動 4. Watson Studio Projectの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

Slide 79

Slide 79 text

7. Auto AI Deploy & テスト 1. 「 Deployments」タブをクリックします。 79

Slide 80

Slide 80 text

7. Auto AI Deploy & テスト 2. 右にある「 Add Deployment」をクリックします。 80

Slide 81

Slide 81 text

7. Auto AI Deploy & テスト 3. Nameに「 Churn model deployment」と⼊⼒後、「Save」ボタンをク リックします。 81

Slide 82

Slide 82 text

7. Auto AI Deploy & テスト 4. 「Deployment」タブに⾃動で戻ります。STATUSが、Initializingから readyに変わったら「Churn model deployment 」をクリックします。 1分待っても変わらない場合はリロードしてみてください。 82

Slide 83

Slide 83 text

7. Auto AI Deploy & テスト 5. 「Overview」タブでDeploymentの詳細を確認できます。 「Implementation」タブをクリックします。そのタブの下に、スコアリン グエンドポイントが表⽰され、Java、JavaScript、Pythonなどの5つの⾔ 語のコードスニペットも提供されます。 83

Slide 84

Slide 84 text

7. Auto AI Deploy & テスト 6. [Test]タブをクリックします。そのままフォームでデータを⼊れてもで きますが、今回はJSON inputアイコンをクリックして、JSONで⼊⼒しま す。以下の右のJSONデータを⼊⼒エリアにコピぺしします。 84 {"input_data": [{ "fields": [ "ID", "Gender", "Status", "Children", "Est Income", "Car Owner", "Age", "LongDistance", "International", "Local", "Dropped", "Paymethod", "LocalBilltype", "LongDistanceBilltype", "Usage", "RatePlan" ], "values": [[ 6, "M", "M", 2, 29616, "N", 49.42, 29.78, 0, 45.5, 0, "CH", "FreeLocal", "Standard", 75.29, 2 ]] }] } コピー& ペースト する

Slide 85

Slide 85 text

7. Auto AI Deploy & テスト 6-参考: コピペしたJSONは以下のように項⽬名が"fields"に、その値が "values"に⼊っています。この属性の顧客が解約するかしないか(CHURN) を予測します。 85

Slide 86

Slide 86 text

7. Auto AI Deploy & テスト 7. 「Predict」ボタンをクリックします。 右側に予測結果が表⽰されます。 この場合、予測値はFで確率(probability)は0.9998155981401168です。 86

Slide 87

Slide 87 text

まとめ • Watson Studioのはデータ分析の全プロセスで⼀ 貫して使えるツール • AutoAIで簡単に機械学習モデルが作成できる

Slide 88

Slide 88 text

おすすめ情報 Learning path: Getting started with Watson Studio https://developer.ibm.com/series/learning-path-watson-studio/ (今後⽇本語訳の予定) IBM Code Patterns - アプリ開発パターン集 http://ibm.biz/ibmcodejp

Slide 89

Slide 89 text

コードチャレンジ: Watson Studio 〜17:00 休憩⾃由 不明な点は 質問

Slide 90

Slide 90 text

ベーシックチャレンジ http://ibm.biz/dojo20190918doc この資料: まずは先ほど実施の 「 4. Auto AI Demo 」を完了しましょう

Slide 91

Slide 91 text

メインチャレンジ チュートリアル: IBM Watson Studio AutoAI: Modeling for the rest of us https://www.ibm.com/cloud/garage/dte/tutorial/ibm-watson-studio- autoai-modeling-rest-us のCreate an AutoAI model for regression 部分 (それより前のセクションは当講義の内容です) ⽇本語解説へのLink: http://ibm.biz/WatsonStudioTutrialJP オプション課題: 上記チュートリアルの Accessing a model through a notebook 部分

Slide 92

Slide 92 text

おかわりチャレンジ Learning path: Getting started with Watson Studio https://developer.ibm.com/series/learning-path-watson-studio/ (英語、今後⽇本語訳の予定) レベル別に101〜401まで4つのチュートリアルがあります。 CodePatterns: IBM Watson Studio で Jupyter Notebook を使⽤して対 話式レコメンデーション・エンジン PixieApp を作成する https://developer.ibm.com/jp/patterns/build-a-product- recommendation-engine-with-watson-machine-learning/ (githubのREAMDEは英語, notebook上でモデル作成)

Slide 93

Slide 93 text

Dojoで学んだことをOutputしよう︕ -Watson開発⼊⾨ 書籍プレゼントキャンペーン- 募集期間︓ 2019年9⽉30⽇(⽉)まで 参加したセッションやセミナーをベースに技術ブログに書いたら、 市販書籍「Watson開発⼊⾨」をプレゼント!! 応募条件 •誰でもアクセス可能なサイトに公開していること •IBM Cloudの技術やサービスを利⽤・解説していること •応募時点で動作可能なコンテンツであること 応募⽅法: 以下を記載してメールにてご連絡ください。[email protected] 1. 掲載先URL 2. 記事概要 3. 書籍送付先(郵便番号/住所/⽒名) 4. IBM CloudのアカウントID(登録メールアドレス) Subjectに“Watson本希望“と記載してください OK": 〇〇を△△してみた、CODE Patterns 翻訳、○○トラブルシューティングなどのブログ NG#: セッション楽しかったなど感想のみのブログ、記事転載、まとめ記事のみのブログ