初夏のIBM Dojo #6 Auto AI を使ったらくらく機械学習 / IBM Dojo AutoAI ML 20200617

初夏のIBM Dojo #6 Auto AI を使ったらくらく機械学習 Kyoko Nishito Developer Advocate
Tokyo City Team

Kyoko Nishito IBM Developer Advocate 2 KyokoNishito

質問&ライブ投票参加はこちら slido.com #dojo617 質問タブで質問⼊⼒⾃分も知りたい質問には「いいね」をプッシュ! 絵⽂字は表⽰されませんスマホでアクセスしてぜひ参加お願いします︕
6/17 Auto AI を使ったらくらく機械学習

本⽇のタイムテーブル 14:00-14:05 (5min) オープニング資料ダウンロード,出席登録など 14:05-15:00 (55min) Watson Studio &
Auto AI ⼊⾨ <座学+DEMO> 15:00-15:15 (15min) 課題の説明とQ&A

本⽇の資料本⽇の資料はこちらからPCにダウンロードお願いします。URLをクリックしたり、コマンドをコピペしたりできますので、サイトでみるのではなく、ダウンロードをお勧めします。(connpassの資料にもリンクあり) http://ibm.biz/dojo20200617doc

出席登録こちらのURLにアクセスして、IBM Cloudにログインお願いします。 http://ibm.biz/dojo0617 アカウント未登録の⽅もこちらから登録お願いします。

新しい取り組み“バッジ取得プログラム”のご案内 7 IBM Cloud & AI develop Basic Online Developer
Dojo ” IBM Cloud & AI develop Basic Online Developer badge“について - 2020年6⽉1⽇より開始のIBM Developer Dojo 12回シリーズと同様の内容のIBM Developer Dojoのクラスが対象 https://www.ibm.com/jp-ja/partnerworld/events/developer-dojo - スキルアップのため全クラスの受講をお奨めします。 - 12回のクラスのうちPAYGアカウントまたはサブスクリプションが必要としない8つのクラスの課題を実施 - 8クラスのうち5クラスの課題について指定された結果を⾃分のアカウントが⾒えるようにスクリーンショットを撮影 - 5クラス分の課題のスクリーンショットをPDFにして以下の宛先に送付 - 提出した課題が承認されるとAcclaimからバッジが発⾏されます。 ※バッジ発⾏のためにこれ以外の処理が発⽣する場合、別途ご連絡させていただきます 2020年6⽉1⽇お問い合わせは、Online Developer Dojo バッジ事務局（ビジネス・パートナープログラムヘルプデスク [email protected] ）

ハンズオン事前準備 1. IBM Cloudアカウント(無料)の取得 2. Webブラウザー Chrome または Firefoxの導⼊

学習の⽬的とゴール⽬的 Watson Studio概要について理解し、AutoAIを使えるようになるゴール AutoAIを使って機械学習モデルを作成できるようになるこのコースを学ぶ⽅の想定スキル EXCEL等で表データを使ったことのあるWatson Studio初⼼者
の⽅

⽬次 1. 機械学習 2. Watson Studio概要 3. Watson Studio 注⽬機能
4. Auto AI 5. Auto AI 課題DEMO 6. 課題 7. まとめ

1. 機械学習

⼈⼯知能(AI)のサブセット(部分集合) 12 ディープラーンニング (深層学習) ⼈⼯知能機械学習機械学習は⼈⼯知能(AI)のサブセットディープラーンニングは機械学習のサブセット

パターン認識と統計から進化した機械学習は、ルールベースのアルゴリズムに従うのではなく、データから分類と予測を⾏うためのモデル構築を⾏うことです。 13

機械学習 Machine Learning 14 14 課題: ⼼不全がおこるかどうかを判断する *BMI: 体重kg÷(⾝⻑m*⾝⻑m) 実⾏:
モデルは⼼不全の有無を予測学習: 学習し結果予測モデル作成のためにデータセットを利⽤⼼拍数 BMI 年齢性別結果 93 25 49 F False 108 24 32 M False 80 31 60 M True 93 27 58 F True ⼊⼒: ⼼拍数, BMI*, 年齢, 性別

今までのやり⽅ -- Traditional 15 データルール if BPM-BMI > 60:
result = True else: result = False 結果アルゴリズム

機械学習 Machine Learning データルールアルゴリズム(モデル) 結果 (学習済モデル) 学習 (パラメータ内部調整)

機械学習 Machine Learning 17 データルールアルゴリズム(モデル) 結果 (学習済モデル) 学習
(パラメータ内部調整) ルール (学習済モデル) 予測したいデータ予測結果

機械学習教師あり学習教師なし学習強化学習分類回帰クラスタ分析次元削減報酬 (Reward)

教師あり学習機械学習教師なし学習強化学習回帰 Regression 分類 Classification 連続した数値を推定 Watson
Studioの AutoAI機能でプログラミングなしでモデル作成が可能! AdaBoost Regression Elastic Net with Cross- Validation Nearest Neighbor Analysis (KNN) Lasso Lars with Cross- Validation MLP Regression Orthogonal Matching Pursuit with Cross- Validation Random Forest Regression Theil-Sen Regression ARD Regression Elastic Net Kernel Ridge Lasso Lars MultiTask Elastic Net CV Orthogonal Matching Pursuit RANSAC Regression XGBoost Regression Bayesian Ridge Regression Gaussian Process Lars with Cross- Validation Lasso Lars IC MultiTask Elastic Net Passive- Aggressive Regression Ridge with Cross- Validation CCA Gaussian Process Regression Lars LGBM Regression Multi Task Lasso CV PLS Canonical Ridge Decision Tree Regression Gradient Boosting Regression Lasso with Cross- Validation Linear Regression Multi Task Lasso PLS Regression SGD Regression Extra Trees Regression Huber Regression Lasso Linear Support Vector Regression Nu SVR Radius Neighbors Regression Support Vector Regression AdaBoost Classifier Gaussian Naïve Bayes Classifier Label Spreading Logistic Regression Passive Aggressive Classifier Ridge Classifier with Cross- Validation Bernoulli Naïve Bayes Classifier Gaussian Process Classifier LGBM Classifier MLP Classifier Perceptron Ridge Classifier Calibrated Classifier with Cross-Validation Gradient Boosted Tree Classifier Linear Discriminant Analysis Multinomial Naïve Bayes Classifier Quadratic Discriminant Analysis SGD Classifier Decision Tree Classifier Nearest Neighbor Analysis (KNN) Classifier Linear Support Vector Classifier Nearest Centroid Radius Neighbors Classifier Support Vector Classifier Extra Trees Classifier Label Propagation Logistic Regression with Cross- Validation Nu Support Vector Classifier Random Forest Classifier XGBoost Classifier 分類クラスを推定

(参考) AutoAIでサポートしているモデル(回帰) 回帰型モデルでは、次の44種類のモデルをサポートしています。 AdaBoost Regression Elastic Net with Cross- Validation
Nearest Neighbor Analysis (KNN) Lasso Lars with Cross- Validation MLP Regression Orthogonal Matching Pursuit with Cross- Validation Random Forest Regression Theil-Sen Regression ARD Regression Elastic Net Kernel Ridge Lasso Lars MultiTask Elastic Net CV Orthogonal Matching Pursuit RANSAC Regression XGBoost Regression Bayesian Ridge Regression Gaussian Process Lars with Cross- Validation Lasso Lars IC MultiTask Elastic Net Passive- Aggressive Regression Ridge with Cross- Validation CCA Gaussian Process Regression Lars LGBM Regression Multi Task Lasso CV PLS Canonical Ridge Decision Tree Regression Gradient Boosting Regression Lasso with Cross- Validation Linear Regression Multi Task Lasso PLS Regression SGD Regression Extra Trees Regression Huber Regression Lasso Linear Support Vector Regression Nu SVR Radius Neighbors Regression Support Vector Regression

(参考) AutoAIでサポートしているモデル(分類) 分類型モデルでは、次の30種類のモデルをサポートしています。 AdaBoost Classifier Gaussian Naïve Bayes Classifier Label
Spreading Logistic Regression Passive Aggressive Classifier Ridge Classifier with Cross- Validation Bernoulli Naïve Bayes Classifier Gaussian Process Classifier LGBM Classifier MLP Classifier Perceptron Ridge Classifier Calibrated Classifier with Cross-Validation Gradient Boosted Tree Classifier Linear Discriminant Analysis Multinomial Naïve Bayes Classifier Quadratic Discriminant Analysis SGD Classifier Decision Tree Classifier Nearest Neighbor Analysis (KNN) Classifier Linear Support Vector Classifier Nearest Centroid Radius Neighbors Classifier Support Vector Classifier Extra Trees Classifier Label Propagation Logistic Regression with Cross-Validation Nu Support Vector Classifier Random Forest Classifier XGBoost Classifier

2. Watson Studio概要

Watson Studio 概念図エンタープライズ・カタログ (メタデータや分析資産を共有し、だれもが使える状態に) データソース構造化パブリックオンプレミスプライベート
データ加⼯/品質確認 (プレパレーション) AI/マシンラーニングデータ可視化ダッシュボードデータへのアクセスデータ蓄積整える分析活⽤するつなぐデータサインティストビジネスプロセススコアリング結果提供者の視点利⽤者の視点 Watson Studio チームで協働するデータ分析

Watson Studioの特徴 –分析の全プロセスで⼀貫して使えるツール - データソースカタログ抽出加⼯・結合テーブル作成 (BIモデル
作成) データ可視化機械学習モデル作成特徴点抽出 Tool A Tool B Tool C Watson Studio ガバナンス再利⽤基盤担当データエンジニアデータサイエンティストアプリ開発者データガバナンス担当つなぐ整える分析活⽤するチームで協働する

つなぐ︓データ提供元の選択〜収集・蓄積・仮想化〜 IBMのデータベースソリューション他社のデータベースソリューション様々なデータベースへのコネクタを使って企業内のデータを仮想的に統合活⽤する

整える︓データ準備 (探索・確認・加⼯) の効率化データの品質や分布を可視化⽋損値や外れ値を把握・修正ユーザー⾃⾝が、様々なデータをGUIで簡単に加⼯ • 検索機能をつかって探し出す •
他のユーザが作成した加⼯データ等を共有・再利⽤が出来る⽬的に合う正しいデータを探し取り出すデータの特徴・分布状況を簡単に確認データ加⼯や結合を容易に ① データカタログ ② データプロファイル ③ セルフETL

分析する︓利⽤者のレベル・経験に即したツールの提供 SPSS Modeler AutoAI GUI コーディング

様々な分析ツールを選択可能従来のデータ分析の世界では、分析者により利⽤するツールが異なり、チームメンバー間でのコラボレーションが難しいという課題がありました。 Watson Studioでは、データ分析で標準的なツールを⼀通り備えており、どの分析者も⾃分にとって慣れた環境をクラウド上に持つことで分析を⾏えます。 SPSS Modeler Jupyter Notebook
+Python R Studio

3. Watson Studio注⽬機能

Watson Studio 機能 • カタログ機能: Connection登録 • カタログ機能: テーブル登録 •
カタログ機能: ⽂書 • Refinery: データ分析 • Refinery: データ整形 • Cognos Service: BI Tool • 機械学習⽤GUIツール (AutoAI) • SPSS modeler機能 • R Studio機能 • Jupyter Notebook機能 • 深層学習⽤GUIツール (Neural Network Designer) • 深層学習⽤GUIツール (Experiment Builder) • 深層学習⽤の実験環境(HPO)の提供 • Decision Optimizer • Machine Learning: モデル管理機能 • Machine Learning: Webサービス化 • Machine Learning: モデルの再評価、再学習、再配置 • Visual Recognition Model作成ツール • Natural Language Classifier model作成ツール • NeuNetS(学習データ(イメージ)に応じて最適な深層学習モデルを⽣成)

Watson Studio 機能 • カタログ機能: Connection登録 • カタログ機能: テーブル登録 •
カタログ機能: ⽂書 • Refinery: データ分析 • Refinery: データ整形 • Cognos Service: BI Tool • 機械学習⽤GUIツール (AutoAI) • SPSS modeler機能 • R Studio機能 • Jupyter Notebook機能 • 深層学習⽤GUIツール (Neural Network Designer) • 深層学習⽤GUIツール (Experiment Builder) • 深層学習⽤の実験環境(HPO)の提供 • Decision Optimizer • Machine Learning: モデル管理機能 • Machine Learning: Webサービス化 • Machine Learning: モデルの再評価、再学習、再配置 • Visual Recognition Model作成ツール • Natural Language Classifier model作成ツール • NeuNetS(学習データ(イメージ)に応じて最適な深層学習モデルを⽣成) 今回は上記⿊字機能をご紹介します

Refinery (データ分析) Knowledge CatalogではRefineryというツールがあり、Studio上からシームレスに呼出し可能です。 Refineryの持つデータ分析機能を使うと、解析対象のデータの項⽬別の状況を視覚的に確認できます。 Knowledge Catalog

Refinery (データ精製=データ整形) Refineryはデータ整形機能を持っています。下記のような処理をプログラミングなしに実現可能です。また⼀度実⾏した⼿順を覚えて、同じ処理を⾃動で再実⾏することもできます(スケジュール機能)。 Knowledge Catalog 四則計算属性変換フィルター
関数計算除去リネームソート(昇順) ソート(降順) 表示マスキングテキスト処理欠損値へ変換重複行除去空白行除去欠損値の置換部分文字列置換日時データ抽出集約条件置換ジョインサンプル抽出列分割連結ストップワード除去形態素解析

機械学習⽤GUIツール (AutoAI) • 機械学習モデルに関してはAutoAIという機能があり、機械学習に詳しくないユーザーもCSVファイルの準備とマウス操作で簡単にモデルを作ることが可能です。

Jupyter Notebook機能 Jupyter Notebookの実⾏環境をクラウド上に持たせることができます。サポートしている⾔語はPython 3.6とR、及びScalaです。 Python 3.6の場合、次のライブラリは事前導⼊済みですぐに使える状態です。 Tensorflow、Keras、Caffe、scikit-learn、Spark Mlib、XGBoost、Numpy、Pandas、
matplotlib等。事前導⼊されていないライブラリもpipコマンドで導⼊可能なものであれば、追加導⼊して利⽤可能となります。

Decision Optimizer 従来 CPLEXという製品名で提供されていた最適化ソリューションもDecision Optimizer という名前でWatson Studioから利⽤可能になりました。「数独」を解いた例「巡回セールスマン問題」を解いた例 https://qiita.com/makaishi2/items/78570f9283c0bc6c7e6c
https://qiita.com/makaishi2/items/d1cc9a3f49f640a3b649

4. AutoAI

AutoAIとは AutoAIは従来型の機械学習モデルを対象として、前処理、モデル選定、パラメータチューニングなど含めたモデル最適化を⾃動的に⾏います。

AutoAIの⾃動学習データ前処理効率のいいモデル作成に必須の処理である、⽋損値の補間、データのエンコードなどを、最適な形で⾃動的に⾏います。モデル選定モデル選定に関しては、少ないデータで簡易的なモデルを作成し、有⼒な候補のモデルを絞り込む⽅式を採⽤しています。この⽅法により、少ない処理時間で効率よく精度の⾼いモデルを選定することが可能です。候補となるモデル数は分類型: 30種類
回帰型: 44種類です。特徴量最適化 AutoAIでは、強化学習の仕組みを利⽤して、しらみつぶしではない効率のいい⽅法により、精度の最適化をするための特徴量チューニングを⾏います。ハイパーパラメータ最適化モデルの精度に影響のある、ハイパーパラメータの最適化についても、計算資源をあまり使わない効率のいい⽅法で⾏います。参照: https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/autoai-overview.html?audience=wdp

AutoAIの⾃動学習 AutoAIは、①⼊⼒となるCSVファイルと②⽬的変数だけ指定すると、あとはすべて⾃動的に最適な機械学習モデルを⽣成します。 ① ② ③

AutoAIの⾃動学習 AutoAIの処理は「パイプライン」という形で、左から右に流れていきます。現在、どの処理が⾏われているかは、Web画⾯で確認可能です。データ前処理モデル選定パラメータ最適化特徴量最適化

AutoAIの⾃動学習最新版では、次のような画⾯で、パイプライン処理の状況を表⽰することも可能になりました。

AutoAIの⾃動学習⾃動的に作られた8つのモデルは、事前設定した評価項⽬により順位付けされて表⽰されます。

AutoAIの⾃動学習「Pipneline comparison」のタブをクリックすると、評価基準ごとの順位を視覚的に確認可能です。

AutoAIの⾃動学習個別の⾏をクリックすると、各モデルの詳細情報が表⽰されます。 ①ROCカーブというモデルの精度を評価するために利⽤されるグラフや、②どのような特徴量最適化を⾏ったか、あるいは、③特徴量ごとの寄与度などが表⽰可能です。 ② ③ ①

(参考) AutoAIでサポートしているモデル(回帰) 回帰型モデルでは、次の44種類のモデルをサポートしています。 AdaBoost Regression Elastic Net with Cross- Validation
Nearest Neighbor Analysis (KNN) Lasso Lars with Cross- Validation MLP Regression Orthogonal Matching Pursuit with Cross- Validation Random Forest Regression Theil-Sen Regression ARD Regression Elastic Net Kernel Ridge Lasso Lars MultiTask Elastic Net CV Orthogonal Matching Pursuit RANSAC Regression XGBoost Regression Bayesian Ridge Regression Gaussian Process Lars with Cross- Validation Lasso Lars IC MultiTask Elastic Net Passive- Aggressive Regression Ridge with Cross- Validation CCA Gaussian Process Regression Lars LGBM Regression Multi Task Lasso CV PLS Canonical Ridge Decision Tree Regression Gradient Boosting Regression Lasso with Cross- Validation Linear Regression Multi Task Lasso PLS Regression SGD Regression Extra Trees Regression Huber Regression Lasso Linear Support Vector Regression Nu SVR Radius Neighbors Regression Support Vector Regression

(参考) AutoAIでサポートしているモデル(分類) 分類型モデルでは、次の30種類のモデルをサポートしています。 AdaBoost Classifier Gaussian Naïve Bayes Classifier Label
Spreading Logistic Regression Passive Aggressive Classifier Ridge Classifier with Cross- Validation Bernoulli Naïve Bayes Classifier Gaussian Process Classifier LGBM Classifier MLP Classifier Perceptron Ridge Classifier Calibrated Classifier with Cross-Validation Gradient Boosted Tree Classifier Linear Discriminant Analysis Multinomial Naïve Bayes Classifier Quadratic Discriminant Analysis SGD Classifier Decision Tree Classifier Nearest Neighbor Analysis (KNN) Classifier Linear Support Vector Classifier Nearest Centroid Radius Neighbors Classifier Support Vector Classifier Extra Trees Classifier Label Propagation Logistic Regression with Cross-Validation Nu Support Vector Classifier Random Forest Classifier XGBoost Classifier

5. Auto AI 課題DEMO

4. Auto AI 課題DEMO 1. データ準備 2. Watson Studio のセットアップ
3. Watson Studio の起動 4. Watson Studio Projectの作成 5. Machine Learningサービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

4. Auto AI 課題Demo 1. データ準備 2. Watson Studio のセットアップ
3. Watson Studio の起動 4. Watson Studio Projectの作成 5. Machine Learningサービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

1. データ準備架空の電話会社の顧客データ customer_churn.csv を以下からダウンロードし、⾃分のPCに保存します︓ https://ibm.box.com/v/dojo2020-customer-churn-data 右上のダウンロードボタンをクリックして保存します。

1. データ準備架空の電話会社の顧客データ customer_churn.csv このファイルには顧客の属性と契約を解約したかしないか(CHURN)のデータがあります。このデータからCHURNを予測するモデルを作ります。

3. Watson Studio の起動 4. Watson Studio Projectの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト

54 2. Watson Studioのセットアップ • IBM Cloud ログインアカウントをすでにお持ちの⽅は、 IBMidを⼊⼒してこちらからログインしてください
https://cloud.ibm.com/loginにアクセスしてログインします。 • IBM Cloud ライトアカウント作成アカウントをお持ちでない⽅は、ご登録をお願いします

1. 「カタログ」をクリック 55 2. Watson Studioのセットアップ 55

２.左側のメニューから「サービス」→カテゴリ「AI」をクリックし、 Watson Studio をクリック 2. Watson Studioのセットアップ

3. リージョンの選択は「ダラス」を選択。プランは「ライト」を確認して、右側の「作成」をクリック 2. Watson Studioのセットアップ

4. 以下の画⾯が表⽰されたら作成完了です! 2. Watson Studioのセットアップバッジプログラム申請キャプチャー画⾯

4. Auto AI 課題Demo 1. Watson Studio のセットアップ 2. Watson
Studio の起動 3. Watson Studio Projectの作成 4. サービスの作成と追加 5. Auto AI モデル作成 6. Auto AI Deploy & テスト

60 1. ダッシュボードを表⽰ (左上のIBM Cloudロゴをクリック) 2. リソースの要約「Services」 →「Services」からWatson Studioのサービスを選択
3. Watson Studioの起動もし右側にこのような画⾯がでてきたら、「全詳細の表⽰」をクリックする

61 3. Get Startedを選択して起動 3. Watson Studioの起動

63 1. [プロジェクトの作成]をクリックします。 2. [空のプロジェクトを作成]をクリックします。 4. Projectの作成

64 3. 名前に任意のプロジェクト名を⼊れます。 (Tutorialでなるべく作成してください（違う名前でもOKです）) 4. 「ストレージの定義」が表⽰されてない場合は、下にスクロールして、「ストレージの定義」を表⽰させます(ブラウザー表⽰が横⻑の場合は右側に表⽰されています)。 4.
プロジェクトの作成

5A. Object Storage未作成の場合: 5A-1. ストレージの定義の①ストレージ・サービスの選択から「追加」をクリックします。 4.プロジェクトの作成

66 5A-2. Cloud Object Storageの画⾯が表⽰されるので下にスクロールします。 5A-3. Liteが選択されていることを確認して[Create]をクリックします。 5A-4. Confirm Creationのダイアログはそのまま[Confirm]をクリックします。
下にスクロール 4.プロジェクトの作成

67 5A-5 新規プロジェクトの画⾯になるので、ストレージの定義の②最新表⽰をクリックします。 5A-6 ストレージが表⽰された後、[作成]をクリックします。 4.プロジェクトの作成

68 5B. Object Storage作成済の場合: 5B-1 [作成]をクリックただしObject Storageを複数作成している場合は、使⽤したいObject Storageを選択後に[作成]をクリック 4.プロジェクトの作成

69 6. プロジェクトの画⾯が表⽰されます 4.プロジェクトの作成

5. サービスの作成と追加 71 1. [設定]をクリックします。 2.関連サービスの[サービスの追加]をクリックして [Watson]を選択

3. Machine Learningの[Add]をクリック 4A: [New]のタブが選択された画⾯が表⽰された場合 1. スクロールしてPLANでLiteが選択されていることを確認して⼀番下の[Create]をクリック。 2.
Confirmの画⾯でRegionがDallasになっていることを確認して [Confirm]をクリック 5. サービスの作成と追加 72 スクロールスクロール

5. サービスの作成と追加 73 4B[Existing]のタブが選択された画⾯が表⽰された場合 Existing Service Instance のドロップダウンから、使⽤するMachine Learningのサービスを選択して[Select]をクリック。
[Existing]のタブが選択された画⾯が表⽰されたにもかかわらず、「Existing Service Instance」の下に「 No existing service instances found 」が表⽰された場合は、「CLOUD FOUNDRY ORG」のドロップダウンを開き、値を選択してみてください。。

5. サービスの作成と追加 74 5. [設定] の画⾯に戻ります。 Associated servicesに追加したサービスのインスタンスが追加されていることを確認します。

6. Auto AI モデル作成 76 1. 画⾯の右上にある`プロジェクトに追加`をクリックします。 2. 表⽰されたウィンドウの[AutoAI 実験]をクリックします。

6. Auto AI モデル作成 77 3. 名前 : Churn Analysisを⼊⼒し、
⾃分のWatson Machine Learning サービスインスタンスがセットされているのを確認して、[作成]をクリック

6. Auto AI モデル作成 78 4. 「1. データのダウンロード」でダウンロードしたcustomer_churn.csv をドラッグ＆ドロップしてデータをアップロードします。
customer_churn.csv ドラッグ＆ドロップ

6. Auto AI モデル作成 79 5. 「予測列の選択」から予測したい項⽬をクリックします。CHURNを選択します。 6. 「
実験の実⾏」をクリックして、モデル作成を開始します。

6. Auto AI モデル作成 80 7. 実⾏は複数のステップを経て、8つのモデルを⽣成します。このプロセスには5〜15分かかります(このデータの場合, 時間はデータの量によります)。「
実験完了」が表⽰されるまで待ちます。

6. Auto AI モデル作成 81 8. 下にスクロールすると、作成されたモデルの特性がわかります。⼀番上のモデルが設定された基準で最もよいモデルとなります。⼀番上の⾏をクリックして特性を⾒てみます。評価基準(変更可能)
クリック

6. Auto AI モデル作成 9.モデル評価、混同マトリックス、適合率/再現率(PR)曲線、モデル情報、特徴量の重要度など、さまざまなメトリックを確認できます。確認後、画⾯の左上にある「Churn Analysisに戻る]をクリックします。 82 機能の重要度=特徴量の重要度

6. Auto AI モデル作成 10. ⼀番評価の⾼いモデルを保存します。⼀番上のモデルの⾏にマウスカーソルを合わせると「名前を付けて保存」というボタンが表⽰されるので、それをクリックします。 83

6. Auto AI モデル作成 11. ドロップダウンに表⽰された「モデル」をクリックします。 84

6. Auto AI モデル作成 11.モデル名をChurn Analysis Modelに変更して、「保存」ボタンをクリックします。保存が完了すると右上に以下の右のようなウィンドウが表⽰されるので「
プロジェクトに表⽰」をクリックします。 85 もし、この表⽰が消えてしまった場合は次⾴参照

6. Auto AI モデル作成 11A. 「プロジェクトに表⽰」が消えてしまった場合は、上部ナビゲーションよりプロジェクト名をクリック、資産タブをクリック、下にスクロールして、モデルの下の設定したモデル名をクリック 86

7. Auto AI Deploy & テスト 1. 「 Deployments」タブをクリックします。 88

7. Auto AI Deploy & テスト２. 右にある「デプロイメントの追加」をクリックします。 89

7. Auto AI Deploy & テスト 3. 名前に「 Churn model
deployment」と⼊⼒後、「保存」ボタンをクリックします。 90

7. Auto AI Deploy & テスト 4. 「デプロイメント」タブに⾃動で戻ります。状況が、初期化中から準備完了に変わったら「Churn model
deployment 」をクリックします。 1分待っても変わらない場合はリロードしてみてください。 91

7. Auto AI Deploy & テスト 5. 「概要」タブでデプロイメントの詳細を確認できます。「実装」タブをクリックします。そのタブの下に、スコアリングエンドポイントが表⽰
され、Java、JavaScript、Pythonなどの5つの⾔語のコードスニペットも提供されます。 92

7. Auto AI Deploy & テスト 6. [テスト]タブをクリックします。そのままフォームでデータを⼊れてもできますが、今回はJSON inputアイコンをクリックして、JSONで⼊⼒し
ます。以下の右のJSONデータを⼊⼒エリアにコピぺしします。 93 {"input_data": [{ "fields": [ "ID", "Gender", "Status", "Children", "Est Income", "Car Owner", "Age", "LongDistance", "International", "Local", "Dropped", "Paymethod", "LocalBilltype", "LongDistanceBilltype", "Usage", "RatePlan" ], "values": [[ 6, "M", "M", 2, 29616, "N", 49.42, 29.78, 0, 45.5, 0, "CH", "FreeLocal", "Standard", 75.29, 2 ]] }] } コピー& ペーストする

7. Auto AI Deploy & テスト 6-参考: コピペしたJSONは以下のように項⽬名が"fields"に、その値が "values"に⼊っています。この属性の顧客が解約するかしないか(CHURN) を予測します。(customer_churn.csv
ID=6のデータと同じです) 94

7. Auto AI Deploy & テスト 7. 「予測」ボタンをクリックします。右側に予測結果が表⽰されます。この場合、予測値はFで確率(probability)は0.9999555620264015です。
95 customer_churn.csv ID=6のCHURNの値と⽐べてみましょう。

6. 課題

課題1. http://ibm.biz/dojo20200617doc この資料: 先ほど実施の「 4. Auto AI 課題Demo 」を完了しましょう

バッジプログラム申請課題のご案内今回の参加課題は課題1の Watson Studioの管理画⾯（アカウント名表⽰あり）です。アカウント名表示が途中で省略されていてもOKです。

課題2(オプション) チュートリアル: IBM Watson Studio AutoAI: Modeling for the rest
of us https://www.ibm.com/cloud/garage/dte/tutorial/ibm-watson-studio- autoai-modeling-rest-us のCreate an AutoAI model for regression 部分（それより前のセクションは当講義の内容です) ⽇本語解説へのLink: http://ibm.biz/WatsonStudioTutrialJP 尚、⽇本語解説の画⾯イメージは英語版になります。

課題3(オプション) チュートリアル: IBM Watson Studio AutoAI: Modeling for the rest
of us https://www.ibm.com/cloud/garage/dte/tutorial/ibm-watson-studio- autoai-modeling-rest-us のAccessing a model through a notebook 部分⽇本語解説へのLink: http://ibm.biz/WatsonStudioTutrialJP

参考リンク IBM Watson Studio ラーニング・パス https://www.ibm.com/developerworks/jp/library/introduction-watson- studio/index.html レベル別に101〜401まで4つのチュートリアルがあります。 201は本⽇の内容とほぼ同じですのでスキップ可能です。

7. まとめ • Watson Studioのはデータ分析の全プロセスで⼀貫して使えるツール • AutoAIで簡単に機械学習モデルが作成できる

IBM Code Patterns https://ibm.biz/ibmcodejp 解説 + デモ動画 + ソースコードが揃ったアプリ開発パターン集

開発者向けサイト IBM Developer https://ibm.biz/IBMDevJP 最新情報やスキルアップに役⽴つ6,000を超える技術記事を提供

#CallforCode

2020 Call for Code グローバル・チャレンジ今回のテーマは「気候変動」と「COVID-19」 • IBM Cloudを活⽤したアプリ開発コンテスト •
「⼀般向け*」と「IBMer向け」に開催 4/27 (⽉) ⼀般 COVID19 早期締切 3/22 (⽇) 応募受付開始審査期間 8〜9⽉ 10⽉最優秀賞チーム発表 6/30 (⽕) IBM社員応募受付最終締切 7/31 (⾦) ⼀般応募受付最終締切 * IBM Corporationとその法⼈、それらが所有する⼦会社の51％以上および、 Red Hat Inc.とそのすべての⼦会社は「⼀般向け」Call for Code 2020には参加できませんのでご注意ください。IBM社員は詳しくは社内w3サイトで。 #CallforCode

callforcode.org ⽇本語情報 https://ibm.biz/c4cjapan ⽇本語 English #CallforCode Dojo 番外編マスクずれてるよ︕︖ 今晩19:00-20:30
https://ibm- developer.connpass.com/event/179420/

質問&アンケート⼊⼒はこちら slido.com #dojo617 質問タブで質問⼊⼒⾃分も知りたい質問には「いいね」をプッシュ! 絵⽂字は表⽰されませんスマホまたはPCでアクセスしてぜひ⼊⼒お願いします︕
6/17 Auto AI を使ったらくらく機械学習

免責事項 109 IBM Developer Dojoは開発者の⽅を対象に、IBM Cloudを主とした技術情報をお伝えする⽬的で開催しています。講師や運営スタッフにより、開催毎に最適と判断した内容でお届けしています。現在、ハンズオンを伴う講義はお客様の費⽤負担がない環境と⼿順でご案内しています。講義終了後、不要になりました制作物はお客様ご⾃⾝で削除をお願いいたします。クレジットカードの登録が伴わない場合、費⽤は⼀切発⽣致しませんが、ご登録いただいたお客様はご注意ください。
講師陣はみなさまの利⽤状況を個別に確認することはできません。ご理解とご協⼒をお願いいたします。利⽤したサービスの削除⽅法については講義の中でご案内します。ご不明な点がございましたら、当⽇確認をお願いいたします。講義終了後、 IBM Developer Dojoに関するお問い合わせは「Slack」にお願いします。それ以外のIBM Cloudのお問い合わせにつきましては、弊社サポートセンターまで、次のいづれかの⽅法でお問い合わせください。 IBM Cloudダッシュボードの「サポート」メニューから「Case」を作成し、英語でご記⼊ください IBM Cloudサポートセンター「相談する」ボタンからチャットまたは電話でご連絡ください https://www.ibm.com/jp-ja/cloud/support ご参加ありがとうございました。

初夏のIBM Dojo #6 Auto AI を使ったらくらく機械学習 / IBM Dojo ...

初夏のIBM Dojo #6 Auto AI を使ったらくらく機械学習 / IBM Dojo AutoAI ML 20200617

More Decks by Kyoko Nishito

Other Decks in Technology

Featured

Transcript