Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Watson Studioで機械学習ハンズオン / ML Handson with Watson Studio

Watson Studioで機械学習ハンズオン / ML Handson with Watson Studio

*注: https://speakerdeck.com/kyokonishito/ml-handson-with-watson-studio-2019-06-26 に最新版があります

2019/06/05(水) 10:00 〜 12:00にDeveloper Dojo Shibuyaで開催した「Watson Studio 機械学習入門」の「Watson Studioで機械学習ハンズオン」の資料です。

2019/06/07: ハンズオン時に実際とあっていなかった部分を更新しました。

Kyoko Nishito

June 05, 2019
Tweet

More Decks by Kyoko Nishito

Other Decks in Technology

Transcript

  1. 2 Introduction to Machine Learning and Artificial Intelligence – Watson

    Studio Tutorial, Part 2 https://developer.ibm.com/videos/introduction-to-machine- learning-and-artificial-intelligence-watson-studio-tutorial-part-2/ Introduction to Machine Learning and Artificial Intelligence – Watson Studio Tutorial, Part 2 https://developer.ibm.com/videos/introduction-to-machine- learning-and-artificial-intelligence-watson-studio-tutorial-part-3/ このセッションは IBM Developer https://developer.ibm.com/ の 動画を元に作成しています
  2. 機械学習 Machine Learning 5 5 課題: ⼼不全がおこるかどうかを判断する *BMI: 体重kg÷(⾝⻑m*⾝⻑m) 実⾏:

    モデルは⼼不全の有無 を予測 学習: 学習し結果予測モデル作成のために データセットを利⽤ ⼼拍数 BMI 年齢 性別 結果 93 25 49 F False 108 24 32 M False 80 31 60 M True 93 27 58 F True ⼊⼒: ⼼拍数, BMI*, 年齢, 性別
  3. Watson Studio 7 Model Lifecycle Management マシーンラーニング⽤ランタイム ディープラーニング⽤ランタイム データ分析⽀援ツール Cloud

    Infrastructure as a Service ⼀つに統合された環境で、AI モデルの構築・トレーニング・ デプロイ・管理を⾏い、データを準備して分析できるツール です。 • IBMクラウドで利⽤可能(Localの 製品もあり) • オープンソースツールとIBMツー ルのベストな組み合わせ • R, Python, Scala⾔語が使⽤可能 • コーディングなしのビジュアルモ デリングツール • 主要なオープンソースの マシーンラーニング⽤ランタイム・ ディープラーニング⽤ランタイム が使⽤可能
  4. 本⽇のハンズオンは 8 dog cat cat dog Positive ID: Pug Unknown

    Unknown Positive ID: Pug 教師あり学習 教師あり学習で Watson Studioのモデルビルダーを 使⽤して学習モデルを作成します。 コーディングはありません。
  5. 事前準備: データファイルのダウンロード 9 1. ブラウザーで以下にアクセス https://github.com/IBM/predicti ve-model-on-watson- ml/blob/master/data/patientdat aV6.csv 2.

    右上の[ Raw ]ボタンを右ク リックします。 3. Link先を別名で保存.. を選択 し、拡張⼦は必ずcsvに変更し⾃ 分のPCに保存。 ファイル名: patientdataV6.csv
  6. 10 4. ダウンロードしたpatientdataV6.csvから テスト⽤データ100レコードを分離して別ファイル test_patientdataV6.csv に保存。 オリジナル 10800レコード 変更後 10700レコード

    新ファイル 100レコード 動作テストに使います 事前準備: データファイルのダウンロード patientdataV6.csv patientdataV6.csv test_ patientdataV6.csv
  7. 11 オプション: 既に分離済み準備しました patientdataV6.csv(変更後): https://ibm.box.com/v/update-patientdataV6 test_patientdataV6.csv: https://ibm.box.com/v/test-patientdataV6 オリジナル 10800レコード 変更後

    10700レコード 新ファイル 100レコード 動作テストに使います 事前準備: データファイルのダウンロード patientdataV6.csv patientdataV6.csv test_ patientdataV6.csv
  8. 20 3. Machine Learningの[Add]をクリック 4A. [Existing]のタブが選択された画⾯が表⽰された場合 Existing Service Instance のドロップダウンから、使⽤するMachine

    Learningのサービスを選択して[Select]をクリック 。 Machine Learningサービス未作成で初めてWatson Studioを使⽤するAccountの場 合「 WatsonMachineLearning」が⾃動で作成されていますのでそちらを選択して ください。 4. サービスの作成と追加
  9. 6. 機械学習モデルの作成 27 3. [Name]にモデルの名前を記⼊ 4. Machine Learning Service にMachine

    Learningのインスタンスが選択さ れていることを確認 5. Select model type: Model builder 6. Select runtime: Default Spark Scala 2.11 7. Manualを選択 8. [Create]をクリック
  10. 6. 機械学習モデルの作成 31 11. その下は以下のどのタイプの予測を⾏うかの選択です • Binary Classification: ⼆値分類 (2つのクラス分類)

    • Multiclass Classification: 多値分類 (複数のクラス分類) • Regression: 回帰 (数値の予測) 今回は⼼不全になったか、ならなかったか, Y または Nの2値予測なので、 Binary Classificationを選択します。
  11. 6. 機械学習モデルの作成 32 11. その下は全体で使⽤する各データのレコードの割合となります Train 訓練データ Test 検証データ Holdout

    テストデータ(モデル作成には使⽤しない) 変更もできますが、今回はそのままで設定します。
  12. 6. 機械学習モデルの作成 35 *以下がModel Builderで利⽤できるモデルの⼀覧です︓ モデル名 Binary Classification Multiclass Classification

    Regression Logistic Regression ロジスティック回帰 Y Decision Tree Regression 決定⽊ Y Y Y Random Forest Regression ランダムフォレスト Y Y Y Gradient Boosted Tree Regression 勾配ブースティング決定⽊ Y Y Native Bayes 単純ベイズ分類法 Y Linear Regression 線形回帰 Y Isotonic Regression アイソトニック回帰 Y
  13. 8. 機械学習モデルのテスト 51 3. 各値を⼊れて、[Predict]をクリックします。 テストする値はtest_patientdataV6.csvの値をを 使ってみましょう。 データ項⽬ 内容 AVGHEARTBEATSPERMIN

    平均⼼拍数/分 PALPITATIONSPERDAY 動悸の回数/日 CHOLESTEROL コレステロール BMI BMI AGE 年齢 SEX 性別 FAMILYHISTORY 家族に⼼不全があったか SMOKERLAST5YRS 5年以内の喫煙歴 EXERCISEMINPERWEEK 1週間の運動時間(分)
  14. 57