Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Auto AI 機械学習分類モデル作成 / AutoAI ML Classification

Auto AI 機械学習分類モデル作成 / AutoAI ML Classification

2021/11/24 九州大学で行った「Auto AI 機械学習分類モデル作成」のハンズオン資料を一般向けに編集したものです。

Ca7e4f1680e175e6462a039923e71fc5?s=128

Kyoko Nishito

November 24, 2021
Tweet

Transcript

  1. "*ϋϯζΦϯ  "VUP"*ػցֶश ෼ྨϞσϧ࡞੒ ੢ށ ژࢠ ,ZPLP/JTIJUP ೔ຊΞΠɾϏʔɾΤϜגࣜձࣾ ςΫϊϩδʔࣄۀ෦ %BUB"*5FDIOJDBM4BMFT

  2. ੢ށ ژࢠ ೔ຊΞΠɾϏʔɾΤϜגࣜձࣾ ςΫϊϩδʔࣄۀ෦ %BUB"*5FDIOJDBM4BMFT github.com/kyokonishito twitter.com/KyokoNishito www.linkedin.com/in/kyokonishito qiita.com/nishikyon speakerdeck.com/kyokonishito

    ೔ຊ*#.ʹͯओʹ*#.ͷࣾ಺γεςϜ։ൃɾอकʹैࣄ͠ɺཁ ݅ఆ͔ٛΒอक·Ͱɺ։ൃऀɾ1.ɾΞʔΩςΫτͱͯ͠೔ຊɺ "1֤ࠃͷੜ࢈؅ཧγεςϜ΍ߪങγεςϜɺ*5ࢿ࢈؅ཧγε ςϜ ౳ɺ෯޿͘ܦݧ͖ͯ͠·ͨ͠ɻͦͷޙ*#.%FWFMPQFS "EWPDBUFͱͯ͠։ൃऀ΁ͷܒ໤׆ಈΛߦ͍ͬͯ·ͨ͠ɻ ݱࡏ͸%BUB"*ͷςΫχΧϧɾηʔϧε΍͍ͬͯ·͢ɻ 8PNFOJO%BUB4DJFODF 5PLZP!*#. ։࠵ ୈ ճ ೔ຊ౷ܭֶձ౷ܭڭҭ৆ ड৆ 2
  3. ຊ೔ͷ໨తͱΰʔϧ ໨త ػցֶशͷ֓ཁΛཧղ͠ɺ8BUTPO4UVEJP͔Β"VUP"*Λ࢖͑Δ Α͏ʹͳΔ ΰʔϧ "VUP"*Λ࢖ͬͯ෼ྨͷػցֶशϞσϧΛ࡞੒Ͱ͖ΔΑ͏ʹͳ Δ 3

  4. ຊ೔ͷઆ໌ॱং  ػցֶशΠϯτϩμΫγϣϯ  8BUTPO4UVEJPͷ͝঺հ  "VUP"*ͷ͝঺հ  "VUP"*ϋϯζΦϯ 

    ·ͱΊ 4
  5. 1. 機械学習イントロダクション 5

  6. ⼈⼯知能(AI)のサブセット(部分集合) ディープ ラーンニング (深層学習) ⼈⼯知能 機械学習 機械学習は⼈⼯知能(AI)のサブセット ディープラーンニングは機械学習のサブセット 6

  7. パターン認識と統計から進化した 機械学習は、 ルールベースのアルゴリズムに従う のではなく、 データから分類と予測を⾏うための モデル構築を⾏うことです。 7

  8. 機械学習 Machine Learning 8 課題: ⼼不全がおこるかどうかを判断する *BMI: 体重kg÷(⾝⻑m*⾝⻑m) 実⾏: モデルは⼼不全の有無

    を予測 学習: 学習し結果予測モデル作成のために データセットを利⽤ ⼼拍数 BMI 年齢 性別 結果 93 25 49 F False 108 24 32 M False 80 31 60 M True 93 27 58 F True ⼊⼒: ⼼拍数, BMI*, 年齢, 性別
  9. 今までのやり⽅ -- Traditional データ ルール if BPM-BMI > 60: result

    = True else: result = False 結果 アルゴリズム 9
  10. 機械学習 Machine Learning データ ルール アルゴリズム(モデル) 結果 (学習済モデル) 学習 (パラメータ内部調整)

    10
  11. 機械学習 Machine Learning データ ルール アルゴリズム(モデル) 結果 (学習済モデル) 学習 (パラメータ内部調整)

    ルール (学習済モデル) 予測したい データ 予測結果 11
  12. 機械学習 教師あり学習 教師なし学習 強化学習 分類 回帰 クラスタ分析 次元削減 報酬 (Reward)

    12
  13. 教師あり学習 機械学習 教師なし学習 強化学習 回帰 Regression 分類 Classification 連続した数値を推定 Watson

    Studioの AutoAI機能で プログラミングなしで モデル作成が可能! 分類クラスを推定 • Decision Tree Regression • Extra Trees Regression • Gradient Boosting Regression • LGBM Regression • Linear Regression • Random Forest Regression • Ridge • XGBoost Regression • Decision Tree Classifier • Extra Trees Classifier • Gradient Boosted Tree Classifier • LGBM Classifier • Logistic Regression • Random Forest Classifier • XGBoost Classifier 13
  14. 2. Watson Studioのご紹介 14

  15. 8BUTPO4UVEJPͷಛ௃ r෼ੳͷશϓϩηεͰҰ؏ͯ͠࢖͑Δπʔϧ r *#.$MPVEͷ4BB4 4PGUXBSFBTB4FSWJDF ͱͯ͠ར༻͕ՄೳͰ͢ɻ データソース カタログ 抽出 加⼯・結合

    テーブル作成 (BIモデル 作成) データ 可視化 機械学習 モデル作成 特徴点 抽出 Tool A Tool B Tool C Watson Studio ガバナンス 再利⽤ 基盤担当 データ エンジニア データサイエンティスト アプリ開発者 データ ガバナンス担当 つなぐ 整える 分析活⽤する チームで協働する 15
  16. つなぐ︓データ提供元の選択 〜収集・蓄積・仮想化〜 IBMのデータベースソリューション 他社のデータベースソリューション 様々なデータベースへのコネクタを 使って企業内のデータを仮想的に 統合活⽤する 16

  17. 整える︓データ準備 (探索・確認・加⼯) の効率化 データの品質や分布を可視化 ⽋損値や外れ値を把握・修正 ユーザー⾃⾝が、様々な データをGUIで簡単に加⼯ • 検索機能をつかって探し出す •

    他のユーザが作成した加⼯デー タ等を共有・再利⽤が出来る ⽬的に合う正しいデータを 探し取り出す データの特徴・分布状況を 簡単に確認 データ加⼯や結合を容易に ① データカタログ ② データプロファイル ③ セルフETL 17
  18. 分析する︓利⽤者のレベル・経験に即したツールの提供 SPSS Modeler AutoAI GUI コーディング 18

  19. 様々な分析ツールを選択可能 従来のデータ分析の世界では、分析者により利⽤するツールが異なり、チームメンバー間でのコラボ レーションが難しいという課題がありました。 Watson Studioでは、データ分析で標準的なツールを⼀通り備えており、どの分析者も⾃分にとって 慣れた環境をクラウド上に持つことで分析を⾏えます。 SPSS Modeler Jupyter Notebook

    +Python R Studio 19
  20. Watson Studio 機能 • カタログ機能: Connection登録 • カタログ機能: テーブル登録 •

    カタログ機能: ⽂書 • Refinery: データ分析 • Refinery: データ整形 • Cognos Service: BI Tool • 機械学習⽤GUIツール (AutoAI) • SPSS modeler機能 • R Studio機能 • Jupyter Notebook機能 • 深層学習⽤GUIツール (Neural Network Designer) • 深層学習⽤GUIツール (Experiment Builder) • 深層学習⽤の実験環境(HPO)の提供 • Decision Optimizer • Machine Learning: モデル管理機能 • Machine Learning: Webサービス化 • Machine Learning: モデルの再評価、再学 習、再配置 • Visual Recognition Model作成ツール • Natural Language Classifier model作成 ツール • NeuNetS(学習データ(イメージ)に応じて最 適な深層学習モデルを⽣成) 20
  21. Watson Studio 機能 • カタログ機能: Connection登録 • カタログ機能: テーブル登録 •

    カタログ機能: ⽂書 • Refinery: データ分析 • Refinery: データ整形 • Cognos Service: BI Tool • 機械学習⽤GUIツール (AutoAI) • SPSS modeler機能 • R Studio機能 • Jupyter Notebook機能 • 深層学習⽤GUIツール (Neural Network Designer) • 深層学習⽤GUIツール (Experiment Builder) • 深層学習⽤の実験環境(HPO)の提供 • Decision Optimizer • Machine Learning: モデル管理機能 • Machine Learning: Webサービス化 • Machine Learning: モデルの再評価、再学 習、再配置 • Visual Recognition Model作成ツール • Natural Language Classifier model作成 ツール • NeuNetS(学習データ(イメージ)に応じて最 適な深層学習モデルを⽣成) 今回はAutoAI︕ 21
  22. "VUP"*ͷ͝঺հ 22

  23. AutoAIとは 23 "VUP.- ʮ"VUPNBUFE.BDIJOF-FBSOJOHʢࣗಈԽ͞ΕͨػցֶशʣʯͷུশͰ͢ɻ ࣗಈԽ͞Εͨػցֶशʢ"VUP.-ʣ͸ɺػցֶशϞσϧʢ.-ϞσϧʣΛߏ ஙͯ͠τϨʔχϯά͢ΔࡍʹσʔλαΠΤϯςΟετ͕ߦΘͳ͚Ε͹ͳΒ ͳ͍खಈλεΫΛࣗಈԽ͢ΔϓϩηεͰ͢ɻ "VUP"* "VUP"*͸8BUTPO 4UVEJP্Ͱ࣮ߦͰ͖Δ*#.͕։ൃͨ͠"VUP

    .-ͷ࢓૊Έ Ͱ͢ɻػցֶशʹৄ͘͠ͳ͍ϢʔβͰ͋ͬͯ΋ɺ$47ϑΝΠϧͱϚ΢εૢ ࡞Ͱ؆୯ʹػցֶशϞσϧΛ࡞Γɺ༧ଌΛ࣮ࢪՄೳͰ͢ɻ
  24. AutoAIとは AutoAIは従来型の機械学習モデルを対象として、前処理、モデル選定、パラメータ チューニングなど含めたモデル最適化を⾃動的に⾏います。 24

  25. AutoAIの⾃動学習 データ前処理 効率のいいモデル作成に必須の処理である、⽋損値の補間、データのエンコードなどを、最適 な形で⾃動的に⾏います。 モデル選定 モデル選定に関しては、少ないデータで簡易的なモデルを作成し、有⼒な候補のモデルを絞り 込む⽅式を採⽤しています。この⽅法により、少ない処理時間で効率よく精度の⾼いモデルを 選定することが可能です。候補となるモデル数は 分類型: 7種類

    回帰型: 8種類です。 特徴量最適化 AutoAIでは、強化学習の仕組みを利⽤して、しらみつぶしではない効率のいい⽅法により、 精度の最適化をするための特徴量チューニングを⾏います。 ハイパーパラメータ最適化 モデルの精度に影響のある、ハイパーパラメータの最適化についても、計算資源をあまり使わ ない効率のいい⽅法で⾏います。 参照: https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/autoai-overview.html?audience=wdp 25
  26. AutoAIの⾃動学習 AutoAIは、①⼊⼒となるCSVファイルと②⽬的変数だけ指定すると、あとはすべて⾃動的に最 適な機械学習モデルを⽣成します。 ① ② ③ 26

  27. AutoAIの⾃動学習 AutoAIの処理は「パイプライン」という形で、左から右に流れていきます。 現在、どの処理が⾏われているかは、Web画⾯で確認可能です。 データ前処理 モデル選定 パラメータ 最適化 特徴量 最適化 27

  28. AutoAIの⾃動学習 最新版では、次のような画⾯で、パイプライン処理の状況を表⽰することも可能になりました。 28

  29. AutoAIの⾃動学習 ⾃動的に作られた8つのモデルは、事前設定した評価項⽬により順位付けされて表⽰されます。 29

  30. AutoAIの⾃動学習 「Pipneline comparison」のタブをクリックすると、評価基準ごとの順位を視覚的に確認可能です。 30

  31. AutoAIの⾃動学習 個別の⾏をクリックすると、各モデルの詳細情報が表⽰されます。 ①ROCカーブというモデルの精度を評価するために利⽤されるグラフや、②どのような特徴量 最適化を⾏ったか、あるいは、③特徴量ごとの寄与度などが表⽰可能です。 ② ③ ① 31

  32. (参考) AutoAIでサポートしているモデル(回帰) 回帰型モデルでは、次の8種類のモデルをサポートしています。 Algorithm Description Decision Tree Regression Maps observations

    about an item (represented in the branches) to conclusions about the item’s target value (represented in the leaves). It supports both continuous and categorical features. Extra Trees Regression An averaging algorithm based on randomized decision trees. Gradient Boosting Regression Produces a regression prediction model in the form of an ensemble of decision trees. It supports both continuous and categorical features. LGBM Regression Gradient boosting framework that uses tree-based learning algorithms. Linear Regression Models the linear relationship between a scalar-dependent variable y and one or more explanatory variables (or independent variables) x. Random Forest Regression Constructs multiple decision trees to produce the mean prediction of each decision tree. It supports both continuous and categorical features. Ridge Ridge regression is similar to Ordinary Least Squares but imposes a penalty on the size of coefficients. XGBoost Regression GBRT is an accurate and effective off-the-shelf procedure that can be used for regression problems. Gradient Tree Boosting models are used in a variety of areas including Web search ranking and ecology. 32
  33. (参考) AutoAIでサポートしているモデル(分類) 分類型モデルでは、次の7種類のモデルをサポートしています。 Algorithm Description Decision Tree Classifier Maps observations

    about an item (represented in branches) to conclusions about the item’s target value (represented in leaves). Supports both binary and multiclass labels, as well as both continuous and categorical features. Extra Trees Classifier An averaging algorithm based on randomized decision trees. Gradient Boosted Tree Classifier Produces a classification prediction model in the form of an ensemble of decision trees. It only supports binary labels, as well as both continuous and categorical features. LGBM Classifier Gradient boosting framework that uses leaf-wise (horizontal) tree-based learning algorithm. Logistic Regression Analyzes a data set in which there are one or more independent variables that determine one of two outcomes. Only binary logistic regression is supported Random Forest Classifier Constructs multiple decision trees to produce the label that is a mode of each decision tree. It supports both binary and multiclass labels, as well as both continuous and categorical features. XGBoost Classifier Accurate sure procedure that can be used for classification problems. XGBoost models are used in a variety of areas including Web search ranking and ecology. 33
  34. 4. Auto AI ハンズオン ػցֶश ෼ྨϞσϧ࡞੒ 34

  35. 4. Auto AI ハンズオン 1. データ準備 2. Watson Studio のセットアップ

    3. Watson Studio の起動 4. Watson Studio プロジェクトの作成 5. Machine Learningサービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト 35
  36. 36 ຊ೔࢖༻͢Δֶशσʔλ ػցֶशͷαϯϓϧʹΑ͘࢖ΘΕΔ ΞΠϦεσʔληοτΛ࢖༻͠·͢ɻ ௨ৗ͸σʔλΛ࢖͑ΔΑ͏ʹ͢ΔσʔλΫϨϯδϯά࡞ۀ͕ඞཁͰ͕͢ɺ͜ͷσʔλ͸ΫϨϯδϯάෆཁͰ͢ʣ छྨͷ͋΍Ί *SJTΞΠϦε ͷ਺஋σʔλ • 4&1"--&/(5)͕͘ͷ௕͞

    DN • 4&1"-8*%5)͕͘ͷ෯ DN • 1&5"--&/(5)ՖͼΒͷ௕͞ DN • 1&5"-8*%5)ՖͼΒͷ෯ DN • $-"44*SJTTFUPTB ητφ  *SJTWFSTJDPMPVS όʔγΫϧ  *SJTWJSHJOJDB όʔδχΧ
  37. 37 ༧ଌ͢Δ಺༰ ͕͘ͷ௕͞ɺ͕͘ͷ෯ɺՖͼΒͷ௕͞ɺՖͼΒͷ෯͔Β Ͳͷ͋΍Ίͷछྨ͔Λ༧ଌ • 4&1"--&/(5)͕͘ͷ௕͞ DN • 4&1"-8*%5)͕͘ͷ෯ DN

    • 1&5"--&/(5)ՖͼΒͷ௕͞ DN • 1&5"-8*%5)ՖͼΒͷ෯ DN • $-"44 *SJTTFUPTB ητφ  *SJTWFSTJDPMPVS όʔγΫϧ  *SJTWJSHJOJDB όʔδχΧ (あやめの種類)
  38. ࢖༻σʔλ ͋Β͔͡Ί"VUP"*Ͱ࢖͏σʔλͱ ಈ࡞ςετʹ࢖༻͢ΔσʔλΛ෼͚ͯ͋Γ·͢ オリジナル 150レコード または Iris_test.json テスト⽤ 10レコード 動作テストに使います

    AutoAI⽤ 140レコード 38
  39. ハンズオン全体の流れ プロジェクト IBM Watson Studio (IBM Cloud Pak for Data)

    iris.csv トレーニング⽤データ Irisモデル 機械学習 (AutoAI) iris_test.csv 新たなデータ Webサービス モデルをプロモートして Webサービスとしてデプロイ 予測結果 デプロイメント・スペース Machine Learning サービス 39
  40. "VUP"*ϋϯζΦϯ 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio

    の起動 4. Watson Studio プロジェクトの作成 5. Machine Learningサービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト 40
  41. 1. データ準備 アイリスデータセット 学習⽤データ iris.csv を以下からダウンロードし、⾃分のPCに保存します︓ https://ibm.box.com/v/20211124iris 右上のダウンロードボタンをクリックして保存します。 • SEPAL

    LENGTH: がくの⻑さ cm • SEPAL WIDTH : がくの幅 cm • PETAL LENGTH: 花びらの⻑さ cm • PETAL WIDTH : 花びらの幅 cm • CLASS: Iris-setosa(セトナ), Iris-versicolour(バーシクル), Iris-virginica (バージニカ)41
  42. 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動

    4. Watson Studio Projectの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト "VUP"*ϋϯζΦϯ 42
  43. 43 8BUTPO4UVEJPͷηοτΞοϓ • IBM Cloud ログイン https://cloud.ibm.com/loginにアクセスしてログインします。

  44. 1. 「カタログ」をクリック 44 8BUTPO4UVEJPͷηοτΞοϓ 44

  45. ̎ݕࡧϑΟʔϧυʹ8BUTPO 4UVEJPͱೖΕɺදࣔ͞ΕͨϦετͷ ʮ8BUTPO 4UVEJPʯΛબ୒ɻ 8BUTPO4UVEJPͷηοτΞοϓ 45

  46. ϩέʔγϣϯͷબ୒͸ʮμϥε VTTPVUI ʯ Λબ୒ɻ ϓϥϯ͸ʮϥΠτʯΛ֬ೝ͠ɺӈଆͷʮҎԼͷ͝࢖༻৚݅ΛಡΈɺಉҙ͠ ·͢ʯʹνΣοΫΛೖΕɺʮ࡞੒ʯΛΫϦοΫɻ 8BUTPO4UVEJPͷηοτΞοϓ 46 ౦ژ΋બ୒Ͱ͖·͕͢ɺ ೔໨ʹߦ͏ϕʔλͷ࣌ܥ

    ྻ༧ଌ͕ݱࡏ ࣮૷͞Εͯͳ͍ͨΊɺμϥ εΛબ୒͠·͢ɻ
  47. ҎԼͷը໘͕දࣔ͞ΕͨΒ࡞੒׬ྃͰ͢ 8BUTPO4UVEJPͷηοτΞοϓ 47

  48. 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動

    4. Watson Studio プロジェクトの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト "VUP"*ϋϯζΦϯ
  49. 49 ϦιʔεϦετΛදࣔ *#.$MPVEϩΰͷࠨԣͷϋϯόʔΨɾϝχϡʔΛΫϦοΫ ϦιʔεɾϦετΛબ୒ 8BUTPO4UVEJPͷىಈ

  50. 50  αʔϏε͓Αͼιϑτ΢ΣΞͷ8BUTPO4UVEJPYYΛબ୒ YY͸ਓʹΑͬͯҧ ͍·͢ 8BUTPO4UVEJPͷىಈ

  51. 51 -BVODIJO*#.$MPVE1BLGPS%BUBΛબ୒ͯ͠ىಈ ৽͍͠ϒϥ΢β͕։͖·͢ 8BUTPO4UVEJPͷىಈ

  52. 52 ʮ৘ใΛೖྗͯ͠ଓߦ͍ͯͩ͘͠͞ʯ͕දࣔ͞Εͨ৔߹͸ɺద౰ͳి࿩ ൪߸ΛೖΕͯɺʮଓߦʯΛΫϦοΫ͍ͯͩ͘͠͞ɻ ʮ$MPVE1BLGPS%BUB΁Α͏ͦ͜ɻʯͷ΢Πϯυ΢͕දࣔ͞Εͨ৔߹͸9 ΛΫϦοΫͯ͠ফ͠·͢ɻ 8BUTPO4UVEJPͷىಈ

  53. 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動

    4. Watson Studio プロジェクトの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト "VUP"*ϋϯζΦϯ 53
  54. ハンズオン全体の流れ プロジェクト IBM Watson Studio (IBM Cloud Pak for Data)

    iris.csv トレーニング⽤データ Irisモデル 機械学習 (AutoAI) iris_test.csv 新たなデータ Webサービス モデルをプロモートして Webサービスとしてデプロイ 予測結果 デプロイメント・スペース Machine Learning サービス 54
  55. 55 <ϓϩδΣΫτͷ࡞੒>ΛΫϦοΫ͠·͢ɻ <ۭͷϓϩδΣΫτΛ࡞੒>ΛΫϦοΫ͠·͢ɻ ϓϩδΣΫτͷ࡞੒

  56. 56 ໊લʹ೚ҙͷϓϩδΣΫτ໊ΛೖΕ·͢ɻ ͜͜Ͱ͸"VUP"*8PSLTIPQͰ࡞੒͠·͢ ʮετϨʔδͷఆٛʯʹʮ௥Ճʯͱදࣔ͞Ε͍ͯΔ৔߹͸"ʹਐΈ·͢ɻ ͦΕҎ֎͸#ʹਐΈ·͢ɻ ϓϩδΣΫτͷ࡞੒

  57. "0CKFDU4UPSBHFະ࡞੒ͷ৔߹ " ετϨʔδͷఆٛ ͷᶃετϨʔδɾαʔϏεͷબ୒͔Βʮ௥ՃʯΛΫ ϦοΫ͠·͢ɻ ϓϩδΣΫτͷ࡞੒

  58. 58 "ϥΠτ͕બ୒͞Ε͍ͯΔ͜ͱΛ֬ೝͯ͠<࡞੒>ΛΫϦοΫ͠·͢ɻ ϓϩδΣΫτͷ࡞੒

  59. 59 " ৽نϓϩδΣΫτͷը໘ʹͳΔͷͰɺετϨʔδͷఆٛ ͷᶄ࠷৽දࣔ ΛΫϦοΫ͠·͢ɻ " ετϨʔδ͕දࣔ͞Εͨޙɺ<࡞੒>ΛΫϦοΫ͠·͢ɻ ʹਐΜͰ͍ͩ͘͞ ϓϩδΣΫτͷ࡞੒

  60. 60 #0CKFDU4UPSBHF࡞੒ࡁͷ৔߹ # <࡞੒>ΛΫϦοΫ ͨͩ͠0CKFDU4UPSBHFΛෳ਺࡞੒͍ͯ͠Δ৔߹͸ɺ࢖༻͍ͨ͠0CKFDU 4UPSBHFΛબ୒ޙʹ<࡞੒>ΛΫϦοΫ ϓϩδΣΫτͷ࡞੒

  61. 61 ϓϩδΣΫτͷը໘͕දࣔ͞Ε·͢ ϓϩδΣΫτͷ࡞੒

  62. 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動

    4. Watson Studio プロジェクトの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト "VUP"*ϋϯζΦϯ
  63. ハンズオン全体の流れ プロジェクト IBM Watson Studio (IBM Cloud Pak for Data)

    iris.csv トレーニング⽤データ Irisモデル 機械学習 (AutoAI) iris_test.csv 新たなデータ Webサービス モデルをプロモートして Webサービスとしてデプロイ 予測結果 デプロイメント・スペース Machine Learning サービス
  64. 64 <ઃఆ>ΛΫϦοΫ͠·͢ɻ ԼʹεΫϩʔϧͯ͠ɺؔ࿈αʔϏεͷ<αʔϏεͷ௥Ճ>ΛΫϦοΫͯ͠ <8BUTPO>Λબ୒ αʔϏεͷ࡞੒ͱ௥Ճ

  65. ʮ৽نαʔϏε ʯΛΫϦοΫ .BDIJOF-FBSOJOHΛબ୒ɺϓϥϯʮϥΠτʯʹνΣοΫ͕͞Ε͍ͯΔ͜ ͱΛ֬ೝ͠ɺʮ࡞੒ʯΛΫϦοΫ .BDIJOF-FBSOJOHࠨଆʹνΣοΫΛೖΕɺӈ্ͷ<αʔϏεͷؔ࿈෇͚> ΛΫϦοΫ͠·͢ɻ 65 αʔϏεͷ࡞੒ͱ௥Ճ

  66. 66 ӈ্ͷYΛΫϦοΫ<ઃఆ> ͷը໘ʹ໭Γ·͢ɻ ؔ࿈αʔϏεʹ௥Ճͨ͠αʔϏεͷΠϯελϯε͕௥Ճ͞Ε͍ͯΔ͜ͱΛ֬ ೝ͠·͢ɻ ˞ΫϦοΫ͠ ͯด͡·͢ ˞໊લ͕ҟͳΔ৔߹͕͋Γ·͕͢ɺ໰୊͋Γ·ͤΜ αʔϏεͷ࡞੒ͱ௥Ճ

  67. 1. データ準備 2. Watson Studio のセットアップ 3. Watson Studio の起動

    4. Watson Studio プロジェクトの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト "VUP"*ϋϯζΦϯ
  68. ハンズオン全体の流れ プロジェクト IBM Watson Studio (IBM Cloud Pak for Data)

    iris.csv トレーニング⽤データ Irisモデル 機械学習 (AutoAI) iris_test.csv 新たなデータ Webサービス モデルをプロモートして Webサービスとしてデプロイ 予測結果 デプロイメント・スペース Machine Learning サービス
  69. "VUP"*Ϟσϧ࡞੒ 69 ը໘ͷӈ্ʹ͋ΔʮϓϩδΣΫτʹ௥Ճ ʯΛΫϦοΫ͠·͢ɻ දࣔ͞Εͨ΢Οϯυ΢ͷʮ"VUP"* ΤΫεϖϦϝϯτʯΛΫϦοΫ͠·͢ɻ

  70. "VUP"*Ϟσϧ࡞੒ 70 ໊લ *SJTΛೖྗ͠ɺ ࣗ෼ͷ8BUTPO.BDIJOF-FBSOJOHαʔϏεΠϯελϯε͕ηοτ͞Εͯ ͍ΔͷΛ֬ೝͯ͠ɺ<࡞੒>ΛΫϦοΫ ʮෳ਺ͷιʔεΛαϙʔτʯ ͱ͍͏΢Οϯυ΢͕දࣔ͞Ε ͨΒʮྃղʯΛΫϦοΫͯ͠ ͍ͩ͘͞ɻ

    ˞໊લ͕ҟͳΔ৔߹͕͋Γ·͕͢ɺ ໰୊͋Γ·ͤΜ
  71. 71 ʮσʔλͷμ΢ϯϩʔυʯͰμ΢ϯϩʔυͨ͠JSJTDTW Λυϥοάˍυϩοϓͯ͠ σʔλΛΞοϓϩʔυ͠·͢ɻ iris.csv ドラッグ&ドロップ "VUP"*Ϟσϧ࡞੒

  72. 72 ʮ࣌ܥྻ༧ଌΛ࡞੒͠·͔͢ ʯ͸ʮ͍͍͑ʯΛΫϦοΫ͠·͢ɻ ϩέʔγϣϯ͕μϥεͷ৔߹ͷΈදࣔ͞Ε·͢ "VUP"*Ϟσϧ࡞੒

  73. 73 ʮ༧ଌྻͷબ୒ʯ͔Β༧ଌ͍߲ͨ͠໨ΛΫϦοΫ͠·͢ɻ$-"44Λબ୒͠ ·͢ɻ  ʮ ΤΫεϖϦϝϯτͷ࣮ߦʯΛΫϦοΫͯ͠ɺϞσϧ࡞੒Λ։࢝͠·͢ɻ "VUP"*Ϟσϧ࡞੒

  74. 74  ࣮ߦ͸ෳ਺ͷεςοϓΛܦͯɺͭͷϞσϧΛੜ੒͠·͢ɻ͜ͷϓϩηε ʹ͸ʙ෼͔͔Γ·͢ ͜ͷσʔλͷ৔߹ ࣌ؒ͸σʔλͷྔʹΑΓ·͢ ɻ ʮΤΫεϖϦϝϯτ׬ྃ ʯ͕දࣔ͞ΕΔ·Ͱ଴ͪ·͢ɻ "VUP"*Ϟσϧ࡞੒

  75. 75  ԼʹεΫϩʔϧ͢Δͱɺ࡞੒͞ΕͨϞσϧͷಛੑ͕Θ͔Γ·͢ɻҰ൪্ͷ Ϟσϧ͕ઃఆ͞Εͨج४Ͱ࠷΋Α͍ϞσϧͱͳΓ·͢ɻ Ұ൪্ͷߦΛΫϦοΫͯ͠ಛੑΛݟͯΈ·͢ɻ 評価基準(変更可能) クリック "VUP"*Ϟσϧ࡞੒

  76. ϞσϧධՁɺద߹཰࠶ݱ཰ 13 ۂઢɺϞσϧ৘ใɺಛ௃ྔͷαϚϦʔͳ Ͳɺ͞·͟·ͳϝτϦοΫΛ֬ೝͰ͖·͢ɻ ֬ೝޙɺը໘ͷࠨ্ʹ͋Δ<9>ΛΫϦοΫͯ͠લͷը໘ʹ໭Γ·͢ɻ 76 "VUP"*Ϟσϧ࡞੒

  77. 11. ⼀番評価の⾼いモデルを保存します。 ⼀番上のモデルの⾏にマウスカーソルを合わせると「名前を付けて保存」 というボタンが表⽰されるので、それをクリックします。 77 "VUP"*Ϟσϧ࡞੒

  78.  ʮϞσϧʯ͕બ୒͞Ε͍ͯΔ͜ͱΛ֬ೝ͠ɺ Ϟσϧͷ໊લΛʰ*SJTNPEFMʱʹมߋͯ͠ɺ<࡞੒>ΛΫϦοΫ͠·͢ɻ 78 "VUP"*Ϟσϧ࡞੒

  79.  อଘ͕׬ྃ͢Δͱӈ্ʹҎԼͷΑ͏ͳ΢Οϯυ΢͕දࣔ͞ΕΔͷͰ ʮ ϓϩδΣΫτʹදࣔ ʯΛΫϦοΫ͠·͢ɻ 79 ΋͠ɺ͜ͷද͕ࣔফ͑ͯ͠·ͬͨ৔߹͸࣍ทࢀর "VUP"*Ϟσϧ࡞੒

  80. " ʮϓϩδΣΫτʹදࣔ ʯ͕ফ͑ͯ͠·ͬͨ৔߹͸ɺ্෦φϏήʔ γϣϯΑΓϓϩδΣΫτ໊ΛΫϦοΫɺࢿ࢈λϒΛΫϦοΫɺԼʹε Ϋϩʔϧͯ͠ɺϞσϧͷԼͷઃఆͨ͠Ϟσϧ໊ΛΫϦοΫ 80 "VUP"*Ϟσϧ࡞੒

  81. 4. Auto AI 課題Demo 1. データ準備 2. Watson Studio のセットアップ

    3. Watson Studio の起動 4. Watson Studio Projectの作成 5. サービスの作成と追加 6. Auto AI モデル作成 7. Auto AI Deploy & テスト
  82. ハンズオン全体の流れ プロジェクト IBM Watson Studio (IBM Cloud Pak for Data)

    iris.csv トレーニング⽤データ Irisモデル 機械学習 (AutoAI) iris_test.csv 新たなデータ Webサービス モデルをプロモートして Webサービスとしてデプロイ 予測結果 デプロイメント・スペース Machine Learning サービス
  83. "VUP"*%FQMPZςετ <σϓϩΠϝϯτɾεϖʔεʹϓϩϞʔτ>ΛΫϦοΫ දࣔ͞ΕͨʮεϖʔεͷϓϩϞʔτʯϖʔδͷλʔήοτɾεϖʔε͔Β ʮ৽نσϓϩΠϝϯτɾεϖʔεͷ࡞੒ʯΛΫϦοΫ 83 「Space1」など

  84. "VUP"*%FQMPZςετ දࣔ͞ΕͨʮσϓϩΠϝϯτɾεϖʔεͷ࡞੒ʯϖʔδͷʮ໊લʯʹ ʮ4QBDFʯΛೖྗͯ͠࡞੒ΛΫϦοΫɻ ʮεϖʔεͷ४උ͕׬ྃ͠·ͨ͠ʯ͕දࣔ͞ΕͨΒɺʮด͡ΔʯΛΫϦοΫɻ 84

  85. 4. 「プロモート」をクリック。 プロモートが完了すると、プロジェクトの資産画⾯が表⽰されます。右上に 表⽰されたメッセージ内の「デプロイメント・スペース」をクリックしてく ださい。 85 "VUP"*%FQMPZςετ ΋͠ɺ͜ͷද͕ࣔফ͑ͯ͠·ͬͨ৔߹ ͸࣍ทࢀর

  86. 4A. もし、メッセージを閉じてしまった場合は以下の⽅法でデプロイメントス ペースを開きます。 左上の「ナビゲーションメニュー」を開き、「デプロイメント・スペース」 の下の「Space1」 をクリックしてください。 86 "VUP"*%FQMPZςετ

  87. 5. 以下のウィンドウが表⽰された場合は[X]をクリックして閉じてください。 87 "VUP"*%FQMPZςετ [概要]が表⽰された場合は[管理]タブをクリックしてください。 (メッセージから開いた場合は資産、ナビゲーションメニューから開いた場合 は概要が表⽰されています)

  88. ػցֶशαʔϏεͷ<Πϯελϯεͷؔ࿈෇͚>ΛΫϦοΫ͠ɺʮػցֶ शαʔϏεͷબ୒ʯͷυϩοϓμ΢ϯϦετ͔Βɺ දࣔ͞Εͨ.BDIJOF-FBOJOHYYΛΫϦοΫ͠·͢ɻ YY͸ਓʹΑͬͯҧ͍·͢ 88 "VUP"*%FQMPZςετ

  89. 7.「資産」タブをクリックします。 Iris Modelの⾏にマウスポインタを重ねると、右側に「デプロイ」アイコ ンが表⽰れますので、クリックしてデプロイ作業を始めます。 89 "VUP"*%FQMPZςετ

  90. ΦϯϥΠϯΛબ୒͠ɺ໊લʹʰ*SJTʱΛೖྗɺӈԼͷ࡞੒ΛΫϦοΫ͠·͢ 90 όονΛ࢖͑͹$47σʔλͰςετ͕Ͱ͖·͢ɻ 1Λࢀর "VUP"*%FQMPZςετ

  91. Ϟσϧ໊ *SJT.PEFMΛΫϦοΫ 91 "VUP"*%FQMPZςετ

  92. ঢ়گ͕ʮσϓϩΠࡁΈʯʹͳͬͨΒɺ*SJTΛΫϦοΫ 92 "VUP"*%FQMPZςετ

  93. 11. テストをクリックします。データ⼊⼒画⾯が表⽰されます。 93 "VUP"*%FQMPZςετ

  94. ʮೖྗσʔλΛೖྗ͍ͯͩ͘͠͞ʯͷԼͷϑΥʔϜʹςετσʔλ JSJT@UFTUDTWͷҰߦ໨Λೖྗ͠ɺʮϦετʹ௥ՃʯΛΫϦοΫɻ JSJT@UFTUDTW͸ͪ͜ΒIUUQTJCNCPYDPNWJSJTUFTU 94 "VUP"*%FQMPZςετ

  95.  ʮ༧ଌʯϘλϯΛΫϦοΫ͠·͢ɻ͠͹Β͘͢Δͱӈଆʹ༧ଌ݁Ռ͕ දࣔ͞Ε·͢ɻ͜ͷ৔߹ɺ༧ଌ஋͸*SJTTFUPTBͰ֬཰ QSPCBCJMJUZ ͸ Ͱ͢ɻ ͜ͷ஋͸ਓ ࡞੒ͨ͠Ϟσϧ ʹΑͬͯҟͳΓ·͢ 95

    *SJT@UFTUDTWͷ$-"44ͷ஋ ͱൺ΂ͯΈ·͠ΐ͏ɻ༧ଌ ͸߹͍ͬͯ·͔ͨ͠ ଞͷߦͷ*SJT@UFTUDTWͷ஋Ͱ ΋ࢼͯ͠Έ·͠ΐ͏ɻ "VUP"*%FQMPZςετ
  96. 6. まとめ • AutoAIを使⽤すれば、予測対象を指定する等の 最⼩限の操作で機械学習モデルを⽣成できます

  97. 「7-8 AutoAI Deploy & テスト」の補⾜ https://qiita.com/osonoi/items/54cd435d10985b0bae61 ⼤量のデータを⼀括して予測したい

  98. ͓ർΕ༷Ͱͨ͠ 2" 98

  99. None