Upgrade to Pro — share decks privately, control downloads, hide ads and more …

2022秋講演③日本アイ・ビー・エム株式会社 牧野 泰江 データ分析プロセス-成功率を上げる型とその向こう側-

JPSPSS
November 04, 2022

2022秋講演③日本アイ・ビー・エム株式会社 牧野 泰江 データ分析プロセス-成功率を上げる型とその向こう側-

2022/11/4に開催されたSPSS 秋のオンラインユーザーイベントの講演
日本アイ・ビー・エム株式会社 牧野 泰江
「講演③データ分析プロセス-成功率を上げる型とその向こう側-」
のスライド資料(公開版)です。

JPSPSS

November 04, 2022
Tweet

More Decks by JPSPSS

Other Decks in Technology

Transcript

  1. アジェンダ 1. 成功率を上げる型 ◦ 『CRISP-DM』って何? ◦ なぜ、いま『CRISP-DM』なのか ◦ CRISP-DMガイド ◦

    CRISP-DMのフェーズとタスク ◦ SPSS Modelerでタスクの管理 ◦ Modeler デモ ◦ プロジェクトレポート 3 2022 IBM SPSS Modeler 秋のオンラインユーザーイベント #spss2022autumn © 2022 IBM Corporation 2. その向こう側 ◦ AI倫理の時代に ◦ 信頼できるモデルを目指す ◦ まとめ データ分析プロセス
  2. 『CRISP-DM』って何? 1990年代後半にDaimlerChrysler、SPSS 、NCR、 OHRAの4社によって開発された業界横断型のデータマイ ニングの標準プロセスモデル CRoss-Industry Standard Process for Data

    Mining 実務者たちが作成 実用的 現実的な経験に根ざす 5 2022 IBM SPSS Modeler 秋のオンラインユーザーイベント #spss2022autumn © 2022 IBM Corporation
  3. CRISP-DMガイド 7 2022 IBM SPSS Modeler 秋のオンラインユーザーイベント #spss2022autumn © 2022

    IBM Corporation CRISP-DM ヘルプの概要 - IBM Documentation • CRISP-DMの概要紹介 • e-Commerceを例に各フェーズとタスクを説明 • サンプルプロジェクト計画を記載
  4. CRISP-DMのフェーズとタスク © 2022 IBM Corporation 2022 IBM SPSS Modeler 秋のオンラインユーザーイベント

    #spss2022autumn 8 ビジネスの理解 データの理解 データの準備 モデリング 評価 展開/共有 ビジネス目標の設定 初期データの収集 データセット モデリング手法の選択 結果の評価 導入の計画 ・背景情報 ・初期データの収集レポート ・データセットの説明 ・モデリング手法 ・データマイニングの結果の評価 ・導入の計画 ・ビジネス目標 データの記述 データの選択 ・モデリングの仮定 ・承認済みのモデル モニタリングとメンテナンスの計画 ・ビジネスの成功基準 ・データ説明レポート ・選択または除外の基準 テスト設計の生成 プロセスの見直し ・モニタリングとメンテナンスの計画 状況の評価 データの調査 データのクリーニング ・テスト設計 ・プロセスの見直し 最終レポートの作成 ・リソースの調査 ・データの調査レポート ・データクリーニングレポート モデルの作成 決定 ・最終レポート ・要件、仮定および制約 データの品質の検証 データの構築 ・パラメータの設定 ・実行可能なアクションのリスト ・最終プレデンテーション ・リスクと予想される事態 ・データ品質レポート ・派生属性 ・モデル ・決定 プロジェクトの見直し ・用語集 ・生成されたレコード ・モデルの説明 ・経験の文書化 ・コストと利益 データの結合 モデルの評価 データマイニングの目標設定 ・結合されたデータ ・モデルの評価 ・データマイニングの目標 データのフォーマット ・改訂されたパラメータの設定 ・データマイニングの成功基準 ・再フォーマット済みのデータ プロジェクト計画の作成 ・プロジェクト計画 ・ツールと手法の初期評価 • 複雑になりがちなプロセスを整理 • 問題点の扱い方の指針を提示 • 重要なポイントの見過ごしを確認 • 各タスクの成果物の記録
  5. SPSS Modelerでタスクを管理 © 2022 IBM Corporation 2022 IBM SPSS Modeler

    秋のオンラインユーザーイベント #spss2022autumn 9 • Word • Excel • PowerPoint • Text etc.. • テーブル • グラフ • モデルナゲット • ストリーム • ノード
  6. Modeler デモ © 2022 IBM Corporation 2022 IBM SPSS Modeler

    秋のオンラインユーザーイベント #spss2022autumn 10 データの準備 評価 展開/共有 ビジネスの理解 モデリング データの理解 成果物 新規作成
  7. AI倫理の時代に 「AI原則実践のためのガバナンス・ガイドライン Ver. 1.1」を取りまとめました (METI/経済産業省) 20220128_1.pdf (meti.go.jp) 13 2022 IBM

    SPSS Modeler 秋のオンラインユーザーイベント #spss2022autumn © 2022 IBM Corporation AI・機械学習 信頼 公平性・説明責任・透明性
  8. 信頼できるモデルを目指す 正確性 安定性 透明性 モデルの精度は利用に耐 える程度か? モデルはデータの変化を 捉えているか? 14 2022

    IBM SPSS Modeler 秋のオンラインユーザーイベント #spss2022autumn © 2022 IBM Corporation 公平性 モデルにバイアスはかかっ ていないか(=データに偏 りはないか)? データの準備 データの理解 評価 モデリング 展開/共有 プロセス・データ・モデル・ 結果を説明できるか? ビジネスの理解 信頼:公平性・説明責任・透明性 モデル:AI・機械学習から生成された計算式 参考:https://www.ibm.com/blogs/research/2020/07/aifactsheets/
  9. まとめ ビジネス目標 ビジネスの 成功基準 データ説明 レポート データセットの 説明 選択または除 外の理由

    データ クリーニング レポート モデルの 説明 モデルの 評価 決定 モニタリングとメ ンテナンスの計 画 データ マイニングの結 果の評価 最終レポート 15 © 2022 IBM Corporation データ調査 レポート データ品質 レポート 2022 IBM SPSS Modeler 秋のオンラインユーザーイベント #spss2022autumn CRISP-DMのタスクで作成したプロジェクト資産を 継承することでデータ分析の成功率が上がり、その プロジェクト資産がAI・機械学習の信頼を支えます。