Upgrade to Pro — share decks privately, control downloads, hide ads and more …

データの可視化と Modeler ロードマップ

JPSPSS
June 08, 2021

データの可視化と Modeler ロードマップ

2021/05/21に開催されたSPSS オンラインユーザー会のご講演
日本アイ・ビー・エム株式会社京田さん
「データの可視化と Modeler ロードマップ」
のスライド資料です。

JPSPSS

June 08, 2021
Tweet

More Decks by JPSPSS

Other Decks in Technology

Transcript

  1. © 2021 IBM Corporation 2 日本アイ・ビー・エム株式会社 テクノロジー事業本部 データ・AI・オートメーション事業部 Data &

    AI 第一テクニカルセールス 京田 雅弘 • 業務アプリケーションのSE => データ活用EUC 1998年ごろ • CRMのコンサルティング業務 2002年ごろ • BIツール(Cognos)のプリセールス 2002-2016 • The Weather Companyの気象庁への認可登録 2017 • SPSS Academic および SPSS & Data/AIの営業担当 2018-2020 • 現職 2020/7月 連絡先 [email protected] Speaker
  2. © 2021 IBM Corporation 4 • 2019年から開始、今回で3回目 • 2020年からはオンラインでの実施 •

    2019年 300名応募 • 2020年 500名応募 800+視聴 • 2021年度は年2回開催いたします =>次回開催は11月を予定しております • まだまだ、細かい運営を手探りでやっている状態ですが、ユーザー様やパートナー 様からご意見をいただき、良い企画を実施してきたいと思いますので、twitterやメ ールにてご意見等いただけますと幸いです。 SPSSユーザ会
  3. © 2021 IBM Corporation 5 • IBM ソリューションブログ (SPSS利用のTipsなど) •

    Qiita記事 (SPSS技術情報) • Twitter • 今後はハッシュタグ #spssmodelerで情報発信をしていきます。 • ユーザーの皆さんもサンプルストリームや技術記事の投稿をされたら、ぜひこのハッシュタグでつぶやきお願いいたします! • インタラクティブなコミュニケーションが可能です。 • 今回のイベントのハッシュタグは #spss2021springです。 情報配信 New
  4. © 2021 IBM Corporation 8 8 データサイエンティスト協会の理事会員として、DS業界のモーメンタム創造に貢献 © 2019 IBM

    Corporation 一般社団法人 データサイエンティスト協会概要 委員会 IBM 活動 ⚫ 2013年設立 ⚫ 法人会員数111社 / 個人会員1万4千名 分析技術認定(レベル認定)などの活動を通じて、分析能力の 向上を図るための提言や協力を惜しまない支 援機関として、 高度人材の育成とデータ分析業界の健全な発展に貢献する。 ⚫ 幹事会員13社 ⚫ セミナー・シンポジウム企画・運営 ⚫ 課題解決型人材育成プログラムの企画・運営 • 3ヶ月のビジネススキルを重視した分析コンテスト • 昨年アスクル様、今年は生協様のデータを用いたビ ジネススキル向上の活動をしています。 ⚫ スキル定義委員会(認定制度準備) ⚫ 企画委員会(セミナー/就活ガイド) ⚫ 調査企画委員会(企業採用調査) ⚫ コミュニティハブ委員会(事業会社意見交換) • 国内のデータサイエンティストの平均年収791万円、女性比率1割 <=もっと価値を高める • 「データ分析者の孤立」を防ぐためのコミュニティを広げる
  5. © 2021 IBM Corporation 13 PASW Modeler 13 Clementine 12

    〜2009 SPSS Modeler 15.0 2012/06 SPSS Modeler 16.0 2013/12 SPSS Modeler 17.1 2015/09 SPSS Modeler 18.0 2016/03 • 時系列データ間の因果関係分析 • 地理空間分析 • ビッグデータ分析の拡張 (TwoStepのクラスター化エンジン、Hadoopサポート拡張) • 4つのエディションによるラインナップ • モンテカルロ・シミュレーション • Space Time Boxes (STB) ノード、ストリーミング時 系列ノードの追加 • R、Python 連携 • ユーザー定義集計 • Cognos TM1連携 • Netezzaとの親和性強化 • IBM System z 連携 • IBM 統合後の初リリース • IBM SPSS Modeler へ製品名変更 • Cognos BIとの連携強化 凡例 サポート終了 Ver サポートVer 最新Ver SPSS Modeler 17.0 2015/03 • Hadoopと連携して利用できるアルゴリ ズムの追加 (一般化線形モデル、サポート・ベクト ル・マシンおよびランダム・ツリーなど) • Apache Spark との連携 • サポート環境、データソースの拡張 • エンティティ分析 • 地図機能、一般化線形モデル(GLMM)の追加 • ビッグデータ分析 (Hadoop連携、ユーザー定義関 数機能活用) • SPSS Statistics 連携強化 • 時系列モデルが刷新 • Sparkを搭載し単独でSparkの分析手法 を利用可能 • 拡張ハブから簡易に機能を拡張 • Windows10、Mac OS対応 SPSS Modeler 18.1 / 18.1.1 2017/06 EOS:2019/4/30 • オープンソース / CPLEX / Weatherとの連携強化 • ユーザービリティ向上 SPSS Modeler 18.2 / 18.2.1 2018/12 • 新しいUIとデータ視覚化 • オープンソース分析機能強化 • Db2との連携強化 EOS:2020/4/30 SPSS Modeler 18.2.2 2020/09 • オープンソース連携強化 • サポートのアップデート • 自動分類・数値ノード強化 PASW Modeler 14 2010/03 SPSS Modeler 14.2 SPSS Modeler 14.1 2010/09 2011/06 2021年6月新バージョンリリースを予定 お手元の製品との比較を。 SPSS Modeler 18.3 release History (May. 2021)SPSS Modeler SPSS Modeler 18.3
  6. © 2021 IBM Corporation 14 テーマ1 分析環境ニーズへの対応 テーマ2 分析自動化ニーズへ強化対応 •

    C&DS users can schedule jobs by minutes • C&DS users can use command and REST API interface to run a C&DS job • Analytic server users can connect to Cloudera Data Platform (CDP) version 7.1.6 • RHEL8 テーマ3 外部連携強化 • Modeler customers can connect to Planning Analytics on Cloud without admin host using REST API calls. • Modeler users can upload their stream to IBM Cloud Pak for Data using the Modeler GUI • SPSS Modeler users can view Pearson's Correlation for Statistics node in a matrix SPSS Modeler18.3(予定) SPSS Modeler 日本のお客様 から頂いたリク エストを実現! • CADSジョブのスケジュールが1時間単位から1分単位に。短い サイクルで回すのには、外部スケジューラーの利用がやジョブを コピーする必要がありましたが、簡単に行えるようになります。 • CADSのJOB起動のRESTAPIが用意された。JP1などの外 部スケジューラーから呼び出すことが簡単になります。
  7. © 2021 IBM Corporation 15 SPSS Statistics V28 / V28.0.1.0

    SPSS Statistics テーマ1 機能強化 テーマ2 視覚強化 • Data Visualization Relationship Maps(V28) • Data Visualizations with Relative Comparisons(V28.0.1.0) • Search Functionality to Procedural and Documentation Levels (V28) • New Table Output Editor Side Pane(V28) • Advanced Statistical Techniques (V28.0.1.0) • Expanded Usability Enhancements for Data Cleansing, Analysis, and Performance(V28.0.1.0) テーマ3 外部連携強化 • Improved R & Python Extension Integration Experience (V28) • New File Type for Syntax & Output(V28) • Expanded Open Source Functionality and Usability(V28.0.1.0)
  8. © 2021 IBM Corporation 18 • IBMのData and AI製品の機能改善や新機能のアイディアを集めるサ イトです。

    1. 誰かが入力した機能改善や新機能のアイディアに投票ができます 2. 新しい機能改善や新機能のアイディアを登録することができます 3. 製品ロードマップを確認できます IBM Data and AI Ideas Portal 使い方はこちら (最終ページでもう一度掲載します) ↓
  9. © 2021 IBM Corporation 20 • 分析結果を業務に活かす • 業務部門へデータ提供 •

    業務部門へグラフ、レポート、ダッシュボード提供 • 傾向をみる • 比較する • 分類する • 関連性をみる • 業務の知見 • KPI • ステークホルダーに報告、成果を示す • 見せ方論 • データ活用をスケールするのに非常に重要 分析の可視化と共有 こんな使い方も (前回のユーザ会でご紹介した例)
  10. © 2021 IBM Corporation 21 Access Data Develop Deploy Integrate

    Monitor • 精度維持のためのドリフト監視 • 潜在的なバイアス のチェック • デ・バイアスされたスコアリング結果の確認 • モデルに関する説明 • スコアリング結果のロギング(Audit) AIの信頼性、透明性、および説明可能性 Automate AI lifecycle management
  11. © 2021 IBM Corporation 24 【SPSSユーザーセミナー参加者限定】SPSS 製品キャンペーン 参加者特典として、SPSS製品の特別オファリングを、次週以降で販売店様、もしくは配信メールにてご案内 をさせていただきます。 この機会にぜひ、新しいお取り組み、基盤の拡張などご検討くださいませ。

    終了後のアンケートのご記載のご協力もよろしくお願い申し上げます。 SPSS Modeler Professional Client SPSS Collaboration and Deployment Services SPSS Modeler Server Professional IBM Watson Studio Premium <従来のSPSS製品群> <All In One 分析統合製品> キャンペーン予定製品
  12. © 2021 IBM Corporation 25 お客様社内ネットワーク PC ▪ Anacondaレポジトリの商用利用(従業員200名以上)は有償になりました –

    https://www.anaconda.com/terms-of-service – we are not granting you permission to use the Repository for commercial activities ▪ IBMでは、Anaconda Repository for IBM Cloud Pak for Dataというプライベートレポジトリ製品を OEM販売しています。 Anaconda Repository for IBM Cloud Pak for Data (Anaconda Team Edition) Anaconda Individual Edition (元Anaconda Distribution) Anaconda Public Repository (repo.anaconda.com) パッケージ パッケージ パッケージ PC Anaconda Individual Edition パッケージ ミラーリング × 商用用途は 無償で利用不可 〇 Pythonユーザーはお気を付けください! Anacondaレポジトリの商用利用は有償になりました
  13. © 2021 IBM Corporation 26 1. 今後ともSPSSユーザ会をよろしくお願いいたします。 2. 情報配信を積極的に行ってきます。 3.

    直近発表予定の新バージョンに関しましては発表後に資料等公開をしていきます。 4. 最近お問い合わせの多い、分析の可視化、共有について、目的に応じたソリューションを ご提供いたしますので是非ご相談ください。 関連サイト再掲 本日お話しさせていただいた内容 IBM ソリューションブログ Qiita記事 データサイエンティスト協会 Youtube IBM Data and AI Ideas Portal 使い方 #spss2021spring
  14. © 2021 IBM Corporation 27 ワークショップ、セッション、および資料は、IBMまたはセッション発表者によって準備され、それぞれ独自の見解を反映したものです。それらは情報提供の目的のみで提供されており、いかなる参加者に対しても法律的また はその他の指導や助言を意図したものではなく、またそのような結果を生むものでもありません。本講演資料に含まれている情報については、完全性と正確性を期するよう努力しましたが、「現状のまま」提供され、明示ま たは暗示にかかわらずいかなる保証も伴わないものとします。本講演資料またはその他の資料の使用によって、あるいはその他の関連によって、いかなる損害が生じた場合も、IBMは責任を負わないものとします。 本講 演資料に含まれている内容は、IBMまたはそのサプライヤーやライセンス交付者からいかなる保証または表明を引きだすことを意図したものでも、IBMソフトウェアの使用を規定する適用ライセンス契約の条項を変更するこ

    とを意図したものでもなく、またそのような結果を生むものでもありません。 本講演資料でIBM製品、プログラム、またはサービスに言及していても、IBMが営業活動を行っているすべての国でそれらが使用可能であることを暗示するものではありません。本講演資料で言及している製品リリース日 付や製品機能は、市場機会またはその他の要因に基づいてIBM独自の決定権をもっていつでも変更できるものとし、いかなる方法においても将来の製品または機能が使用可能になると確約することを意図したものでは ありません。本講演資料に含まれている内容は、参加者が開始する活動によって特定の販売、売上高の向上、またはその他の結果が生じると述べる、または暗示することを意図したものでも、またそのような結果を生む ものでもありません。 パフォーマンスは、管理された環境において標準的なIBMベンチマークを使用した測定と予測に基づいています。ユーザーが経験する実際のスループットやパフォーマンスは、ユーザーのジョブ・ストリーム におけるマルチプログラミングの量、入出力構成、ストレージ構成、および処理されるワークロードなどの考慮事項を含む、数多くの要因に応じて変化します。したがって、個々のユーザーがここで述べられているものと同様 の結果を得られると確約するものではありません。 記述されているすべてのお客様事例は、それらのお客様がどのようにIBM製品を使用したか、またそれらのお客様が達成した結果の実例として示されたものです。実際の環境コストおよびパフォーマンス特性は、お客様ご とに異なる場合があります。 IBM、IBM ロゴ、ibm.com、SPSSは、 世界の多くの国で登録されたInternational Business Machines Corporationの商標です。他の製品名およびサービス名等は、それぞれIBMまたは各社の商標である 場合があります。現時点での IBM の商標リストについては、www.ibm.com/legal/copytrade.shtml をご覧ください。