Upgrade to Pro — share decks privately, control downloads, hide ads and more …

SPSS Modeler 18.6 新機能ハイライト

JPSPSS
February 05, 2025

SPSS Modeler 18.6 新機能ハイライト

2025-02-06に開催されたSPSS Modeler 新バージョン18.6のご紹介 〜日本語テキストマイニング機能が復活〜
①SPSS Modeler 18.6 新機能ハイライト
のスライド資料(公開版)です

JPSPSS

February 05, 2025
Tweet

More Decks by JPSPSS

Other Decks in Technology

Transcript

  1. © 2025 IBM Corporation • 時系列モデルが刷新 • Sparkを搭載し単独でSparkの分析手 法を利用可能 •

    拡張ハブから簡易に機能を拡張 • Windows10、Mac OS対応 • 強化されたパスワード暗号化 • Modeler Server構成の管理 • 拡張ノードの標準出力をエラー 時にもメッセージに表示 30年の実績 PASW Modeler 14 2010/03 2011/06 SPSS Modeler 14.2 SPSS Modeler 15.0 2012/06 SPSS Modeler 16.0 2013/12 SPSS Modeler 17.1 2015/09 SPSS Modeler 18.0 2016/03 • 時系列データ間の因果関係分析 • 地理空間分析 • ビッグデータ分析の拡張 (TwoStepのクラスター化エンジン、Hadoopサポート拡 張) • 4つのエディションによるラインナップ • モンテカルロ・シミュレーション • Space Time Boxes (STB) ノード、ストリーミング 時系列ノードの追加 • R、Python 連携 • ユーザー定義集計 • Cognos TM1連携 • Netezzaとの親和性強化 • IBM System z 連携 • IBM 統合後の初 リリース • IBM SPSS Modeler へ製品名変更 • Cognos BIとの連携強化 凡例 サポート終了 Ver サポートVer 最新Ver SPSS Modeler 17.0 2015/03 • Hadoopと連携して利用できるアルゴリズムの追加 (一般化線形モデル、サポート・ベクトル・マシンおよ びランダム・ツリーなど) • Apache Spark との連携 2010/09 SPSS Modeler 14.1 • エンティティ分析 • 地図機能、一般化線形モデル(GLMM)の追加 • ビッグデータ分析 (Hadoop連携、ユーザー定義 関数機能活用) • SPSS Statistics 連携強化 PASW Modeler 13 Clementine 12 2009 SPSS Modeler 18.1 / 18.1.1 2017/06 • オープンソース / CPLEX / Weatherとの連携強化 • ユーザービリティ向上 SPSS Modeler 18.2 / 18.2.1 2018/12 • 新しいUIとデータ視覚化 • オープンソース分析機能強化 • Db2との連携強化 SPSS Modeler 18.2.2 2020/09 • オープンソース連携強化 • 自動分類・数値ノード強化 SPSS Modeler 18.3 2021/06 • 継続的機械学習 • 非負拘束付最小2乗法 • Excelデータスキャン • 相関行列 • CP4Dへストリーム保存 SPSS Modeler 18.6 2024/12 SPSS Modeler 18.4 2022/06 SPSS Modeler 18.5 2023/12 • 日本語テキストマイニング • watsonx.data連携 • CLEM関数Date_add_XX, time_add_XX • 拡張ノードでネイティブPythonサポート • 拡張ノードにグラフ出力タブ追加 • アンサンブル分布グラフの計算の切り替え Knowledge Discovery Workbench 1 1994/06 • 最初のバージョン
  2. © 2025 IBM Corporation SPSS Modeler 18.5 新機能サマリー (2023-12-15) •

    拡張ノードでのネイティブPythonサポート • Spark DataFrameではなくPandas DataFrameが直接使えるようになった • Date_add_XX および time_add_XXのclem関数 • 日付や時間の演算が簡単になった。 • SQLプッシュバックが可能になった。特にSnowflakeユーザーからのリクエスト • 拡張ノードのPython for Sparkでグラフ出力 • グラフタブ出力が可能になった • アンサンブル分布グラフの計算の切り替え • 言語サポート • Python 3.10.7 • R 4.2.2 • Apache Spark 3.4 • OSサポート • Windows Server 2022 • Red Hat Enterprise Linux (RHEL) 9 • macOS Sonoma 14.0 • SUSE 15 • データソース • DB2 11.5.9 • Oracle 21C • SQL Server 2022 日本発 日本発 日本発 日本発 日本発 18.5 SPSS Modeler 18.5リリース #SPSS_Modeler - Qiita https://qiita.com/spssfun2017/items/b619d5e3db8bb1ff816e
  3. © 2025 IBM Corporation 拡張ノードでのネイティブPythonサポート • Pandas DataFrameが直接使えるようになりました • Modeler18.4以前でも、拡張ノードでPythonを使うことはできましたが、「Python

    for Spark」のみでした。 Sparkを使っていたために、初回起動時はオーバーヘッドがありました。 • テンプレートコード • 「インポート」「変換」「モデル作成」「出力」「エクスポート」それぞれにあわせた拡張ノードのテンプレートが 自動的に入り、コード記述が簡単になりました。 • モデル内にPythonのモデルも格納 • 外部ファイルによる管理が不要 日本発 日本発 日本発 SPSS Modeler18.5の新機能の ネイティブ Python API #SPSS - Qiita https://qiita.com/kawada2017/items/0ae6f0974788b372dc4f 18.5
  4. © 2025 IBM Corporation Date_add_XX および time_add_XXのclem関数 • 日付や時間の演算が簡単になった。 •

    SQLプッシュバックが可能になった。 • 特にDB関数の制限のあるSnowflakeユーザーからのリクエスト 日本発 18.5 日付および時刻の関数 - IBM Documentation https://www.ibm.com/docs/ja/spss-modeler/18.5.0?topic=reference-date-time-functions
  5. © 2025 IBM Corporation SPSS Modeler 18.6 新機能サマリー(2024-12-10) • テキスト分析が日本語に対応しました。

    • Extension ImportおよびExtension ExportノードでR4.4.0の機能がサポートされました。 • SQLプッシュバックによるAzureSynapse接続のパフォーマンスが向上しました。 • 言語サポート: • Python 3.10.7 • R 4.4.0 • OSサポート: • Red Hat Enterprise Linux (RHEL) 9.4 • Ubuntu24 • データソース • watsonx.data 7 日本発 日本発 18.6 SPSS Modeler 18.6リリース #SPSS_Modeler - Qiita https://qiita.com/spssfun2017/items/d3399c2243e7b61d6b91
  6. © 2025 IBM Corporation テキスト分析が日本語に対応 • 定量的データと定性的データを組み合わせた分析が可能です • 18.1でサポートがなくなっていた日本語テキスト分析機能が復活しました 8

    フリーコメントから頻出ワードを機械的にフラグ化することができます 顧客番号 機種 総通話 時間 メール 通信量 変化 入会後 年数 入電コメント ショップ バッテ リー 無料 請求 orプラン 新しい 解約 調子 電話機 orスマホ 1032066 AA 370 2 stable 1 電話機の使い方を、教えてほし い。ショップに行って教えても らうように伝える。 1 0 0 0 0 0 0 1 1889492 BB 426 0 stable 6 初めからバッテリーの調子が悪 い。今すぐ新しい電話器がほし い。 0 1 0 0 1 0 1 1 2375211 AA 349 5 stable 3 新しい料金プランについて知り たい。すぐに解約の可能性大。 無料通話分を増やしたい。 0 0 1 1 1 1 0 0 定量的データ (集計可能) 定性的データ (集計不能) TAでキーワード群に構造化 18.6
  7. © 2025 IBM Corporation オブジェクト ストレージ S3やICOS 安価 watsonx.dataとの連携 •

    watsonx.data • IBMのデータレイクハウス製品 • SaaS版とオンプレ版のハイブリッドで提供 • SQLプッシュバックが可能 S3やICOSといったオブジェクトストレージを活用することで、捨てていたデータを安価に活用 従来型データウェアハウス ブロック ストレージ 高価 データレイクハウス watsonx.data オブジェクト ストレージ S3やICOS 安価 CSV など CSV など 使用頻度が低 そうなものは 安価なスト レージにアー カイブや削除 最低限に 絞ってロード 生データを ロード 18.6 SPSS Modelerからwatsonx.data(Presto)に接続する #SPSS_Modeler - Qiita https://qiita.com/spssfun2017/items/348d0a231d7b757afb1a
  8. © 2025 IBM Corporation まとめ • Modeler 18.5や18.6の注目の新機能 • Pythonの機能が活用しやすくなりました

    ーネイティブPython連携(18.5) • テキスト分析が可能になりました- 日本語テキスト分析(18.6) • 大量データの活用がしやすくなりました ー watsonx.data連携(18.6)やdate_add関数(18.5) • 最新情報はQiitaで公開 • https://qiita.com/tags/spss_modeler 11
  9. © 2025 IBM Corporation ユーザーの声: IT review 12 IT review

    https://www.itreview.jp/products/ibm-spss-modeler/reviews