Upgrade to Pro — share decks privately, control downloads, hide ads and more …

oneWEX-SPSS連携によるテキスト分析の拡張

JPSPSS
June 08, 2021

 oneWEX-SPSS連携によるテキスト分析の拡張

2021/05/21に開催されたSPSS オンラインユーザー会のご講演
本田技研工業株式会社 小川様・吉武様、日本アイ・ビー・エム株式会社中川さん
「oneWEX-SPSS連携によるテキスト分析の拡張」
のスライド資料(抜粋版)です。

JPSPSS

June 08, 2021
Tweet

More Decks by JPSPSS

Other Decks in Technology

Transcript

  1. Honda Motor Co., Ltd. All Rights Reserved 本田技研工業株式会社 Honda Innovation

    Tokyo Akasaka デジタル改革統括部バリュークリエーション部 小川 努 吉武 雅二 日本アイ・ビー・エム株式会社 Global Business Services, Advanced Analytics CoC 中川 賢人 oneWEX SPSS連携によるテキスト分析の拡張 ‘21/5/21@SPSSユーザー会
  2. Honda Motor Co., Ltd. All Rights Reserved Honda Motor Co.,

    Ltd. All Rights Reserved Digital Solution Center Data Management by Honda R&D with Honda Motor BigData with CASE Data Management by Honda Motor IT Div. Current Status of DX/Data Management in Honda 2012 2016 2017 2018 2019 Research of BigData Analytics Digital Transformatio n Supervisory Unit, 2020~
  3. Honda Motor Co., Ltd. All Rights Reserved データ・アーキテクト データ・アナリスト データ・サイエンティスト

    デジタル・マーケター データ部門 ビジネス部門 データ・エンジニア 分析部門
  4. Honda Motor Co., Ltd. All Rights Reserved 何をやったのか? SPSS Modeler

    と oneWEX(Watson Explorer)を連携できるノードを開発 Questionnaire 数値データ テキストデータ
  5. Honda Motor Co., Ltd. All Rights Reserved Why SPSS with

    oneWEX? テキストデータと数値データを同時に扱いたい おめでたい イメージ 5点 のどにつまらせ ると危ない… 1点 柔らかくておいしい 4点 もちのイメージ = 2.5 + 0.5*めでたい + 0.2*おいしい – 1.2*危ない
  6. Honda Motor Co., Ltd. All Rights Reserved Why SPSS with

    oneWEX? SPSS Modeler と oneWEX間でのやりとりが煩雑で分析作業が非効率
  7. Honda Motor Co., Ltd. All Rights Reserved Use case 1

    ディーラーアンケートのコメントから、評価の要因を抽出したい 日付 顧客 入庫内容 評価 コメント 2021/5/20 Aさん 車検 5 営業さんの対応が完璧でした! 2021/5/20 Bさん 納車 1 さんざん待たされたあげく謝罪の言葉があり ませんでした。できれば二度と行きたくあり ません。 2021/5/21 Cさん 1年点検 4 駐車場がもっと停めやすいと助かります。 2021/5/21 Dさん 車検 3 いつもありがとうございます。 ・ ・ ・
  8. Honda Motor Co., Ltd. All Rights Reserved How it works?

    oneWEXとの 接続設定 分析結果の取得 結合/整形 モデル化 oneWEXへの データ投入
  9. Honda Motor Co., Ltd. All Rights Reserved Use case 2

    テキストデータの学習、アノテーションを簡単にしたい ラベル / 相関値(リフト値) / ポジネガフラグ 学習/アノテーション 結合 / 整形 / モデル化 結合後テーブルデータ
  10. Honda Motor Co., Ltd. All Rights Reserved 外部ツールと連携するには「カスタムノード」と「拡張ノード」の2つの方法がある ユーザーの使い勝手から「カスタムノード」を採用 •

    カスタムノードダイアログビルダーでカスタムノードを開発 • ユーザーはGUI操作だけでOK カスタムノードでoneWEXと連携するノードを開発 https://www.ibm.com/blogs/solutions/jp- ja/spssmodeler-push-node-22/ 拡張ノードにJanomeで 形態素解析するためのスクリプト を記述 • 拡張ノードでテキスト分析 • ユーザーはスクリプトの記述が必要
  11. Honda Motor Co., Ltd. All Rights Reserved カスタムノードダイアログビルダーを使用してカスタムノードを開発 ・ノードのコントロールをドラッグ&ドロップで定義 ・RまたはSpark用Pythonでロジックを実装

    どうやってカスタムノードを開発? カスタムノードダイアログビルダー • [拡張機能] > [カスタムノードダイアログビルダー]をクリック ツール • コントロールを提供 プロパティ • コントロールやノード のプロパティを設定 モデルオプション • コントロールをドラッ グしてノードの設定 画面を設計 スクリプトテンプレート • RまたはSpark用 Pythonでロジックを 実装
  12. Honda Motor Co., Ltd. All Rights Reserved どうやってカスタムノードを開発? library (httr,

    jsonlite) 〜中略〜 this_collectionId <- "%%collection_Id%%" this_facet_limit <- "%%facet_limit%%" 〜中略〜 access_url <- paste0(oneWEXURL, "/api/v1/collections/", this_collectionId, "/status") res <- GET(access_url, authenticate(username, password)) jsonRes <- content(res, type="application/json") 〜中略〜 facetMatrix <- rbind(facetMatrix, currentValueMatrix) modelerData <- data.frame(facetMatrix) 〜中略〜 modelerDataModel <- getMetaData(modelerData) スクリプトのイメージ パッケージを呼び出し ノードの設定画面での入力値を取得 oneWEXのAPIにアクセス、レスポンスを取得 レスポンスを表形式に整形 出力データをセット
  13. Honda Motor Co., Ltd. All Rights Reserved 「拡張ノード」と「カスタムノード」の使い分けでデータ活用を推進 メリット デメリット

    「拡張ノード」でのR/Python連携 • R/Pythonで分析ロジックを自由に実装できる • GUI操作だけでなく、R/Pythonでの分析ロジックの実装が必要である 「カスタムノード」でのR/Python連携 • GUI操作で分析ができる • GUI操作の範囲でしか分析ロジックが変更できない 「拡張ノード」と「カスタムノード」の使い分けイメージ 「拡張ノード」と「カスタムノード」のメリット/デメリット データ サイエンティスト エンドユーザー (業務担当者) 拡張ノード カスタムノード R/Pythonで分析ロジックを 自由に実装して試行錯誤 分析ロジックが確定 分析ロジックをカスタムノードに 実装してノード化 カスタムノードを利用してGUI 操作で分析を実行
  14. Honda Motor Co., Ltd. All Rights Reserved → [拡張ハブ]という仕組みがあるんです(実は) カスタムノードを共有してみたいですよね?

    https://ibmpredictiveanalytics.github.io/ SPSS Modeler: 66エントリー SPSS Statistics: 202 エントリー
  15. Honda Motor Co., Ltd. All Rights Reserved 仕組みはあるのですが、、、 数年間更新されていません、、、 API仕様とか変わってて動かないはず、、、

    拡張ノード(mpeファイル)を公開すると ソース丸見え 業務で作ったものを公開するのは知財な ど考慮が必要で難しい、、、
  16. Honda Motor Co., Ltd. All Rights Reserved そこで、、、 https://ibm-data-and-ai.ideas.aha.io/ideas/MDLR-I-342 カスタムノードのロジックを公開しないでカスタムノードを配布したい!

    Distribute custom nodes without disclosing the logic of the custom nodes 是非投票お願いします! 他にもいくつか要望しているので投票お願いします。 (URLは別途事務局からお送りします)