Upgrade to Pro — share decks privately, control downloads, hide ads and more …

oneWEX-SPSS連携によるテキスト分析の拡張

Avatar for JPSPSS JPSPSS
June 08, 2021

 oneWEX-SPSS連携によるテキスト分析の拡張

2021/05/21に開催されたSPSS オンラインユーザー会のご講演
本田技研工業株式会社 小川様・吉武様、日本アイ・ビー・エム株式会社中川さん
「oneWEX-SPSS連携によるテキスト分析の拡張」
のスライド資料(抜粋版)です。

Avatar for JPSPSS

JPSPSS

June 08, 2021
Tweet

More Decks by JPSPSS

Other Decks in Technology

Transcript

  1. Honda Motor Co., Ltd. All Rights Reserved 本田技研工業株式会社 Honda Innovation

    Tokyo Akasaka デジタル改革統括部バリュークリエーション部 小川 努 吉武 雅二 日本アイ・ビー・エム株式会社 Global Business Services, Advanced Analytics CoC 中川 賢人 oneWEX SPSS連携によるテキスト分析の拡張 ‘21/5/21@SPSSユーザー会
  2. Honda Motor Co., Ltd. All Rights Reserved Honda Motor Co.,

    Ltd. All Rights Reserved Digital Solution Center Data Management by Honda R&D with Honda Motor BigData with CASE Data Management by Honda Motor IT Div. Current Status of DX/Data Management in Honda 2012 2016 2017 2018 2019 Research of BigData Analytics Digital Transformatio n Supervisory Unit, 2020~
  3. Honda Motor Co., Ltd. All Rights Reserved データ・アーキテクト データ・アナリスト データ・サイエンティスト

    デジタル・マーケター データ部門 ビジネス部門 データ・エンジニア 分析部門
  4. Honda Motor Co., Ltd. All Rights Reserved 何をやったのか? SPSS Modeler

    と oneWEX(Watson Explorer)を連携できるノードを開発 Questionnaire 数値データ テキストデータ
  5. Honda Motor Co., Ltd. All Rights Reserved Why SPSS with

    oneWEX? テキストデータと数値データを同時に扱いたい おめでたい イメージ 5点 のどにつまらせ ると危ない… 1点 柔らかくておいしい 4点 もちのイメージ = 2.5 + 0.5*めでたい + 0.2*おいしい – 1.2*危ない
  6. Honda Motor Co., Ltd. All Rights Reserved Why SPSS with

    oneWEX? SPSS Modeler と oneWEX間でのやりとりが煩雑で分析作業が非効率
  7. Honda Motor Co., Ltd. All Rights Reserved Use case 1

    ディーラーアンケートのコメントから、評価の要因を抽出したい 日付 顧客 入庫内容 評価 コメント 2021/5/20 Aさん 車検 5 営業さんの対応が完璧でした! 2021/5/20 Bさん 納車 1 さんざん待たされたあげく謝罪の言葉があり ませんでした。できれば二度と行きたくあり ません。 2021/5/21 Cさん 1年点検 4 駐車場がもっと停めやすいと助かります。 2021/5/21 Dさん 車検 3 いつもありがとうございます。 ・ ・ ・
  8. Honda Motor Co., Ltd. All Rights Reserved How it works?

    oneWEXとの 接続設定 分析結果の取得 結合/整形 モデル化 oneWEXへの データ投入
  9. Honda Motor Co., Ltd. All Rights Reserved Use case 2

    テキストデータの学習、アノテーションを簡単にしたい ラベル / 相関値(リフト値) / ポジネガフラグ 学習/アノテーション 結合 / 整形 / モデル化 結合後テーブルデータ
  10. Honda Motor Co., Ltd. All Rights Reserved 外部ツールと連携するには「カスタムノード」と「拡張ノード」の2つの方法がある ユーザーの使い勝手から「カスタムノード」を採用 •

    カスタムノードダイアログビルダーでカスタムノードを開発 • ユーザーはGUI操作だけでOK カスタムノードでoneWEXと連携するノードを開発 https://www.ibm.com/blogs/solutions/jp- ja/spssmodeler-push-node-22/ 拡張ノードにJanomeで 形態素解析するためのスクリプト を記述 • 拡張ノードでテキスト分析 • ユーザーはスクリプトの記述が必要
  11. Honda Motor Co., Ltd. All Rights Reserved カスタムノードダイアログビルダーを使用してカスタムノードを開発 ・ノードのコントロールをドラッグ&ドロップで定義 ・RまたはSpark用Pythonでロジックを実装

    どうやってカスタムノードを開発? カスタムノードダイアログビルダー • [拡張機能] > [カスタムノードダイアログビルダー]をクリック ツール • コントロールを提供 プロパティ • コントロールやノード のプロパティを設定 モデルオプション • コントロールをドラッ グしてノードの設定 画面を設計 スクリプトテンプレート • RまたはSpark用 Pythonでロジックを 実装
  12. Honda Motor Co., Ltd. All Rights Reserved どうやってカスタムノードを開発? library (httr,

    jsonlite) 〜中略〜 this_collectionId <- "%%collection_Id%%" this_facet_limit <- "%%facet_limit%%" 〜中略〜 access_url <- paste0(oneWEXURL, "/api/v1/collections/", this_collectionId, "/status") res <- GET(access_url, authenticate(username, password)) jsonRes <- content(res, type="application/json") 〜中略〜 facetMatrix <- rbind(facetMatrix, currentValueMatrix) modelerData <- data.frame(facetMatrix) 〜中略〜 modelerDataModel <- getMetaData(modelerData) スクリプトのイメージ パッケージを呼び出し ノードの設定画面での入力値を取得 oneWEXのAPIにアクセス、レスポンスを取得 レスポンスを表形式に整形 出力データをセット
  13. Honda Motor Co., Ltd. All Rights Reserved 「拡張ノード」と「カスタムノード」の使い分けでデータ活用を推進 メリット デメリット

    「拡張ノード」でのR/Python連携 • R/Pythonで分析ロジックを自由に実装できる • GUI操作だけでなく、R/Pythonでの分析ロジックの実装が必要である 「カスタムノード」でのR/Python連携 • GUI操作で分析ができる • GUI操作の範囲でしか分析ロジックが変更できない 「拡張ノード」と「カスタムノード」の使い分けイメージ 「拡張ノード」と「カスタムノード」のメリット/デメリット データ サイエンティスト エンドユーザー (業務担当者) 拡張ノード カスタムノード R/Pythonで分析ロジックを 自由に実装して試行錯誤 分析ロジックが確定 分析ロジックをカスタムノードに 実装してノード化 カスタムノードを利用してGUI 操作で分析を実行
  14. Honda Motor Co., Ltd. All Rights Reserved → [拡張ハブ]という仕組みがあるんです(実は) カスタムノードを共有してみたいですよね?

    https://ibmpredictiveanalytics.github.io/ SPSS Modeler: 66エントリー SPSS Statistics: 202 エントリー
  15. Honda Motor Co., Ltd. All Rights Reserved 仕組みはあるのですが、、、 数年間更新されていません、、、 API仕様とか変わってて動かないはず、、、

    拡張ノード(mpeファイル)を公開すると ソース丸見え 業務で作ったものを公開するのは知財な ど考慮が必要で難しい、、、
  16. Honda Motor Co., Ltd. All Rights Reserved そこで、、、 https://ibm-data-and-ai.ideas.aha.io/ideas/MDLR-I-342 カスタムノードのロジックを公開しないでカスタムノードを配布したい!

    Distribute custom nodes without disclosing the logic of the custom nodes 是非投票お願いします! 他にもいくつか要望しているので投票お願いします。 (URLは別途事務局からお送りします)