Upgrade to Pro — share decks privately, control downloads, hide ads and more …

InterSystems IRIS Data Platform で高度なデータ分析のための基盤を整備しよう

InterSystems IRIS Data Platform で高度なデータ分析のための基盤を整備しよう

2020年2月13日に「DevSumi20」で発表したインターシステムズのスライドです。

InterSystemsJapan

February 13, 2020
Tweet

More Decks by InterSystemsJapan

Other Decks in Technology

Transcript

  1. Data Warehouse - Big Data – Data Lake Operational System

    Data Warehouse ETL Data Mart HDFS Hive HBase 業務 分析 Agility Operational System ETL ETL Operational System ETL Data Mart Data Mart ログデータ センサーデータ 自然言語 ? データサイロ スキーマレス Data Lake データガバナンス 機械学習 データ負債をデータ資産へ DataOpsエコシステム 自動化 オープン Best Of Breed データの質
  2. InterSystems IRIS Data Platform アーキテクチャ データエンジン&スクリプト メタデータ SQL OBJ Cube

    NLP JSON 分散キャッシュ / シャーディング メッセージング BPM Rules Workflow データベース 相互運用性 スケーラビリティ No SQL 埋め込みBI 相互運用性 オープン
  3. InterSystems IRIS データベース InterSystems IRIS 相互接続性 InterSystems IRIS 分析 InterSystems

    IRIS Data Platform 単一でスケーラブルなプラットフォーム
  4. “データ分析チーム” Anna Doug Sofia Munir Bob Tom Eric データモデラー ディベロッパ

    データエンジニア データギーク ビジネスアナリスト マネージャ データサイエンティスト
  5. • InterSystem IRISからPythonとRにネイティブ 接続 ― コア開発: ObjectScript API ― ビジネスプロセス開発:

    インタオペラビリティ ― Jupyter Notebookからビジネスプロセスを編集 可能 • 機械学習の具体的ユースケースでの実装サン プルを含む ML Toolkit
  6. 開発中:Analytic Workflows 差別化要因: • 一般的な機械学習技術のサポートによるツールの相互運用性 : ― 言語: Python, R,

    Spark, … ― フレームワーク: Sagemaker, TensorFlow, … • 基本的なタスクや連携の自動化: ― ロード, 突合, 保存, … • ワークフロー全体の繰り返しと監視
  7. タスク 1 | データの準備 Who? • Eric, データエンジニア What? •

    エンリッチされたCRMデータセット • 顧客サービスデータセット How? • SQL, CSV files • Bash scripts Load CRM Load CstSrv Load dgx JOIN
  8. タスク 2 | 特徴量エンジニアリング Who? • Munir, データモデラー What? •

    フラット化した特徴量テーブル How? • Rスクリプト Load CRM Load CstSrv Load dgx JOIN Feature Engineering
  9. タスク 3 | 機械学習 Who? • Doug, データサイエンティスト What? •

    予測モデル • スコア化した履歴データセット How? • Python ― ライブラリ: scikit.learn, matplotlib, … ― ツール: Jupyter Load CRM Load CstSrv Load dgx JOIN Feature Engineering Machine Learning
  10. タスク 4 | レポーティング Who? • Munir, データモデラー What? •

    アドホック分析のためのキューブ • 概要レポート How? • InterSystems IRIS BI • レポーティング技術 Load CRM Load CstSrv Load dgx JOIN Feature Engineering Machine Learning Reporting
  11. タスク 5 | モデルのデプロイ Who? • Tom,ディベロッパ What? • 顧客サポートプロセスでの自動アラート

    How? • InterSystems IRIS インターオペラビリティ Load CRM Load CstSrv Load dgx JOIN Feature Engineering Machine Learning Reporting Deployment
  12. Analytic Workflows(分析ワークフロー) | 定義 “分析ワークフローとは、分析プロセスを構 成する一連のタスク” チャレンジ • 異なるタスクは異なるツールによって実装さ れている

    • 異なるタスクは別々のチームにより管理・監 視されている • 一度だけ行うような実験環境から実用計画に 移行する際、より複雑になる Load CRM Load CstSrv Load dgx JOIN Feature Engineering Machine Learning Reporting Deployment SQL CSV SQL SQL BPL
  13. モデリング/ 機械学習ツール (Spark, R, Tensorflow, …) InterSystems IRIS | PMML

    統合 R I S I モデル PMML PMML Class 学習 Input 学習 Output イベント
  14. プレビュー版 | Integrated ML(QuickML) データサイエンススキルが不足する中、簡単な操作で、慣れ親しんだSQL環境で、基本的 な機械学習のタスクを実行できる実用的なツール • 特徴量エンジニアリングとモデル選択を自動的に行う • SQLオプティマイザによるパフォーマンス最適化

    CREATE MODEL PainAlert PREDICTING IsAnomaly BOOLEAN WITH (PainScore INT, DaysSinceOp INT,…) TRAIN MODEL PainAlert FROM EHR.WardPatientHistory WHERE DateAdmitted < ‘07/01/2019’ SELECT PREDICT(PainAlert), EpisodeID, PatientID FROM EHR.WardPatients
  15. Information Portal Analytics Workbench Data Science Lab AI Hub Roles

    External Embedded InterSystems IRISを基盤とするデータ分析 NLP QuickML AI Connectors PMML Support Analytic Workflows BI Connectors ML Toolkit Spark Connector Gateways UIMA NLP-Fx Available Imminent Roadmap Full-Stack Developer Data Scientist Manager Business Analyst Data Modeler Data Engineer Data Geek Reporting Data OLAP Search Interoperability Columnar Time Series Relational JSON Sensor BI Streaming Enterprise Architect DevOps Engineer
  16. IRIS QuickStartsについて  QuickStartsは、5分で終わる InterSystems IRIS の学習コンテンツです。  機能ごとに内容が分かれ、概要説明のための数分間のビデオと操作を体験する ためのサンプル提供、実行手順のガイドが付いています。

     概要ビデオの日本語字幕もあります。詳細は以下ページをご参照ください。 https://www.intersystems.com/jp/quickstart/  ちょっと試したい場合や、機能全般を網羅しながら体験されたい方に最適です。 https://learning.intersystems.com/course/view.php?id=1055&ssoPass=1 TRY IRISについて  InterSystems 教育サービスが提供する無料のInterSystems IRIS お試し環境です。  お名前とメールアドレスをご登録いただくだけでご利用いただけます。  お試し環境では、QuickStarts の一部を含めたWebベースのIDEをご用意してい ますので、IRISをお試しいただくための特別な準備は不要です。  TRY IRIS https://www.intersystems.com/jp/TRY  TRY IRIS 専用WebベースのIDEの使い方は以下ページをご参照ください。 https://00m.in/X2JYu
  17. 技術リソースへのリンク集  開発者向けページ https://www.intersystems.com/jp/developing-with-intersystems-iris/ (https://00m.in/aYWQe)  インターシステムズFAQ https://faq.intersystems.co.jp/  FAQ

    トピック一覧ページ https://www.intersystems.com/jp/support-learning/support/faq/  Developer Community(英語) https://community.intersystems.com *Google翻訳版 https://bit.ly/2wh28v2  日本語ドキュメント https://www.intersystems.com/jp/support-learning/support/document/ (https://00m.in/8jxOn)  TRY IRIS https://www.intersystems.com/jp/TRY  QuickStart for InterSystems IRIS https://www.intersystems.com/jp/quickstart/ (最新情報) https://learning.intersystems.com/course/view.php?id=1055&ssoPass=1  オンラインラーニング(英語) https://learning.intersystems.com  クラスルームラーニング https://www.intersystems.com/jp/support-learning/ learning-services/classroom-learning-2/ (https://00m.in/geQmh)