Upgrade to Pro — share decks privately, control downloads, hide ads and more …

電力データ活用ビジネスにおける機械学習技術の継続的な改善について

hassaku
May 29, 2019

 電力データ活用ビジネスにおける機械学習技術の継続的な改善について

Machine Learning Casual Talks #10

hassaku

May 29, 2019
Tweet

More Decks by hassaku

Other Decks in Technology

Transcript

  1. Copyright 2019, Informetis Co., Ltd All Rights Reserved 1 Machine

    Learning Casual Talks #10 インフォメティス株式会社 蓮尾⾼志 電⼒データ活⽤ビジネス における機械学習技術の 継続的な改善について
  2. Copyright 2019, Informetis Co., Ltd All Rights Reserved ⾃⼰紹介 •

    蓮尾 ⾼志(HASUO TAKASHI) • インフォメティス株式会社 • ソニーR&D時代の成果を元にしたエネルギーデータ分析を強 みとするベンチャー企業(2013年創業) • 主にB2B2Cの取引形態 • 東京(⽇本)とケンブリッジ(UK)にオフィス • ハードウェアからアプリまで⼀貫して⾃社開発 • アルゴリズム開発チームのテックリード • 協⼒会社やアルバイトのメンバーを含めると8名くらい • 好きなpython moduleはtqdm 13%|██ | 2/15
  3. Copyright 2019, Informetis Co., Ltd All Rights Reserved お話したいこと •

    電⼒データと機械学習(ML)技術について • ビジネスやサービス、技術周辺について簡単にご紹介 • マイナーなデータに対するML技術の改善プロセスについて ※画像・⾳声・NLP等に⽐べてマイナーと位置づけています • 電⼒データに対する研究開発の課題 • 改善プロセスの勘所 • 各種取り組みと得られた知⾒ 20%|████ | 3/15
  4. Copyright 2019, Informetis Co., Ltd All Rights Reserved 事業概要 家の電⼒データ計測

    省エネ ⾒守り 進む電化社会を背景に、エネルギーの ⼤元を抑え、次世代の社会インフラへ … etc. 【コア技術】 エネルギーデータを解析し、それを ⽤いた様々な事象を明らかにしていく 26%|██████ | 4/15 【ビジネス】 電⼒会社や住宅等の事業者と提携し、 センサ技術、クラウドPF、分析技術、 各種アプリをB2B2Cで提供中
  5. Copyright 2019, Informetis Co., Ltd All Rights Reserved • ⼀箇所で計測されている電⼒データから、その先で電

    ⼒消費している各家電の稼働パターンを分離すること リアルタイムな 主幹電⼒データ 機器分離推定技術 各家電ごとの 稼働状況 エアコン エアコン エアコン 電⼦レンジ 電⼦レンジ 洗濯機 24時 kWh 0時 1つだけ! 個別のセンサは不要 Wi-Fi接続 センサ本体 CT電流 計測部 ⼀般家庭の分電盤内部 ← 機械学習技術使ってるところ 機器分離推定とは ある家庭における1⽇の電⼒消費データ
  6. Copyright 2019, Informetis Co., Ltd All Rights Reserved 機器分離推定技術デモ動画 ↓

    センサで観測される値と家電モデルによる値の誤差が少なくなるような家電の稼働組み合わせを推定 ※5倍速再⽣ ※動画は原理実証デモの内容であり、分離される家電等は実際の商⽤版とは異なります
  7. Copyright 2019, Informetis Co., Ltd All Rights Reserved 商⽤サービス基盤(機械学習周りについて) •

    課題 • 24時間365⽇アップロードされ続けるセンサー データに対して、それなりにリアルタイム処理 • 通信環境や対象データ等によって負荷が⼀様でない • 実現⽅法 • Kubernetes on GCP • Pub/Subを介して処理開始及び結果通知 • 処理状況に応じてオートスケール • その他 • コンテナイメージ作成まで⾃チームで実施しており、 必要なミドルウェアとか、設計とか、そのへんは⾃ 分達で好きなように構築 • 商⽤環境の処理状況は、Slack通知等で⽇々確認 Cloud Storage Cloud Bigtable Cloud Pub/Sub Container Engine 異常値の疑いがあるセンサ 処理の全体量変化 etc. …
  8. Copyright 2019, Informetis Co., Ltd All Rights Reserved お話したいこと •

    電⼒データと機械学習(ML)技術について • ビジネスやサービス、技術周辺について簡単にご紹介 • マイナーなデータに対するML技術の改善プロセスについて ※画像・⾳声・NLP等に⽐べてマイナーと位置づけています • 電⼒データに対する研究開発の課題 • 改善プロセスの勘所 • 各種取り組みと得られた知⾒ 60%|████████████████████ | 9/15
  9. Copyright 2019, Informetis Co., Ltd All Rights Reserved 電⼒データに特有な課題の例 エアコン

    エアコン 電⼦レンジ 電⼦レンジ 洗濯機 画像が重なった際の特徴の変化 << 電流が重なった際の特徴の変化 特徴の変化により頑健な機械学習技術が求められることが多い (⼤量のデータを⽤意してとりあえずDeep Learningみたいなアプローチがうまくいかない) キルヒホッフの法則 画像は遮蔽(前景背景)の関係 電流は合算の関係
  10. Copyright 2019, Informetis Co., Ltd All Rights Reserved 電⼒データ解析技術開発の勘所 •

    アカデミック分野の知⾒はあてに出来ない • マイナーなので、そもそもあまり⾒つからない… • データ⾃体の特徴だけではなく、物理現象とい ったデータの⽣成過程まで考慮すると⾊々ヒン トが⾒つかったりすることも多い 現象 計測 データ 電流波形 CTセンサ 電気回路 家電タイプ 稼働パターン
  11. Copyright 2019, Informetis Co., Ltd All Rights Reserved タスク・仮説の設定 開発⽤データの整備

    評価尺度の定義 特徴抽出の検討 モデルの構築 モデルの評価 結果の解釈 システム統合・評価 新発売の家電 (未知データ・共変量シフト) アプリ次第では誤検出が致命的 (評価尺度の整合性) ロングテールに分布する家庭データ (データ不⾜・偏在) サービス拡⼤やビジネス状況の変化 (計算コスト・優先度の⾒直し) 改善プロセスの繰り返しがますます重要 いかに効率良く回せるかが課題 … 技術改善プロセスについて
  12. Copyright 2019, Informetis Co., Ltd All Rights Reserved [WIP] いかに効率良く改善プロセスを回すか?

    アルバイト等 ポテンシャル⼈材 海外ML系⼈材 国内ML系⼈材 ⾃動化容易なこと ⾃動化困難なこと ⼈⼿を増やすしかない! (最適パラメータ探索等) がんばる 20% 80% なかなか 採れない… (マイナー業界だから?) コミュニケーシ ョンの壁 海外案件など分業 (ML技術のコアな部分などで 相互に寄与することもある) タスク切り出しの 内容とかコスト 育成コストや時間 (他スキルで貢献してもらえる ことも多いかもしれない) 楽しい ⼤変だけど やらねば… ⾊々⼯夫した上で 現実的な路線… いかに⾃⾛して もらえるように なるかが鍵? 頑健なML技術の理論⾯など は⼤学教授ら外部頼み (未ラベル活⽤、ベイズ等)
  13. Copyright 2019, Informetis Co., Ltd All Rights Reserved 技術改善プロセスの抑えどころ3点 問題設定の理解

    (⼊⼝側) 共通データセットの精査 評価系の整備 課題整理の体裁 (出⼝側) 技術開発の詳細は⾃由 この3つのポイントをチームで抑えておけば、⽐ 較的⾃由に任せておいても、技術改善プロセスを 効率よく継続して回していける(かもしれない) チームで取り組むところ 各⾃の⾃由に任せるところ 最終的にはコンテナに押し込め られてサービスへデプロイする ので、制約もあまり設けない
  14. Copyright 2019, Informetis Co., Ltd All Rights Reserved おわりに •

    電⼒データと機械学習技術について紹介した • ニッチで⼿付かずな分野が故に、技術改善のためには⾊々 とやることが多い • 限られたリソースでも、ポイントを抑えておけば、技術改 善を継続することは可能 • 今後の各種プロジェクトについても同様に技術開発をマネ ージしていきたい