Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
電力データ活用ビジネスにおける機械学習技術の継続的な改善について
Search
hassaku
May 29, 2019
Technology
4
1.2k
電力データ活用ビジネスにおける機械学習技術の継続的な改善について
Machine Learning Casual Talks #10
hassaku
May 29, 2019
Tweet
Share
More Decks by hassaku
See All by hassaku
低コスト低信頼な水位計導入促進ための異常検知システム
hassaku
0
150
NILM Workshop 2017 Vendor Talk
hassaku
0
100
電力データと機械学習 センサ1つでおうちの様子を簡単に見える化
hassaku
0
2.6k
Shinamono Labo #15 Home Automation
hassaku
0
120
TokyoRubyKaigi10
hassaku
5
1.2k
PRML Chapter5 Hessian Matrix
hassaku
1
2k
Other Decks in Technology
See All in Technology
ゼロから創る横断SREチーム 挑戦と進化の軌跡
rvirus0817
2
260
Jetpack Composeで始めるServer Cache State
ogaclejapan
2
170
Amazon VPC Lattice 最新アップデート紹介 - PrivateLink も似たようなアップデートあったけど違いとは
bigmuramura
0
190
アップデート紹介:AWS Data Transfer Terminal
stknohg
PRO
0
180
Wvlet: A New Flow-Style Query Language For Functional Data Modeling and Interactive Data Analysis - Trino Summit 2024
xerial
1
110
統計データで2024年の クラウド・インフラ動向を眺める
ysknsid25
2
840
オプトインカメラ:UWB測位を応用したオプトイン型のカメラ計測
matthewlujp
0
170
OpenAIの蒸留機能(Model Distillation)を使用して運用中のLLMのコストを削減する取り組み
pharma_x_tech
4
550
Postman と API セキュリティ / Postman and API Security
yokawasa
0
200
Wantedly での Datadog 活用事例
bgpat
1
430
AI時代のデータセンターネットワーク
lycorptech_jp
PRO
1
280
C++26 エラー性動作
faithandbrave
2
700
Featured
See All Featured
Code Review Best Practice
trishagee
65
17k
Optimising Largest Contentful Paint
csswizardry
33
3k
Keith and Marios Guide to Fast Websites
keithpitt
410
22k
The Invisible Side of Design
smashingmag
298
50k
Building Better People: How to give real-time feedback that sticks.
wjessup
365
19k
Site-Speed That Sticks
csswizardry
2
190
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
How to Ace a Technical Interview
jacobian
276
23k
Stop Working from a Prison Cell
hatefulcrawdad
267
20k
[RailsConf 2023] Rails as a piece of cake
palkan
53
5k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
28
900
Practical Orchestrator
shlominoach
186
10k
Transcript
Copyright 2019, Informetis Co., Ltd All Rights Reserved 1 Machine
Learning Casual Talks #10 インフォメティス株式会社 蓮尾⾼志 電⼒データ活⽤ビジネス における機械学習技術の 継続的な改善について
Copyright 2019, Informetis Co., Ltd All Rights Reserved ⾃⼰紹介 •
蓮尾 ⾼志(HASUO TAKASHI) • インフォメティス株式会社 • ソニーR&D時代の成果を元にしたエネルギーデータ分析を強 みとするベンチャー企業(2013年創業) • 主にB2B2Cの取引形態 • 東京(⽇本)とケンブリッジ(UK)にオフィス • ハードウェアからアプリまで⼀貫して⾃社開発 • アルゴリズム開発チームのテックリード • 協⼒会社やアルバイトのメンバーを含めると8名くらい • 好きなpython moduleはtqdm 13%|██ | 2/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved お話したいこと •
電⼒データと機械学習(ML)技術について • ビジネスやサービス、技術周辺について簡単にご紹介 • マイナーなデータに対するML技術の改善プロセスについて ※画像・⾳声・NLP等に⽐べてマイナーと位置づけています • 電⼒データに対する研究開発の課題 • 改善プロセスの勘所 • 各種取り組みと得られた知⾒ 20%|████ | 3/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved 事業概要 家の電⼒データ計測
省エネ ⾒守り 進む電化社会を背景に、エネルギーの ⼤元を抑え、次世代の社会インフラへ … etc. 【コア技術】 エネルギーデータを解析し、それを ⽤いた様々な事象を明らかにしていく 26%|██████ | 4/15 【ビジネス】 電⼒会社や住宅等の事業者と提携し、 センサ技術、クラウドPF、分析技術、 各種アプリをB2B2Cで提供中
Copyright 2019, Informetis Co., Ltd All Rights Reserved • ⼀箇所で計測されている電⼒データから、その先で電
⼒消費している各家電の稼働パターンを分離すること リアルタイムな 主幹電⼒データ 機器分離推定技術 各家電ごとの 稼働状況 エアコン エアコン エアコン 電⼦レンジ 電⼦レンジ 洗濯機 24時 kWh 0時 1つだけ! 個別のセンサは不要 Wi-Fi接続 センサ本体 CT電流 計測部 ⼀般家庭の分電盤内部 ← 機械学習技術使ってるところ 機器分離推定とは ある家庭における1⽇の電⼒消費データ
Copyright 2019, Informetis Co., Ltd All Rights Reserved 機器分離推定技術の概要 混ざりあった情報から
個々の情報を細かに分離 800W 200W 0W 0W 0W 分離結果
Copyright 2019, Informetis Co., Ltd All Rights Reserved 機器分離推定技術デモ動画 ↓
センサで観測される値と家電モデルによる値の誤差が少なくなるような家電の稼働組み合わせを推定 ※5倍速再⽣ ※動画は原理実証デモの内容であり、分離される家電等は実際の商⽤版とは異なります
Copyright 2019, Informetis Co., Ltd All Rights Reserved 商⽤サービス基盤(機械学習周りについて) •
課題 • 24時間365⽇アップロードされ続けるセンサー データに対して、それなりにリアルタイム処理 • 通信環境や対象データ等によって負荷が⼀様でない • 実現⽅法 • Kubernetes on GCP • Pub/Subを介して処理開始及び結果通知 • 処理状況に応じてオートスケール • その他 • コンテナイメージ作成まで⾃チームで実施しており、 必要なミドルウェアとか、設計とか、そのへんは⾃ 分達で好きなように構築 • 商⽤環境の処理状況は、Slack通知等で⽇々確認 Cloud Storage Cloud Bigtable Cloud Pub/Sub Container Engine 異常値の疑いがあるセンサ 処理の全体量変化 etc. …
Copyright 2019, Informetis Co., Ltd All Rights Reserved お話したいこと •
電⼒データと機械学習(ML)技術について • ビジネスやサービス、技術周辺について簡単にご紹介 • マイナーなデータに対するML技術の改善プロセスについて ※画像・⾳声・NLP等に⽐べてマイナーと位置づけています • 電⼒データに対する研究開発の課題 • 改善プロセスの勘所 • 各種取り組みと得られた知⾒ 60%|████████████████████ | 9/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved 電⼒データに特有な課題の例 エアコン
エアコン 電⼦レンジ 電⼦レンジ 洗濯機 画像が重なった際の特徴の変化 << 電流が重なった際の特徴の変化 特徴の変化により頑健な機械学習技術が求められることが多い (⼤量のデータを⽤意してとりあえずDeep Learningみたいなアプローチがうまくいかない) キルヒホッフの法則 画像は遮蔽(前景背景)の関係 電流は合算の関係
Copyright 2019, Informetis Co., Ltd All Rights Reserved 電⼒データ解析技術開発の勘所 •
アカデミック分野の知⾒はあてに出来ない • マイナーなので、そもそもあまり⾒つからない… • データ⾃体の特徴だけではなく、物理現象とい ったデータの⽣成過程まで考慮すると⾊々ヒン トが⾒つかったりすることも多い 現象 計測 データ 電流波形 CTセンサ 電気回路 家電タイプ 稼働パターン
Copyright 2019, Informetis Co., Ltd All Rights Reserved タスク・仮説の設定 開発⽤データの整備
評価尺度の定義 特徴抽出の検討 モデルの構築 モデルの評価 結果の解釈 システム統合・評価 新発売の家電 (未知データ・共変量シフト) アプリ次第では誤検出が致命的 (評価尺度の整合性) ロングテールに分布する家庭データ (データ不⾜・偏在) サービス拡⼤やビジネス状況の変化 (計算コスト・優先度の⾒直し) 改善プロセスの繰り返しがますます重要 いかに効率良く回せるかが課題 … 技術改善プロセスについて
Copyright 2019, Informetis Co., Ltd All Rights Reserved [WIP] いかに効率良く改善プロセスを回すか?
アルバイト等 ポテンシャル⼈材 海外ML系⼈材 国内ML系⼈材 ⾃動化容易なこと ⾃動化困難なこと ⼈⼿を増やすしかない! (最適パラメータ探索等) がんばる 20% 80% なかなか 採れない… (マイナー業界だから?) コミュニケーシ ョンの壁 海外案件など分業 (ML技術のコアな部分などで 相互に寄与することもある) タスク切り出しの 内容とかコスト 育成コストや時間 (他スキルで貢献してもらえる ことも多いかもしれない) 楽しい ⼤変だけど やらねば… ⾊々⼯夫した上で 現実的な路線… いかに⾃⾛して もらえるように なるかが鍵? 頑健なML技術の理論⾯など は⼤学教授ら外部頼み (未ラベル活⽤、ベイズ等)
Copyright 2019, Informetis Co., Ltd All Rights Reserved 技術改善プロセスの抑えどころ3点 問題設定の理解
(⼊⼝側) 共通データセットの精査 評価系の整備 課題整理の体裁 (出⼝側) 技術開発の詳細は⾃由 この3つのポイントをチームで抑えておけば、⽐ 較的⾃由に任せておいても、技術改善プロセスを 効率よく継続して回していける(かもしれない) チームで取り組むところ 各⾃の⾃由に任せるところ 最終的にはコンテナに押し込め られてサービスへデプロイする ので、制約もあまり設けない
Copyright 2019, Informetis Co., Ltd All Rights Reserved おわりに •
電⼒データと機械学習技術について紹介した • ニッチで⼿付かずな分野が故に、技術改善のためには⾊々 とやることが多い • 限られたリソースでも、ポイントを抑えておけば、技術改 善を継続することは可能 • 今後の各種プロジェクトについても同様に技術開発をマネ ージしていきたい
Copyright 2019, Informetis Co., Ltd All Rights Reserved ビジネス拡⼤に伴い、採⽤強化中!(機械学習エンジニア以外も)
Copyright 2019, Informetis Co., Ltd All Rights Reserved おしまい ご清聴ありがとうございました