Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
電力データ活用ビジネスにおける機械学習技術の継続的な改善について
Search
hassaku
May 29, 2019
Technology
4
1.2k
電力データ活用ビジネスにおける機械学習技術の継続的な改善について
Machine Learning Casual Talks #10
hassaku
May 29, 2019
Tweet
Share
More Decks by hassaku
See All by hassaku
低コスト低信頼な水位計導入促進ための異常検知システム
hassaku
0
160
NILM Workshop 2017 Vendor Talk
hassaku
0
110
電力データと機械学習 センサ1つでおうちの様子を簡単に見える化
hassaku
0
2.7k
Shinamono Labo #15 Home Automation
hassaku
0
130
TokyoRubyKaigi10
hassaku
5
1.2k
PRML Chapter5 Hessian Matrix
hassaku
1
2k
Other Decks in Technology
See All in Technology
AWSサービスアップデート2025年2月分
yuobayashi
2
110
セキュリティグループの”タイプ”を改めて考えてみる
masakiokuda
0
130
TDSE_20250311_AIxIoTビジネス共創ラボ第2回勉強会_発表資料.pdf
iotcomjpadmin
0
180
OPENLOGI Company Profile
hr01
0
60k
プロダクト開発者目線での Entra ID 活用
sansantech
PRO
0
310
ライフステージの変化を乗り越える 探索型のキャリア選択
tenshoku_draft
2
600
社内限定だった「ChatGPTオペレーター勉強会」の極秘資料を無料で特別公開
tenho7_kodama
1
100
OSSの実装を参考にBedrockエージェントを作る
moritalous
2
430
Cloudflare Pages 4年使って分かった良さと注意点
kyosuke
0
170
# Azure Cosmos DB パフォーマンス最適化入門 - 設計・開発・運用の実践テクニック
shibayan
0
160
x86-64 Assembly Essentials
latte72
4
1.1k
Microsoft_20250311_第2回AI_IoT共創ラボ.pdf
iotcomjpadmin
0
340
Featured
See All Featured
Building an army of robots
kneath
303
45k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
Measuring & Analyzing Core Web Vitals
bluesmoon
6
280
Why Our Code Smells
bkeepers
PRO
336
57k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
11
1.4k
Large-scale JavaScript Application Architecture
addyosmani
511
110k
A Tale of Four Properties
chriscoyier
158
23k
A Modern Web Designer's Workflow
chriscoyier
693
190k
The World Runs on Bad Software
bkeepers
PRO
67
11k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
8
680
Transcript
Copyright 2019, Informetis Co., Ltd All Rights Reserved 1 Machine
Learning Casual Talks #10 インフォメティス株式会社 蓮尾⾼志 電⼒データ活⽤ビジネス における機械学習技術の 継続的な改善について
Copyright 2019, Informetis Co., Ltd All Rights Reserved ⾃⼰紹介 •
蓮尾 ⾼志(HASUO TAKASHI) • インフォメティス株式会社 • ソニーR&D時代の成果を元にしたエネルギーデータ分析を強 みとするベンチャー企業(2013年創業) • 主にB2B2Cの取引形態 • 東京(⽇本)とケンブリッジ(UK)にオフィス • ハードウェアからアプリまで⼀貫して⾃社開発 • アルゴリズム開発チームのテックリード • 協⼒会社やアルバイトのメンバーを含めると8名くらい • 好きなpython moduleはtqdm 13%|██ | 2/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved お話したいこと •
電⼒データと機械学習(ML)技術について • ビジネスやサービス、技術周辺について簡単にご紹介 • マイナーなデータに対するML技術の改善プロセスについて ※画像・⾳声・NLP等に⽐べてマイナーと位置づけています • 電⼒データに対する研究開発の課題 • 改善プロセスの勘所 • 各種取り組みと得られた知⾒ 20%|████ | 3/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved 事業概要 家の電⼒データ計測
省エネ ⾒守り 進む電化社会を背景に、エネルギーの ⼤元を抑え、次世代の社会インフラへ … etc. 【コア技術】 エネルギーデータを解析し、それを ⽤いた様々な事象を明らかにしていく 26%|██████ | 4/15 【ビジネス】 電⼒会社や住宅等の事業者と提携し、 センサ技術、クラウドPF、分析技術、 各種アプリをB2B2Cで提供中
Copyright 2019, Informetis Co., Ltd All Rights Reserved • ⼀箇所で計測されている電⼒データから、その先で電
⼒消費している各家電の稼働パターンを分離すること リアルタイムな 主幹電⼒データ 機器分離推定技術 各家電ごとの 稼働状況 エアコン エアコン エアコン 電⼦レンジ 電⼦レンジ 洗濯機 24時 kWh 0時 1つだけ! 個別のセンサは不要 Wi-Fi接続 センサ本体 CT電流 計測部 ⼀般家庭の分電盤内部 ← 機械学習技術使ってるところ 機器分離推定とは ある家庭における1⽇の電⼒消費データ
Copyright 2019, Informetis Co., Ltd All Rights Reserved 機器分離推定技術の概要 混ざりあった情報から
個々の情報を細かに分離 800W 200W 0W 0W 0W 分離結果
Copyright 2019, Informetis Co., Ltd All Rights Reserved 機器分離推定技術デモ動画 ↓
センサで観測される値と家電モデルによる値の誤差が少なくなるような家電の稼働組み合わせを推定 ※5倍速再⽣ ※動画は原理実証デモの内容であり、分離される家電等は実際の商⽤版とは異なります
Copyright 2019, Informetis Co., Ltd All Rights Reserved 商⽤サービス基盤(機械学習周りについて) •
課題 • 24時間365⽇アップロードされ続けるセンサー データに対して、それなりにリアルタイム処理 • 通信環境や対象データ等によって負荷が⼀様でない • 実現⽅法 • Kubernetes on GCP • Pub/Subを介して処理開始及び結果通知 • 処理状況に応じてオートスケール • その他 • コンテナイメージ作成まで⾃チームで実施しており、 必要なミドルウェアとか、設計とか、そのへんは⾃ 分達で好きなように構築 • 商⽤環境の処理状況は、Slack通知等で⽇々確認 Cloud Storage Cloud Bigtable Cloud Pub/Sub Container Engine 異常値の疑いがあるセンサ 処理の全体量変化 etc. …
Copyright 2019, Informetis Co., Ltd All Rights Reserved お話したいこと •
電⼒データと機械学習(ML)技術について • ビジネスやサービス、技術周辺について簡単にご紹介 • マイナーなデータに対するML技術の改善プロセスについて ※画像・⾳声・NLP等に⽐べてマイナーと位置づけています • 電⼒データに対する研究開発の課題 • 改善プロセスの勘所 • 各種取り組みと得られた知⾒ 60%|████████████████████ | 9/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved 電⼒データに特有な課題の例 エアコン
エアコン 電⼦レンジ 電⼦レンジ 洗濯機 画像が重なった際の特徴の変化 << 電流が重なった際の特徴の変化 特徴の変化により頑健な機械学習技術が求められることが多い (⼤量のデータを⽤意してとりあえずDeep Learningみたいなアプローチがうまくいかない) キルヒホッフの法則 画像は遮蔽(前景背景)の関係 電流は合算の関係
Copyright 2019, Informetis Co., Ltd All Rights Reserved 電⼒データ解析技術開発の勘所 •
アカデミック分野の知⾒はあてに出来ない • マイナーなので、そもそもあまり⾒つからない… • データ⾃体の特徴だけではなく、物理現象とい ったデータの⽣成過程まで考慮すると⾊々ヒン トが⾒つかったりすることも多い 現象 計測 データ 電流波形 CTセンサ 電気回路 家電タイプ 稼働パターン
Copyright 2019, Informetis Co., Ltd All Rights Reserved タスク・仮説の設定 開発⽤データの整備
評価尺度の定義 特徴抽出の検討 モデルの構築 モデルの評価 結果の解釈 システム統合・評価 新発売の家電 (未知データ・共変量シフト) アプリ次第では誤検出が致命的 (評価尺度の整合性) ロングテールに分布する家庭データ (データ不⾜・偏在) サービス拡⼤やビジネス状況の変化 (計算コスト・優先度の⾒直し) 改善プロセスの繰り返しがますます重要 いかに効率良く回せるかが課題 … 技術改善プロセスについて
Copyright 2019, Informetis Co., Ltd All Rights Reserved [WIP] いかに効率良く改善プロセスを回すか?
アルバイト等 ポテンシャル⼈材 海外ML系⼈材 国内ML系⼈材 ⾃動化容易なこと ⾃動化困難なこと ⼈⼿を増やすしかない! (最適パラメータ探索等) がんばる 20% 80% なかなか 採れない… (マイナー業界だから?) コミュニケーシ ョンの壁 海外案件など分業 (ML技術のコアな部分などで 相互に寄与することもある) タスク切り出しの 内容とかコスト 育成コストや時間 (他スキルで貢献してもらえる ことも多いかもしれない) 楽しい ⼤変だけど やらねば… ⾊々⼯夫した上で 現実的な路線… いかに⾃⾛して もらえるように なるかが鍵? 頑健なML技術の理論⾯など は⼤学教授ら外部頼み (未ラベル活⽤、ベイズ等)
Copyright 2019, Informetis Co., Ltd All Rights Reserved 技術改善プロセスの抑えどころ3点 問題設定の理解
(⼊⼝側) 共通データセットの精査 評価系の整備 課題整理の体裁 (出⼝側) 技術開発の詳細は⾃由 この3つのポイントをチームで抑えておけば、⽐ 較的⾃由に任せておいても、技術改善プロセスを 効率よく継続して回していける(かもしれない) チームで取り組むところ 各⾃の⾃由に任せるところ 最終的にはコンテナに押し込め られてサービスへデプロイする ので、制約もあまり設けない
Copyright 2019, Informetis Co., Ltd All Rights Reserved おわりに •
電⼒データと機械学習技術について紹介した • ニッチで⼿付かずな分野が故に、技術改善のためには⾊々 とやることが多い • 限られたリソースでも、ポイントを抑えておけば、技術改 善を継続することは可能 • 今後の各種プロジェクトについても同様に技術開発をマネ ージしていきたい
Copyright 2019, Informetis Co., Ltd All Rights Reserved ビジネス拡⼤に伴い、採⽤強化中!(機械学習エンジニア以外も)
Copyright 2019, Informetis Co., Ltd All Rights Reserved おしまい ご清聴ありがとうございました