Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
電力データ活用ビジネスにおける機械学習技術の継続的な改善について
Search
hassaku
May 29, 2019
Technology
4
1.2k
電力データ活用ビジネスにおける機械学習技術の継続的な改善について
Machine Learning Casual Talks #10
hassaku
May 29, 2019
Tweet
Share
More Decks by hassaku
See All by hassaku
低コスト低信頼な水位計導入促進ための異常検知システム
hassaku
0
140
NILM Workshop 2017 Vendor Talk
hassaku
0
100
電力データと機械学習 センサ1つでおうちの様子を簡単に見える化
hassaku
0
2.6k
Shinamono Labo #15 Home Automation
hassaku
0
120
TokyoRubyKaigi10
hassaku
5
1.2k
PRML Chapter5 Hessian Matrix
hassaku
1
2k
Other Decks in Technology
See All in Technology
安心してください、日本語使えますよ―Ubuntu日本語Remix提供休止に寄せて― 2024-11-17
nobutomurata
0
900
Going down the RAT hole: Deep dive into the Vuln-derland of APT-class RAT Tools
nttcom
0
490
Intuneお役立ちツールのご紹介
sukank
3
790
誰も全体を知らない ~ ロールの垣根を超えて引き上げる開発生産性 / Boosting Development Productivity Across Roles
kakehashi
1
170
Engineering at LY Corporation
lycorp_recruit_jp
0
800
信頼性に挑む中で拡張できる・得られる1人のスキルセットとは?
ken5scal
2
490
iOS/Androidで同じUI体験をネ イティブで作成する際に気をつ けたい落とし穴
fumiyasac0921
1
100
Making your applications cross-environment - OSCG 2024 NA
salaboy
0
130
Platform Engineering for Software Developers and Architects
syntasso
1
480
テストコード品質を高めるためにMutation Testingライブラリ・Strykerを実戦導入してみた話
ysknsid25
6
2.4k
インフラとバックエンドとフロントエンドをくまなく調べて遅いアプリを早くした件
tubone24
1
410
OCI Vault 概要
oracle4engineer
PRO
0
9.7k
Featured
See All Featured
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.3k
Intergalactic Javascript Robots from Outer Space
tanoku
269
27k
Visualization
eitanlees
145
15k
Facilitating Awesome Meetings
lara
50
6.1k
The Language of Interfaces
destraynor
154
24k
Designing Experiences People Love
moore
138
23k
Building Applications with DynamoDB
mza
90
6.1k
Designing on Purpose - Digital PM Summit 2013
jponch
115
7k
YesSQL, Process and Tooling at Scale
rocio
169
14k
KATA
mclloyd
29
14k
Art, The Web, and Tiny UX
lynnandtonic
297
20k
Mobile First: as difficult as doing things right
swwweet
222
8.9k
Transcript
Copyright 2019, Informetis Co., Ltd All Rights Reserved 1 Machine
Learning Casual Talks #10 インフォメティス株式会社 蓮尾⾼志 電⼒データ活⽤ビジネス における機械学習技術の 継続的な改善について
Copyright 2019, Informetis Co., Ltd All Rights Reserved ⾃⼰紹介 •
蓮尾 ⾼志(HASUO TAKASHI) • インフォメティス株式会社 • ソニーR&D時代の成果を元にしたエネルギーデータ分析を強 みとするベンチャー企業(2013年創業) • 主にB2B2Cの取引形態 • 東京(⽇本)とケンブリッジ(UK)にオフィス • ハードウェアからアプリまで⼀貫して⾃社開発 • アルゴリズム開発チームのテックリード • 協⼒会社やアルバイトのメンバーを含めると8名くらい • 好きなpython moduleはtqdm 13%|██ | 2/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved お話したいこと •
電⼒データと機械学習(ML)技術について • ビジネスやサービス、技術周辺について簡単にご紹介 • マイナーなデータに対するML技術の改善プロセスについて ※画像・⾳声・NLP等に⽐べてマイナーと位置づけています • 電⼒データに対する研究開発の課題 • 改善プロセスの勘所 • 各種取り組みと得られた知⾒ 20%|████ | 3/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved 事業概要 家の電⼒データ計測
省エネ ⾒守り 進む電化社会を背景に、エネルギーの ⼤元を抑え、次世代の社会インフラへ … etc. 【コア技術】 エネルギーデータを解析し、それを ⽤いた様々な事象を明らかにしていく 26%|██████ | 4/15 【ビジネス】 電⼒会社や住宅等の事業者と提携し、 センサ技術、クラウドPF、分析技術、 各種アプリをB2B2Cで提供中
Copyright 2019, Informetis Co., Ltd All Rights Reserved • ⼀箇所で計測されている電⼒データから、その先で電
⼒消費している各家電の稼働パターンを分離すること リアルタイムな 主幹電⼒データ 機器分離推定技術 各家電ごとの 稼働状況 エアコン エアコン エアコン 電⼦レンジ 電⼦レンジ 洗濯機 24時 kWh 0時 1つだけ! 個別のセンサは不要 Wi-Fi接続 センサ本体 CT電流 計測部 ⼀般家庭の分電盤内部 ← 機械学習技術使ってるところ 機器分離推定とは ある家庭における1⽇の電⼒消費データ
Copyright 2019, Informetis Co., Ltd All Rights Reserved 機器分離推定技術の概要 混ざりあった情報から
個々の情報を細かに分離 800W 200W 0W 0W 0W 分離結果
Copyright 2019, Informetis Co., Ltd All Rights Reserved 機器分離推定技術デモ動画 ↓
センサで観測される値と家電モデルによる値の誤差が少なくなるような家電の稼働組み合わせを推定 ※5倍速再⽣ ※動画は原理実証デモの内容であり、分離される家電等は実際の商⽤版とは異なります
Copyright 2019, Informetis Co., Ltd All Rights Reserved 商⽤サービス基盤(機械学習周りについて) •
課題 • 24時間365⽇アップロードされ続けるセンサー データに対して、それなりにリアルタイム処理 • 通信環境や対象データ等によって負荷が⼀様でない • 実現⽅法 • Kubernetes on GCP • Pub/Subを介して処理開始及び結果通知 • 処理状況に応じてオートスケール • その他 • コンテナイメージ作成まで⾃チームで実施しており、 必要なミドルウェアとか、設計とか、そのへんは⾃ 分達で好きなように構築 • 商⽤環境の処理状況は、Slack通知等で⽇々確認 Cloud Storage Cloud Bigtable Cloud Pub/Sub Container Engine 異常値の疑いがあるセンサ 処理の全体量変化 etc. …
Copyright 2019, Informetis Co., Ltd All Rights Reserved お話したいこと •
電⼒データと機械学習(ML)技術について • ビジネスやサービス、技術周辺について簡単にご紹介 • マイナーなデータに対するML技術の改善プロセスについて ※画像・⾳声・NLP等に⽐べてマイナーと位置づけています • 電⼒データに対する研究開発の課題 • 改善プロセスの勘所 • 各種取り組みと得られた知⾒ 60%|████████████████████ | 9/15
Copyright 2019, Informetis Co., Ltd All Rights Reserved 電⼒データに特有な課題の例 エアコン
エアコン 電⼦レンジ 電⼦レンジ 洗濯機 画像が重なった際の特徴の変化 << 電流が重なった際の特徴の変化 特徴の変化により頑健な機械学習技術が求められることが多い (⼤量のデータを⽤意してとりあえずDeep Learningみたいなアプローチがうまくいかない) キルヒホッフの法則 画像は遮蔽(前景背景)の関係 電流は合算の関係
Copyright 2019, Informetis Co., Ltd All Rights Reserved 電⼒データ解析技術開発の勘所 •
アカデミック分野の知⾒はあてに出来ない • マイナーなので、そもそもあまり⾒つからない… • データ⾃体の特徴だけではなく、物理現象とい ったデータの⽣成過程まで考慮すると⾊々ヒン トが⾒つかったりすることも多い 現象 計測 データ 電流波形 CTセンサ 電気回路 家電タイプ 稼働パターン
Copyright 2019, Informetis Co., Ltd All Rights Reserved タスク・仮説の設定 開発⽤データの整備
評価尺度の定義 特徴抽出の検討 モデルの構築 モデルの評価 結果の解釈 システム統合・評価 新発売の家電 (未知データ・共変量シフト) アプリ次第では誤検出が致命的 (評価尺度の整合性) ロングテールに分布する家庭データ (データ不⾜・偏在) サービス拡⼤やビジネス状況の変化 (計算コスト・優先度の⾒直し) 改善プロセスの繰り返しがますます重要 いかに効率良く回せるかが課題 … 技術改善プロセスについて
Copyright 2019, Informetis Co., Ltd All Rights Reserved [WIP] いかに効率良く改善プロセスを回すか?
アルバイト等 ポテンシャル⼈材 海外ML系⼈材 国内ML系⼈材 ⾃動化容易なこと ⾃動化困難なこと ⼈⼿を増やすしかない! (最適パラメータ探索等) がんばる 20% 80% なかなか 採れない… (マイナー業界だから?) コミュニケーシ ョンの壁 海外案件など分業 (ML技術のコアな部分などで 相互に寄与することもある) タスク切り出しの 内容とかコスト 育成コストや時間 (他スキルで貢献してもらえる ことも多いかもしれない) 楽しい ⼤変だけど やらねば… ⾊々⼯夫した上で 現実的な路線… いかに⾃⾛して もらえるように なるかが鍵? 頑健なML技術の理論⾯など は⼤学教授ら外部頼み (未ラベル活⽤、ベイズ等)
Copyright 2019, Informetis Co., Ltd All Rights Reserved 技術改善プロセスの抑えどころ3点 問題設定の理解
(⼊⼝側) 共通データセットの精査 評価系の整備 課題整理の体裁 (出⼝側) 技術開発の詳細は⾃由 この3つのポイントをチームで抑えておけば、⽐ 較的⾃由に任せておいても、技術改善プロセスを 効率よく継続して回していける(かもしれない) チームで取り組むところ 各⾃の⾃由に任せるところ 最終的にはコンテナに押し込め られてサービスへデプロイする ので、制約もあまり設けない
Copyright 2019, Informetis Co., Ltd All Rights Reserved おわりに •
電⼒データと機械学習技術について紹介した • ニッチで⼿付かずな分野が故に、技術改善のためには⾊々 とやることが多い • 限られたリソースでも、ポイントを抑えておけば、技術改 善を継続することは可能 • 今後の各種プロジェクトについても同様に技術開発をマネ ージしていきたい
Copyright 2019, Informetis Co., Ltd All Rights Reserved ビジネス拡⼤に伴い、採⽤強化中!(機械学習エンジニア以外も)
Copyright 2019, Informetis Co., Ltd All Rights Reserved おしまい ご清聴ありがとうございました