機械学習技術を製造の現場で活用するために / How Machine Learning Technology is Used in Manufacturing

機械学習技術を製造の現場で活⽤するために三菱ケミカルホールディングスグループデータ＆先端技術部データサイエンスグループ画像解析CoEリード伊藤優 0 2022/6/3 16:40-17:20
WiDS Tokyo @ IBM 2022

⾃⼰紹介 • 名前：伊藤優（いとうゆう） • 専⾨：情報理⼯学修⼠（機械学習理論）、機械学習運⽤（XAI、MLOps） • 現職：機械学習システムの現場導⼊
• 経歴：出典：データサイエンティスト協会⼤学院修⼠機械学習研究者 SIer インフラエンジニア総合化学画像解析エンジニア

現在の仕事 • グループ全体のデータおよび先端技術活⽤推進取締役会監査委員会戦略法務／総務／⼈事監査ファイナ
ンスイノベーションデジタルサプライチェーン PC／ MMA FM／ AS ⽯化／炭素ファーマ産業ガス CEO インフォメーションシステム＆テクノロジー本部ビジネストランスフォーメーション部データ＆先端技術部 https://www.mitsubishichem-hd.co.jp/group/organization.html

AIプロジェクトはPoC⽌まり？ PwC Japan『2022年AI予測』https://www.pwc.com/jp/ja/knowledge/thoughtleadership/2022-ai- predictions.html 以前に⽐べると導⼊は進んでいるがやはり……

なかなか現場で活⽤できない機械学習なんとなく使えそうな機械学習モデル現場で利⽤される機械学習モデル精度98％？使えませんよ。検査の⾒逃しは0％でないと。アラートだけ出されても。
現場の感覚と合わないので信⽤できません。

今⽇話すこと機械学習システムが現場で活⽤されるまでに実際に現場で起こったこと企画 PoC 実地検証開発運⽤保守
『機械学習応⽤システムのプロジェクト管理と組織』本橋洋介

例題最終製品をマイクロスコープで観察し、⽋陥がないかを⽬視で判定している。⾃動化したい。確認OK（出荷）確認NG（廃棄orリサイクル） ※このあと登場する状況設定・数値などはすべて架空のもので、特定の現場の実際の状況を⽰すものではありません。

機械学習の担当者になったつもりで考えてみてください。現場の⽅に何をヒアリングしますか？ Q1. 企画 PoC 実地検証開発運⽤保守

A1. 企画 PoC 実地検証開発運⽤保守 • ヒヤリングの内容例
データに関すること具体的なデータの形式正解ラベルの有無⾃動撮像がどのくらい可能か評価基準に関すること OK/NGの基準は何で決まっているか（⼈材育成マニュアルはあるか）導⼊効果に関すること既存検査において、⽬視にかかる時間（1件あたりの時間や、1⽇あたりの件数）既存検査において、検査員の教育にかかる時間実際の使い⽅に関すること機械学習の結果をどのように活⽤したいか・検査員の判断を⽀援したい・1次スクリーニングをしたい・完全⾃動化したい実⾏環境に関することデータのアップロードが可能か実⾏頻度や実⾏時間の限度

ヒアリング結果 • 実際のデータはどのように保管されていますか？企画 PoC 実地検証開発運⽤保守
報告⽤にpptにまとめています。それ以外は保管していません。製品A lot ID:XXX Point1: OK Point2: NG 汚れ • 画像を蓄積していく仕組みが必要 • NG箇所のマーキングをデジタルデータ化する仕組みが必要

ヒアリング結果 • OK/NGの基準は何で決まっていますか？マニュアルはありますか？企画 PoC 実地検証開発運⽤保守
厳密なマニュアルはありません。新規⼈材教育のために、簡単な限度⾒本はありますが、その後は実際の検査を通して、場当たり的に基準を学びます。 • 限度⾒本を参考に、ラベルの種類を決定し、データをラベル付けしていただく限度⾒本 ◦◦キズ 1つでもあればNG ◦◦汚れ左記より薄い場合はNGとしないへこみ NGではない

ヒアリング結果 • 予測結果を誰がどのように使うと、どのように効果がありますか？企画 PoC 実地検証開発運⽤保守
現状、1⽇300個ほど⽬視で確認する必要があります。製品1つをマイクロスコープにセットして撮影するのに2分かかります。画像が取れればOKかNGかの判定は10秒ほどで判断することが多いですが、迷う場合には上司に確認したりして半⽇ほどかかることもあります。 OK NG 2分半⽇ OK NG 判定難 OK NG Step1: 検査員の判定⽀援 AIの判定を確認することで、検査員が判断に⾃信を持てる。 300個 Step2: 1次スクリーニング AIが⾃信を持てないもののみを検査員が判定することで、検査の⼯数を削減する。

機械学習プロジェクトキャンバス • ヒアリングポイントを明確にするためのフレームワークを公開企画 PoC 実地検証開発運⽤保守
https://www.mitsubishichem-hd.co.jp/news_release/pdf/190718.pdf

機械学習プロジェクトキャンバス企画 PoC 実地検証開発運⽤保守

機械学習プロジェクトキャンバス企画 PoC 実地検証開発運⽤保守画像と OK/NGラベル
（箇所も含む）のペア⽬視検査の⾃動化検査員が予測結果を確認し、判断に活かす判断⽀援による判定の属⼈性の排除検査員が迷うような難しい判定に関して、素早くそこそこの精度で予測結果を返す

Q2. 画像データとラベルデータがある程度たまりました。どんな機械学習モデルを構築しますか？企画 PoC 実地検証開発運⽤保守

A2. • 代表的な課題設定から今回に合うものを選択企画 PoC 実地検証開発運⽤保守
Car Score : 〇〇情報量 / 難易度汎⽤ソフト画像分類・回帰物体認識セグメンテーション画像出典：What Uncertainties Do We Need in Bayesian Deep Learning for Computer Vision? https://arxiv.org/abs/1703.04977

モデル学習結果 • 矩形とNGスコアを出⼒するモデルが完成企画 PoC 実地検証開発運⽤保守
NGスコア⼤⼩ OK NG To Be Confirmed ※表⾯画像 OK（-13.56） OK（-11.23） TBC（-2.60） TBC（5.43） NG（15.76）

モデル学習結果 • 矩形とNGスコアを出⼒するモデルが完成企画 PoC 実地検証開発運⽤保守
NGスコア⼤⼩ OK NG To Be Confirmed Step1: 検査員の判定⽀援この出⼒を検査員に⾒せることで、判断⽀援に活かせそう。 Step2: ⼀次スクリーニング NGが1つもなければOKとする。 NG/TBCがあれば⽬視確認する。 OK（-13.56） OK（-11.23） TBC（-2.60） TBC（5.43） NG（15.76）

Q3. そこそこのモデルはできましたが、現場の⽅は「導⼊するにはなんとなく不安がある」と⾔っています。この不安の原因として何が考えられるでしょうか？企画 PoC 実地検証開発運⽤
保守

A3. 企画 PoC 実地検証開発運⽤保守 • 不安の原因の例
評価指標に関することテストデータは⼗分か評価指標は適切か精度に関することまだもう少し上がるのか少し気になる誤判定があるが影響ないのかシステム開発に関すること具体的なUIのイメージがわいていない業務フローが変わるのか多額の予算が必要？システム運⽤に関すること新しいデータに対してモデルが合わなくなってきたらどうするか効果を実感できる最⼩限のプロトタイプを爆速で出現させることが重要 →実地検証へ決めの問題だが、難航する場合もある

不安解消フェーズ企画 PoC 実地検証開発運⽤保守 • 精度：モデル可視化→微調整→再学習を繰り返して向上させる
• 精度100％にはならないが、現場との信頼関係を醸成できる精度労⼒特徴空間マッピング説明ヒートマップ（例：Grad-CAM）再学習可視化可視化 OK NG OKとNGの間にある画像（＝まぎらわしい画像）の特徴を⾒定め、再学習画像の中でNG判定と相関が強い部分を可視化 →⼈の知⾒との差分から、モデルを調整、再学習 Grad-CAM https://arxiv.org/abs/1610.02391 Tensorbord Projector https://yag-ays.github.io/project/embedding-visualization/

不安解消フェーズ企画 PoC 実地検証開発運⽤保守 • 評価指標：テスト指標の研究も進んでいる
• ⼀⽅で、最終的には課題に合わせて当事者が適切に選択する必要がある DeepMutation https://arxiv.org/pdf/1805.05206.pdf DeepGauge https://arxiv.org/abs/1803.07519 DeepMutation 深層学習モデルのテストに必要なテストケースを提案。例）テストデータに下記のような摂動を加えても、結果が変化しないこと DeepGauge テストデータを⼊れた際に発⽕するニューロンの割合をカバレッジと定義。カバレッジを⾼めるデータセットが良い※データセットであり、Mutationと組み合わせることで良いデータセットを⽣成できる。 ※ Adversary Attackの⼿法でデータを増やすとカバレッジが⾼まることがあり、カバレッジはテストデータ群の網羅性を表すと考えられる。

実地検証企画 PoC 実地検証開発運⽤保守 • 爆速プロトタイピング
①現場の⽅にモデルの予測を返す（現場で実⾏すると予測結果が返る） ②予測が想定と異なる部分があれば、その場で修正する ③修正データを学習可能な形式で蓄積する ④データがたまったら再学習するループを作ることで、・現場で素早くモデルを試せる・継続的に精度向上できる導⼊のハードルを下げる ↓

Q4. 判定⽀援AIとして現場に定着してきました。今後は本格的に1次スクリーニングに進みたいと思います。検査⼿法の変更を、顧客に説明する必要はあるでしょうか？また、本番運⽤向けにシステム補強は必要でしょうか？企画 PoC 実地検証開発
保守運⽤

A4.顧客説明企画 PoC 実地検証開発保守運⽤ • 顧客と品質保証上合意している枠組みの例
• 品質保証の”5M” 変更前 Man（⼈）⼿順書XXXの⼿順で画像を撮影、およびOK/NG判定 Machine（機械）マイクロスコープXXXを⽤いて撮影 Method（⽅法） Machineで撮影された画像を Measurementにて判断 Material（材料）材料XXX Measurement（検査/測定）⽬視で判定変更後 AIで1次スクリーニング、まぎらわしいものは⽬視で判定 5M変更申請申請には、ドメインに根付いた様々な知識や、顧客との関係性が必要参考：5Mの管理 https://www.sk-quality.com/idea/idea05_5M.html など

A4.システム運⽤企画 PoC 実地検証開発保守運⽤ • MLOps：継続的デリバリーと⾃動化
• コードとモデルとデータを継続的に管理 https://qiita.com/noko_qii/items/d2c36b0b22ab0da6c759 https://mlflow.org/ 管理ツールの例

A4.システム運⽤企画 PoC 実地検証開発保守運⽤ • MLOps：継続的デリバリーと⾃動化
• パイプライン管理 https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning?hl=ja 標準基盤を定め、標準化されたルールに従い実装することで、横展開を可能にするパイプラインの成熟度 • MLOps level 0: Manual process • ⼿動 • MLOps level 2: ML pipeline automation • 関数ごとに⾃動実⾏ • MLOps level 3: CI/CD pipeline automation • 監視なども含めシステムを⾃動制御管理ツールの例

AIシステムの品質保証企画 PoC 実地検証開発保守運⽤ • QA4AI（AIプロダクト品質保証ガイドライン）
• Data Integrity（データ量/質） • Model Robustness（モデル精度/頑健性） • System Quality（システム全体の品質） • Process Agility（モデルの変更可能性） • Customer Expectation（顧客との関係） QA4AI http://www.qa4ai.jp/QA4AI.Guideline.202008.pdf Data Integrity の⼀部

AIシステムの品質保証企画 PoC 実地検証開発保守運⽤ • QA4AI（AIプロダクト品質保証ガイドライン）
• Data Integrity（データ量/質） • Model Robustness（モデル精度/頑健性） • System Quality（システム全体の品質） • Process Agility（モデルの変更可能性） • Customer Expectation（顧客との関係） QA4AI http://www.qa4ai.jp/QA4AI.Guideline.202008.pdf

社外との情報交換、学術的貢献 • 機械学習⼯学研究会（MLSE）機械学習を組み込んだシステムの開発・運⽤を検討⽇本ソフトウェア科学会の公式研究会として発⾜（2018年〜）可視化テスト⼿法事例研究 SHAP https://arxiv.org/abs/1602.04938
Grad-CAM https://arxiv.org/abs/1610.02391 DeepMutation https://arxiv.org/pdf/1805.05206.pdf DeepGauge https://arxiv.org/a bs/1803.07519 テストケース⽣成評価指標構築各種フレームワークを⽤いた事例のクラスタリング運⽤Tipsの整理 https://www.jstage.jst.go.jp/article/jsaisigtwo/2020 /KSN-026/2020_03/_article/-char/ja/

DXプロジェクト実⾏にどのような⼈材が必要？ • DXスキルツリー DXプロジェクトの各フェーズキャリアパス https://qiita.com/shore/items/555fbf706b36315e81f1 必要な⼈材がわかる⾝に着けるべきスキル＆キャリアパスがわかる

DXプロジェクト実⾏にどのような⼈材が必要？ • DXスキルツリー • DXの流れと登場⼈物を整理 https://qiita.com/shore/items/555fbf706b36315e81f1

DXプロジェクト実⾏にどのような⼈材が必要？ • DXスキルツリー https://qiita.com/shore/items/555fbf706b36315e81f1 個々の職業を説明

まとめ • さまざまな壁を乗り越えて、製造の現場でもAI活⽤は進んでいる • AI活⽤を進めるには、技術だけではない様々な側⾯への考慮が必要 • 様々な専⾨家の英知を結集する必要があるご質問等あれば、Slidoなどでお気軽コメントくださいぜひご⼀緒に議論しましょう

機械学習技術を製造の現場で活用するために / How Machine Learning Tec...

機械学習技術を製造の現場で活用するために / How Machine Learning Technology is Used in Manufacturing

wids-tky-i

More Decks by wids-tky-i

Other Decks in Technology

Featured

Transcript

機械学習技術を製造の現場で活⽤するために三菱ケミカルホールディングスグループデータ＆先端技術部データサイエンスグループ画像解析CoEリード伊藤優 0 2022/6/3 16:40-17:20

⾃⼰紹介 • 名前：伊藤優（いとうゆう） • 専⾨：情報理⼯学修⼠（機械学習理論）、機械学習運⽤（XAI、MLOps） • 現職：機械学習システムの現場導⼊

現在の仕事 • グループ全体のデータおよび先端技術活⽤推進取締役会監査委員会戦略法務／総務／⼈事監査ファイナ

AIプロジェクトはPoC⽌まり？ PwC Japan『2022年AI予測』https://www.pwc.com/jp/ja/knowledge/thoughtleadership/2022-ai- predictions.html 以前に⽐べると導⼊は進んでいるがやはり……

なかなか現場で活⽤できない機械学習なんとなく使えそうな機械学習モデル現場で利⽤される機械学習モデル精度98％？使えませんよ。検査の⾒逃しは0％でないと。アラートだけ出されても。

今⽇話すこと機械学習システムが現場で活⽤されるまでに実際に現場で起こったこと企画 PoC 実地検証開発運⽤保守

機械学習の担当者になったつもりで考えてみてください。現場の⽅に何をヒアリングしますか？ Q1. 企画 PoC 実地検証開発運⽤保守

A1. 企画 PoC 実地検証開発運⽤保守 • ヒヤリングの内容例

ヒアリング結果 • 実際のデータはどのように保管されていますか？企画 PoC 実地検証開発運⽤保守

ヒアリング結果 • OK/NGの基準は何で決まっていますか？マニュアルはありますか？企画 PoC 実地検証開発運⽤保守

ヒアリング結果 • 予測結果を誰がどのように使うと、どのように効果がありますか？企画 PoC 実地検証開発運⽤保守

機械学習プロジェクトキャンバス • ヒアリングポイントを明確にするためのフレームワークを公開企画 PoC 実地検証開発運⽤保守

機械学習プロジェクトキャンバス企画 PoC 実地検証開発運⽤保守

機械学習プロジェクトキャンバス企画 PoC 実地検証開発運⽤保守画像と OK/NGラベル

Q2. 画像データとラベルデータがある程度たまりました。どんな機械学習モデルを構築しますか？企画 PoC 実地検証開発運⽤保守

A2. • 代表的な課題設定から今回に合うものを選択企画 PoC 実地検証開発運⽤保守

モデル学習結果 • 矩形とNGスコアを出⼒するモデルが完成企画 PoC 実地検証開発運⽤保守

モデル学習結果 • 矩形とNGスコアを出⼒するモデルが完成企画 PoC 実地検証開発運⽤保守

Q3. そこそこのモデルはできましたが、現場の⽅は「導⼊するにはなんとなく不安がある」と⾔っています。この不安の原因として何が考えられるでしょうか？企画 PoC 実地検証開発運⽤

A3. 企画 PoC 実地検証開発運⽤保守 • 不安の原因の例

不安解消フェーズ企画 PoC 実地検証開発運⽤保守 • 精度：モデル可視化→微調整→再学習を繰り返して向上させる

不安解消フェーズ企画 PoC 実地検証開発運⽤保守 • 評価指標：テスト指標の研究も進んでいる

実地検証企画 PoC 実地検証開発運⽤保守 • 爆速プロトタイピング

A4.顧客説明企画 PoC 実地検証開発保守運⽤ • 顧客と品質保証上合意している枠組みの例

A4.システム運⽤企画 PoC 実地検証開発保守運⽤ • MLOps：継続的デリバリーと⾃動化

A4.システム運⽤企画 PoC 実地検証開発保守運⽤ • MLOps：継続的デリバリーと⾃動化

AIシステムの品質保証企画 PoC 実地検証開発保守運⽤ • QA4AI（AIプロダクト品質保証ガイドライン）

AIシステムの品質保証企画 PoC 実地検証開発保守運⽤ • QA4AI（AIプロダクト品質保証ガイドライン）

DXプロジェクト実⾏にどのような⼈材が必要？ • DXスキルツリー DXプロジェクトの各フェーズキャリアパス https://qiita.com/shore/items/555fbf706b36315e81f1 必要な⼈材がわかる⾝に着けるべきスキル＆キャリアパスがわかる

DXプロジェクト実⾏にどのような⼈材が必要？ • DXスキルツリー • DXの流れと登場⼈物を整理 https://qiita.com/shore/items/555fbf706b36315e81f1

DXプロジェクト実⾏にどのような⼈材が必要？ • DXスキルツリー https://qiita.com/shore/items/555fbf706b36315e81f1 個々の職業を説明