2020/7/31(金) に開催したExploratory データサイエンス勉強会#14の株式会社 日立ドキュメントソリューションズ様のご登壇資料です。
© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2020/07/31日立ドキュメントソリューションズ新事業戦略推進本部湯山咲子作業品質向上のためのロジスティック回帰を使った分析事例
View Slide
© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.1. 弊社のご紹介2. 作業品質向上のためのロジスティック回帰を使った分析事例Contents1
© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.1. 弊社のご紹介2. 作業品質向上のためのロジスティック回帰を使った分析事例Contents2
3© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.1. 弊社のご紹介日立ドキュメントソリューションズ主要4事業• コミュニケーション支援事業広告作成、企業PR動画作成• オフィスワーク支援事業オフィス構築• モノづくり支援事業プロジェクトマネジメント支援• IT支援事業業務システム構築、保守、運用設立 1955年 10月代表者 取締役社長 荻原 淳資本金 4億5千万円(日立製作所100%)連結売上高 320億円(2020年3月期)連結従業員 1,508名(2020年3月末現在)本社 東京都江東区東陽六丁目3番2号 イースト21タワー
4© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.1. 弊社のご紹介日立ドキュメントソリューションズ主要4事業• コミュニケーション支援事業広告作成、企業PR動画作成• オフィスワーク支援事業オフィス構築• モノづくり支援事業プロジェクトマネジメント支援• IT支援事業業務システム構築、保守、運用設立 1955年 10月代表者 取締役社長 荻原 淳資本金 4億5千万円(日立製作所100%)連結売上高 320億円(2020年3月期)連結従業員 1,508名(2020年3月末現在)本社 東京都江東区東陽六丁目3番2号 イースト21タワー現場の近くで様々な支援事業を展開してきた我々だからこそできるデータ分析サービスの展開を目指しチームで奮闘中!
© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.1. 弊社のご紹介2. 作業品質向上のためのロジスティック回帰を使った分析事例Contents5
6© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.データを活用しエラー発生傾向を分析することで、エラー削減施策に結び付く示唆を得られるか?2. 作業品質向上のためのロジスティック回帰を使った分析事例分析の背景、目的※本資料内のエラー数値は、弊社内の製作工程で確認した件数です社内のある作業について、納品前チェックで発見されるエラーを削減したい!
7© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.書類をスキャン 納品前チェック 納品エラー手戻り2. 作業品質向上のためのロジスティック回帰を使った分析事例分析対象の作業書類スキャン作業時のデータを用い、エラー削減(=手戻り工数の削減)につながる示唆を得たい。
8© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.いつの作業?作業者は誰?エラー発生あり?なし?勤続年数は?勤務体系は?① 作業記録データ作業1件単位の記録が含まれるデータ約16,000行(=作業件数)② 作業者名簿作業者一人単位の属性情報が含まれるデータ約30行(=従事者数)2. 作業品質向上のためのロジスティック回帰を使った分析事例分析データ分析に用いるデータは2種類。①に②を結合し、分析用データを作成。
9© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.データの概要を掴む- エラーに相関のある変数は?- エラー発生時の特徴は?2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことサマリビュー アナリティクスロジスティック回帰因果関係を探る-エラー発生への影響が高い変数は?ロジスティック回帰分析の実施
10© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.目的変数とするカラム。エラーあり(TRUE)は全体の8%程度。サマリビュー2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したこと
11© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.データへの理解を深めるために、エラー発生と各カラムの相関関係を確認2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことサマリビュー
12© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したこと作業時間=AUC 0.8051サマリビュー
13© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことロジスティック回帰へサマリビュー
14© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したこと作業時間の他に、エラーへ影響が高い変数は何か?影響度合いを確認したい説明変数を追加。②作業者名簿の変数①作業記録データの変数サマリビューアナリティクスロジスティック回帰
15© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したこと選択した変数間に強い相関関係がないか多重共線性で確認サマリビューアナリティクスロジスティック回帰
16© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことサマリを確認。エラーの検出率が低く、チューニングが必要。サマリビューアナリティクスロジスティック回帰
17© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことサマリビューアナリティクスロジスティック回帰予測マトリクスを見ると、エラーが発生しないことを予測できる率は高いが他の予測率が低いことが分かる。とりあえずFALSEと言っておけば当たるモデルに・・・肝心なエラーを予測できない!ここを上げたい
18© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことここで振り返ると、そもそもエラー件数はデータ全体の8%だった→全体の中で占めるエラー件数が少なく偏りがある状態。サマリビューアナリティクスロジスティック回帰予測マトリクスを見ると、エラーが発生しないことを予測できる率は高いが他の予測率が低いことが分かる。とりあえずFALSEと言っておけば当たるモデルに・・・肝心なエラーを予測できない!ここを上げたい
19© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことデータの不均衡を調整し、TRUEとFALSEの割合を均衡に近づけるエラーの検出率が向上!サマリビューアナリティクスロジスティック回帰
20© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことカットポイントは0.5から0.3へ変更不均衡調整前サマリビューアナリティクスロジスティック回帰
21© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したこと調整前調整後サマリビューアナリティクスロジスティック回帰閾値などを調整し、現状のデータから出せる、最適なモデルとして選択。
22© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したことエラーの発生に影響を与えている変数は何か?→ダントツで作業時間が高い。サマリビューアナリティクスロジスティック回帰
23© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したこと作業時間が増えると、エラーに繋がりやすそうであるサマリビューアナリティクスロジスティック回帰
24© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したこと作業者の所属日数が増えるとエラーは発生しづらくなりそうであるサマリビューアナリティクスロジスティック回帰
25© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例Exploratoryで実施したこと8時台に開始した作業はエラーが発生しやすそうであるサマリビューアナリティクスロジスティック回帰
26© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例得られた示唆と仮説ロジスティック回帰分析を通し、2種類のデータから示唆を得た結果、エラーに繋がる原因の仮説が見えてきた① 作業記録データ• 作業時間が長くなると、エラーに繋がりやすい• 8時台開始の作業は、エラーに繋がりやすい② 作業者名簿• 所属日数が長くなると、エラーに繋がりにくい長時間作業によって集中力低下?朝一作業は集中ができていない?ベテラン作業者のノウハウが若手に上手く伝承されているか?
27© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例施策案示唆、仮説をもとにエラー削減施策を検討① 作業記録データ• 作業時間が長くなると、エラーに繋がりやすい• 8時台開始の作業は、エラーに繋がりやすい② 作業者名簿• 所属日数が長くなると、エラーに繋がりにくい休憩を組み入れた作業/業務の設計リフレッシュルーム朝一は事務処理タイムにするベテランと若手をペアにするベテラン不在の日を作らないベテランの離職率低下
28© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.2. 作業品質向上のためのロジスティック回帰を使った分析事例今後の取り組み① 施策案をベ-スに現場担当者と議論し、施策実行② 実行した施策の効果測定、分析活動のサイクル化③ 分析デ-タの種類を拡充(設備データ、環境データなど)④ 必要に応じ、定性調査の実施(インタビュー、実地調査など)2種類のデ-タを分析することでいくつかの示唆が得られたが、まだまだ粗い仮説にとどまっている。今後現場とやり取りしつつ、分析デ-タを増やし施策→分析→検証のサイクルを素早く回していく。結果を評価しサイクルを回すまずはやってみる!更なるエラー削減施策に繋げる数値化できない情報を集める
© Hitachi Document Solutions Co., Ltd. 2020. All rights reserved. 29作業品質向上のためのロジスティック回帰を使った分析事例2020/07/31日立ドキュメントソリューションズ新事業戦略推進本部