Upgrade to Pro — share decks privately, control downloads, hide ads and more …

作業品質向上のための ロジスティック回帰を使った分析事例

作業品質向上のための ロジスティック回帰を使った分析事例

2020/7/31(金) に開催したExploratory データサイエンス勉強会#14の株式会社 日立ドキュメントソリューションズ様のご登壇資料です。

Ikuya Murasato

July 31, 2020
Tweet

More Decks by Ikuya Murasato

Other Decks in Business

Transcript

  1. © Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.

    2020/07/31 日立ドキュメントソリューションズ 新事業戦略推進本部 湯山咲子 作業品質向上のための ロジスティック回帰を使った分析事例
  2. © Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.

    1. 弊社のご紹介 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Contents 1
  3. © Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.

    1. 弊社のご紹介 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Contents 2
  4. 3 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 1. 弊社のご紹介 日立ドキュメントソリューションズ 主要4事業 • コミュニケーション支援事業 広告作成、企業PR動画作成 • オフィスワーク支援事業 オフィス構築 • モノづくり支援事業 プロジェクトマネジメント支援 • IT支援事業 業務システム構築、保守、運用 設立 1955年 10月 代表者 取締役社長 荻原 淳 資本金 4億5千万円(日立製作所100%) 連結売上高 320億円(2020年3月期) 連結従業員 1,508名(2020年3月末現在) 本社 東京都江東区東陽六丁目3番2号 イースト21タワー
  5. 4 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 1. 弊社のご紹介 日立ドキュメントソリューションズ 主要4事業 • コミュニケーション支援事業 広告作成、企業PR動画作成 • オフィスワーク支援事業 オフィス構築 • モノづくり支援事業 プロジェクトマネジメント支援 • IT支援事業 業務システム構築、保守、運用 設立 1955年 10月 代表者 取締役社長 荻原 淳 資本金 4億5千万円(日立製作所100%) 連結売上高 320億円(2020年3月期) 連結従業員 1,508名(2020年3月末現在) 本社 東京都江東区東陽六丁目3番2号 イースト21タワー 現場の近くで様々な支援事業を展開してきた我々だからこそできる データ分析サービスの展開を目指しチームで奮闘中!
  6. © Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.

    1. 弊社のご紹介 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Contents 5
  7. 6 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. データを活用しエラー発生傾向を分析することで、 エラー削減施策に結び付く示唆を得られるか? 2. 作業品質向上のためのロジスティック回帰を使った分析事例 分析の背景、目的 ※本資料内のエラー数値は、弊社内の製作工程で確認した件数です 社内のある作業について、納品前チェックで 発見されるエラーを削減したい!
  8. 7 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 書類をスキャン 納品前チェック 納品 エラー 手戻り 2. 作業品質向上のためのロジスティック回帰を使った分析事例 分析対象の作業 書類スキャン作業時のデータを用い、 エラー削減(=手戻り工数の削減)につながる示唆を得たい。
  9. 8 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. いつの作業? 作業者は誰? エラー発生あり?なし? 勤続年数は? 勤務体系は? ① 作業記録データ 作業1件単位の記録が含まれるデータ 約16,000行(=作業件数) ② 作業者名簿 作業者一人単位の属性情報が含まれるデータ 約30行(=従事者数) 2. 作業品質向上のためのロジスティック回帰を使った分析事例 分析データ 分析に用いるデータは2種類。①に②を結合し、分析用データを作成。
  10. 9 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. データの概要を掴む - エラーに相関のある変数は? - エラー発生時の特徴は? 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと サマリビュー アナリティクス ロジスティック回帰 因果関係を探る -エラー発生への影響が高い変数は? ロジスティック回帰分析の実施
  11. 10 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 目的変数とするカラム。 エラーあり(TRUE)は 全体の8%程度。 サマリビュー 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと
  12. 11 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. データへの理解を深めるために、 エラー発生と各カラムの相関関係を確認 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと サマリビュー
  13. 12 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと 作業時間= AUC 0.8051 サマリビュー
  14. 13 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと ロジスティック回帰へ サマリビュー
  15. 14 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと 作業時間の他に、エラーへ影響が高い変数は何か? 影響度合いを確認したい説明変数を追加。 ②作業者名簿の変数 ①作業記録データの変数 サマリビュー アナリティクス ロジスティック回帰
  16. 15 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと 選択した変数間に強い相関関係 がないか多重共線性で確認 サマリビュー アナリティクス ロジスティック回帰
  17. 16 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと サマリを確認。エラーの検出率が低く、チューニングが必要。 サマリビュー アナリティクス ロジスティック回帰
  18. 17 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと サマリビュー アナリティクス ロジスティック回帰 予測マトリクスを見ると、 エラーが発生しないことを予測できる率は高いが 他の予測率が低いことが分かる。 とりあえずFALSEと言っておけば当たるモデルに・・・ 肝心なエラーを予測できない! ここを上げたい
  19. 18 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと ここで振り返ると、 そもそもエラー件数はデータ全体の8%だった →全体の中で占めるエラー件数が少なく 偏りがある状態。 サマリビュー アナリティクス ロジスティック回帰 予測マトリクスを見ると、 エラーが発生しないことを予測できる率は高いが 他の予測率が低いことが分かる。 とりあえずFALSEと言っておけば当たるモデルに・・・ 肝心なエラーを予測できない! ここを上げたい
  20. 19 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと データの不均衡を調整し、 TRUEとFALSEの割合 を均衡に近づける エラーの検出率が向上! サマリビュー アナリティクス ロジスティック回帰
  21. 20 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと カットポイントは0.5から 0.3へ変更 不均衡調整前 サマリビュー アナリティクス ロジスティック回帰
  22. 21 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと 調整前 調整後 サマリビュー アナリティクス ロジスティック回帰 閾値などを調整し、現状のデータから出せる、 最適なモデルとして選択。
  23. 22 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと エラーの発生に影響を与えている 変数は何か? →ダントツで作業時間が高い。 サマリビュー アナリティクス ロジスティック回帰
  24. 23 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと 作業時間が増えると、エラーに繋がりやすそうである サマリビュー アナリティクス ロジスティック回帰
  25. 24 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと 作業者の所属日数が増えると エラーは発生しづらくなりそうである サマリビュー アナリティクス ロジスティック回帰
  26. 25 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 Exploratoryで実施したこと 8時台に開始した作業は エラーが発生しやすそうである サマリビュー アナリティクス ロジスティック回帰
  27. 26 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 得られた示唆と仮説 ロジスティック回帰分析を通し、2種類のデータから示唆を得た結果、 エラーに繋がる原因の仮説が見えてきた ① 作業記録データ • 作業時間が長くなると、エラーに繋がりやすい • 8時台開始の作業は、エラーに繋がりやすい ② 作業者名簿 • 所属日数が長くなると、エラーに繋がりにくい 長時間作業によって集中力低下? 朝一作業は集中ができていない? ベテラン作業者のノウハウが若手に 上手く伝承されているか?
  28. 27 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 施策案 示唆、仮説をもとにエラー削減施策を検討 ① 作業記録データ • 作業時間が長くなると、エラーに繋がりやすい • 8時台開始の作業は、エラーに繋がりやすい ② 作業者名簿 • 所属日数が長くなると、エラーに繋がりにくい 休憩を組み入れた作業/業務の設計 リフレッシュルーム 朝一は事務処理タイムにする ベテランと若手をペアにする ベテラン不在の日を作らない ベテランの離職率低下
  29. 28 © Hitachi Document Solutions Co., Ltd. 2020. All rights

    reserved. 2. 作業品質向上のためのロジスティック回帰を使った分析事例 今後の取り組み ① 施策案をベ-スに現場担当者と議論し、施策実行 ② 実行した施策の効果測定、分析活動のサイクル化 ③ 分析デ-タの種類を拡充(設備データ、環境データなど) ④ 必要に応じ、定性調査の実施(インタビュー、実地調査など) 2種類のデ-タを分析することでいくつかの示唆が得られたが、 まだまだ粗い仮説にとどまっている。 今後現場とやり取りしつつ、分析デ-タを増やし施策→分析→検証のサイクルを素早く回していく。 結果を評価し サイクルを回す まずはやってみる! 更なるエラー削減 施策に繋げる 数値化できない情 報を集める
  30. © Hitachi Document Solutions Co., Ltd. 2020. All rights reserved.

    29 作業品質向上のための ロジスティック回帰を使った分析事例 2020/07/31 日立ドキュメントソリューションズ 新事業戦略推進本部