無印良品のID-POSデータ分析を紹介.pdf

無印良品のID-POSデータ分析を紹介株式会社良品計画ITサービス部王毅超、楊明 2023年7月27日(木)

自己紹介株式会社良品計画王毅超オウキチョウ役職仕事プライベート株式会社良品計画
ITサービス部データサービス課課長/データアーキテクト 2021年には良品計画に入社し、「データサービス課」を立ち上げ、課の使命は、誰でも簡単に正しいデータインサイトを得るできるグローバルデータプラットフォームの構築とデータ駆動型の組織変革を推進しています。普段の業務は「データ戦略設計」「データ分析」「データ民主化PJ推進」などです。直近の裏業務はDBTとDatabricksのPoCで。趣味：スノーボード、旅行、グルメ、ゲーム将来の夢：FIREでだらだらで世界一周

良品計画の事業範囲 • 衣服雑貨 • 生活雑貨 • 食品素の食のおいしさ公共のデザイン永く使える、変えら
れる • MUJI Diner • Café&Meal MUJI • 被災地支援 • 途上国との取り組み • ReMUJI • BRINGプロジェクト • ショッピングバッグ • キャンプ場運営 • MUJI HOTEL • 団地再生 • コワーキングスペース • 駅、空港 • 自動運転バス • MUJI HOUSE • MUJI RENOVATION CLUB • 店舗の土着化活動 • 里山の保全 • 諸国良品 • ローカルニッポン未利用資源の活用 • 耕作放棄地 • 廃校 • 地元特産物 • 団地天然資源の保全無駄をなくす取り組み環境貢献社会貢献地域・文化貢献生活貢献絆を大切にする活動社会への支援

良品計画の事業範囲詳細

良品計画のグローバルネットワーク

商品企画・計画生産・輸送販売個店仕入直営店販売 LS販売オンライン販売移動販売法人販売（卸売）商品企画・デザイン
MD計画商品製造/生産（サプライヤー）輸送・貿易自社倉庫運営オーダーメイド生産生鮮・日配品仕入良品計画のバリューチェーン

2021年9月から『第二創業期』がスタート。良品計画の今 IT・ECデジタル部門における中期経営計画・基幹系システムを刷新し、自立分散型業務に合わせ再構築し業務を着地させる。・店舗レジ基盤の刷新、店舗業務のデジタル化による作業の削減・効率化を持続可能にする。・ECサイトでの売り上げ比率15%を目指す。 ※感じよいオンラインの提供・現場に入り込み業務変革を主体的にリードする。・個人情報管理・セキュリティ対策含めガバナンスを効かせた体制を確立する。

自己紹介株式会社良品計画楊明ヤンミン役職仕事プライベート株式会社良品計画
ITサービス部データサービス課データエンジニア 2022年株式会社良品計画に入社。良品計画データ分析基盤の構築＆運用をリード。ソリューション策定からデータ基盤の構築・運用まで、EndTOEndでデータ活用を実現。基盤構築ではなく、アセット活用や自動化によるクイックなビジネス効果創出を実現。趣味：登山、ビリヤード、キャンプ将来の夢：沖縄でそば店を開業

目録 1. ID-POSデータ分析の要件 2. ID-POSデータ分析の全体構成 3. 今後の展望 4. 最後に

1. ID-POSデータ分析の要件

ID-POSデータ分析の目的 DXの推進による業務効率化ビジネス効率向上売上データや在庫管理などの情報をリアルタイムで把握し、ビジネスプロセスを最適化します。在庫の不足や過剰などの問題を素早く検知し、補充や調整を行うことで効率を向上させます。売上と利益の最大化不正検知とセキュリティ強化 ID-POSデータから得られる洞察を活用し、売上を増やすための戦略を立案
します。顧客の購買傾向や需要予測などを分析し、適切な販売促進策やキャンペーンを展開して売上と利益を最大化します。異常な取引パターンや詐欺行為を検知するために利用できます。不正な活動を早期に発見し、適切なセキュリティ対策を講じることで、経済的な損失を防ぐことができます。商品戦略の改善商品の売れ行きや需要の変化を把握します。これにより、売れ筋商品の強化や新商品の開発、在庫管理の改善など、より効果的な商品戦略を立案します。

ID-POSデータ分析の要件リアルタイム性と信頼性 ID-POSデータはリアルタイムで反映されることが求められる場合があるので、適切なデータ収集頻度を検討します。データの正確性、完全性、一貫性を確保するためのプロセスと監視を確立します。データの保管と管理データの可視化とレポート ID-POSデータの可視化ツールやダッシュボードを構築し、ビジネス関係者がデータを分かりやすく理解し、意思決定に役立てることをサポートしま
す。適切なレポートとダッシュボードは、重要なKPIの把握とビジネスの洞察を提供します。スケーラビリティとパフォーマンス ID-POSデータ分析基盤をスケーラブルに構築し、将来的なデータ増加にも対応できるようにします。高いパフォーマンスと処理能力が確保されることで、リアルタイムまたは近接リアルタイムのデータ分析を可能にします。大量のID-POSデータを効果的に管理するために、データレイクやデータウェアハウスを構築します。適切なデータの保管と管理は、データへのアクセスとクエリの効率化、データのセキュリティ確保に重要です。

2. ID-POSデータ分析の全体構成

ID-POSデータ分析の全体構成 MUJI Datalake MUJI POS 店舗本部 MUJI POS MUJI
POS 実績集計集計サーバー連携ファイル出力処理 batchサーバー連携ファイル連携処理（日次） Kinesis Agient Kinesis Streams raw層 staging層 Insight層 ETL ETL SQL queries SQL queries Amazon SageMaker Tableau Server 利用者利用者利用者 Amazon Athena アドホック分析意思決定機会学習 MUJI POS MUJI Data Platform

MUJI DataLake MUJI DataLakeは「stagingデータレイク」・「 rawデータレイク」・「 insightデータレイク」の3層構造 Staging層
Raw層 Insigth層様々なデータソースから構造化データ（テーブルデータなど）、非構造化データ（画像、音声、動画データやアプリケーションのログなど）、半構造化データ（JSON、CSV など）を加工せず、そのままの状態で保存する場所です。 staging層のデータをもとに、データのフォーマットを変更した後のデータを保存する場所です。場合による、データ粒度(日次、週次、月次)で加工したデータ、汎用データなども保存する場所です。 raw層のデータをもとに、ビジネス要件による加工した汎用なデータを保存する場所です。

ID-POSデータ集約ストリーミング処理 (ほぼリアルタイム) バッチ処理「ストリーミング処理」と「バッチ処理」の二つの処理の仕組みで、「鮮度」と「精度」を両立させるPOSデータ集約仕組みを構築する。日次で確定データをS3連携することでデータの完全性を担
保データ集約方式データ集約説明データ集約アーキテクチャー Amazon Lambda Amazon S3 Amazon Kinesis Data Streams Parse data Read data Kinesis Agent For Windows MUJIPOSではPOS取引ログからストリーミング処理でデータレイクまで連携することで、データ新鮮度を担保 batch Amazon S3 Amazon S3 Amazon Glue Parse data Read data

ストリーミングでID-POSデータ蓄積 Amazon Lambda Amazon S3 Amazon Kinesis Data Streams ③Parse
data ② Read data Kinesis Agent For Windows LambdaでJson形式のストリーミングデータを解析し、parquet形式のファイルをデータレイクに蓄積する。 ①write data 複数台Kinesis agentからKinesis Data Streams へPOS jsonを書き込む ① write data ② Read data LambdaでJson形式のストリーミングデータを解析し、parquet形式のファイルをデータレイクに outputする ③ Parse data ストリーミングデータを一定量蓄積してから、 Lambda関数を起動し、ストリーミングデータを読み込む Lambda関数の起動条件バッチウィンドウ: 120(秒) バッチサイズ: 10000 バッチウィンドウ:関数を呼び出すまでにレコードを収集する最大時間 (秒) バッチサイズ：関数に送信する各バッチのレコード数

JSONデータ解析 { ”TransactionID” : 123, “TerminalNo” : “abc123”, “SystemDateTime” :
“2023-07-27 14:07:01”, “OperatorCode” : 64728, “OperatorName” : ”良品太郎”, “TotalAmount”: 4000 “ListItem”: [ { “TransactionNo” : 123 “ItemCode” : 1111 “Price” : 1200 “Quantity” : 2 “Amount” : 2400 }, “TransactionNo” : 123 “ItemCode” : 2222 “Price” : 1000 “Quantity” : 2 “Amount” : 2000 { }, .. ], “ListItemDiscount”: [ { “TransactionNo” : 123 “ ItemCode” : 1111 “DiscountCode” : “現品処分” “TargetQuantity” : 2 “TotalAmount” : 400 } ] } POS側の値引データ(JSON形式) Amazon Lambda transaction_log(取引ログ) transaction_item_detai (取引商品詳細) transaction_item_discount (取引商品値引) Datalake Rawデータ(parquet形式) LambdaでJSONデータを行と列の関係形式に展開する

ストリーミング処理の性能とボトルネック Amazon S3 Amazon Kinesis Data Streams Kinesis Agent For
Windows Amazon Lambda ... … シャードシャードはAmazon Kinesisストリームにおけるスループットの基本単位です Kinesis Agent側の制限が一台、最大 500レコード/秒オンデマンドモードのデータストリームがスループットを自動的にスケールして、書き込み容量として最大で 200 MiB/秒および 200,000 レコード/秒のトラフィックに対応します。読み込み容量として最大で 400 MiB/秒一定量のストリーミングデータ (120秒 OR 10000レポート)をまとめてからLambda関数で処理するようバッチ設定

バッチ処理でID-POSデータ蓄積 MUJI Datalake raw層 staging層 batchサーバー日次でPOSデータ転送 AWS Glue Catalog
rawデータのcatalog更新 josnデータ解析 Parquet形式output Amazon MWAA Amazon MWAAは Amazon Managed Workflows for Apache Airflow Workflow管理

Catalog管理 MUJI Datalake raw層 Insight 層 raw database insight database
Data Catalog location location MUJI Datalakeの全てのデータをカタログ化して一元管理する。データのサイロ化を解消し、データの収集と加工に要する時間を短縮し、全社横断的にどこからでも容易に欲しいデータを発見し、分析・活用することが可能となる。 Amazon Athena Amazon Redshift Spectrum Amazon SageMaker 帳票システムデータ可視化レポーティング機械学習モデル

データ可視化事例 ID-POS データ源泉データ MUJI Datalake マスタデータ MUJI BI
MUJI Datalakeでは、販売データ(ID-POS)や商品、店舗、ロケーション等マスタデータを一元管理する。クエリエンジンを使って、分析ニーズにより、それぞれの当日データマート、過去実績データマートを作る。 Tableauでそれぞれのデータマートと接続して、業務支援、意思決定用のダッシュボードを作成し、公開する。 Raw層 Insight層店舗マスタ商品マスタ販売データロケーションマスタリアルタイムに売上確認し、当日の店舗オペレーションを組み立てるために利用する時間帯毎売上・客数推移当日店舗毎売上、収益、目標達成率日次商品毎売上・客数月次売上・利益・値引店舗の過去売上データを可視化することで、傾向を把握したり、中長期的な戦略立案の場面で役立つ５分ぐらい間隔データソース刷新日次・週次・月次データソース刷新

3.今後の展望

今後の展望売上向上のため、店舗オペレーションの見直しと改善が必要なので、リアル店舗でお客様の行動分析のニーズを増やす。既存ID-POSデータ分析構成はデータマート更新まで、ストリーミング処理ではなく、後半Lambda+ Athenaでバッチ処理を行う。今後、ストリーミングデータを可視化・不正検知・在庫補充検知する仕組みを構築することをチャレンジしたい。 TOBE 店舗レジ物流セン
ターリアルタイムな販売データリアルタイムな在庫データ MUJI Data Platform ストリーミングストリーミング在庫の不足異常な取引リアルタイム分析リアルタイム計算異常な取引パターンや詐欺行為を早期に発見し、適切なセキュリティ対策を講じることで、経済的な損失を防ぐ店長物流センター自動的に注文を発注することで、欠品リスクを最小限に抑え、カスタマーサービスを向上させるアラート自動発注

4.最後に

IT部門約200名体制を構築する。・バックエンドシステムを構築・運用している部門。・事業会社やコンサルファーム出身者が多い。・IT戦略、PM、インフラ、データエンジニア、サーバーサイド/フロントエンドエンジニア、システム運用など幅広い職種。 IT 採用計画 (2022年4月～2023年8月末) ITサービス部
100名体制を目指す。現在60+名。 ※23年7月時点・MUJIパスポートアプリ・ECサイトの集客・運用している部署。・デジタルマーケティング、デザイン、フロントエンドエンジニアなどフロント職を中心に募集。 EC・デジタルサービス部 100名体制を目指す。現在80+名 ※23年7月時点

データサービス課についてミッション 1. 多様化、地域土着化、グローバル化ビジネスを支えることができる、高品質で有意義なデータとアナリティクスサービスの提供よりデータのビジネスバリューを最大化する 2. Data-Driven組織変革の推進により、ビジネス効率を向上するデータサービス課が実現したいこと •
単一的な信頼性的なデータと分析結果の供給 • リアルタイムデータ・分析と業務適用の実現 • Data-Driven組織変革のインフラ • AI・MLで業務イノベーションを実現目指す会社像 • 機会と顧客ニーズに対応できるスピードを向上できる • より多くの顧客中心のソリューションとエクスペリエンスを作成できる • より効率的で生産的なチームを構築できる

データサービス課について Data Platformと利用テクノロジー

採用について募集ポジション Data Analyst Data Engineer 全社で取り扱う計画・実績数値の可視化・レポート開発および関連プロジェクトの推進を行い、業務部門に対してデータドリブンな意思決定を行うための風土の醸成やツールの展開・業務定着を担当
グローバル全社におけるデータドリブンな意思決定を行うための全社データ基盤構築を担当面白さ • データ分析を担当するだけではなく、データ利活用を通じて、業務の改善、変革をリードするとともに、データが活用される風土を作っていく役割であること面白さ • 良品計画のデータエンジニアは、エンジニアリングと基盤開発にとどまらず、データ利活用を通じて、業務の改善、変革をリードしていく役割であること • データ分析、開発だけでなく、その先の事業、業務を見据えた動きができる（求められる） • 「第二創業期」というキーワード通り、仕組みから作っていくことができる要件 • データ分析実務経験、プログラミング、SQL、業務知見要件 • データ分析基盤のインフラ・アーキテクチャ設計・導入・運用経験申し込みリンク https://hrmos.co/pages/muji/jobs/event01 申し込みリンク https://hrmos.co/pages/muji/jobs/event02

ご清聴ありがとうございました！

良品計画紹介

無印良品のID-POSデータ分析を紹介.pdf

無印良品のID-POSデータ分析を紹介.pdf

yang_ming

More Decks by yang_ming

Featured

Transcript

無印良品のID-POSデータ分析を紹介株式会社良品計画ITサービス部王毅超、楊明 2023年7月27日(木)

自己紹介株式会社良品計画王毅超オウキチョウ役職仕事プライベート株式会社良品計画

良品計画の事業範囲 • 衣服雑貨 • 生活雑貨 • 食品素の食のおいしさ公共のデザイン永く使える、変えら

良品計画の事業範囲詳細

良品計画のグローバルネットワーク

商品企画・計画生産・輸送販売個店仕入直営店販売 LS販売オンライン販売移動販売法人販売（卸売）商品企画・デザイン

自己紹介株式会社良品計画楊明ヤンミン役職仕事プライベート株式会社良品計画

目録 1. ID-POSデータ分析の要件 2. ID-POSデータ分析の全体構成 3. 今後の展望 4. 最後に

1. ID-POSデータ分析の要件

2. ID-POSデータ分析の全体構成

ID-POSデータ分析の全体構成 MUJI Datalake MUJI POS 店舗本部 MUJI POS MUJI

MUJI DataLake MUJI DataLakeは「stagingデータレイク」・「 rawデータレイク」・「 insightデータレイク」の3層構造 Staging層

ストリーミングでID-POSデータ蓄積 Amazon Lambda Amazon S3 Amazon Kinesis Data Streams ③Parse

JSONデータ解析 { ”TransactionID” : 123, “TerminalNo” : “abc123”, “SystemDateTime” :

ストリーミング処理の性能とボトルネック Amazon S3 Amazon Kinesis Data Streams Kinesis Agent For

バッチ処理でID-POSデータ蓄積 MUJI Datalake raw層 staging層 batchサーバー日次でPOSデータ転送 AWS Glue Catalog

Catalog管理 MUJI Datalake raw層 Insight 層 raw database insight database

データ可視化事例 ID-POS データ源泉データ MUJI Datalake マスタデータ MUJI BI

3.今後の展望

4.最後に

データサービス課について Data Platformと利用テクノロジー

ご清聴ありがとうございました！

良品計画紹介

良品計画紹介

良品計画紹介