2022/05/13(金)に開催したExploratory データサイエンス勉強会#23の株式会社ロッテ様のご登壇資料です。
回帰分析の活⽤による新商品の販売⼒予測株式会社ロッテ中澤 政紀
View Slide
会社紹介
⾃⼰紹介名前:中澤 政紀年齢:33歳居住地:群⾺ ⇒ 滋賀 ⇒ 福岡 ⇒ ⿅児島 ⇒ 東京経歴:2013年 ロッテアイス⼊社(営業)2017年 商品開発部(ガーナアイス、モナ王、スイカバー etc..)2019年 事業企画課(⾃社・他社分析、売上利益管理)2021年 新ブランド開発課(新しいブランド⽴ち上げるぜ!!)2022年 リサーチ課(消費者調査)
Exploratoryとの出会い統計の勉強しといて承知しました?統計 セミナー2021年2⽉2020年9⽉
1.業務背景と課題2.予測モデルの作成3.評価・ビジネスへの応⽤4.まとめ本⽇の内容
1.業務背景と課題2.予測モデルの作成3.評価・ビジネスへの応⽤4.まとめ
⾃社商品全て合わせると、年間で数百品もの新商品が発売される。新商品の売上はとっても⼤切!
企画⽴案味づくりデザイン発売分析商品開発の流れ
新商品における課題デザイン担当者の好み決裁者の感覚各担当が個別に調査属⼈的売上前年並み?担当者の感覚出たとこ勝負勘や経験に頼らずにどのくらいの売上になりそうか分からないだろうか?Exploratoryのブートキャンプで学んだことを活かせば解決できるのでは?なんか、予測とか変数重要度とかあったし!売上予測したいお客様に⼿に取ってもらえるデザインとは⼀体…?判断基準がほしい
①新商品がどの程度売れそうかという予想は過去実績や経験に基づいていた②デザインの善し悪しを計る評価基準がない発売前に消費者調査を実施することで、「販売⼒の予測」と「デザインの評価基準」を設けたい!新商品における課題
発売前 発売後消費者調査《説明変数》売上データ《⽬的変数》予測モデル(線形回帰)①販売⼒(販売個数)の予測②デザインの評価基準を設定課題解決へのアプローチ新商品発売
使⽤する説明変数に⽬星を付ける↓予測モデルを決める↓様々な説明変数の組み合わせを試す↓モデルの精度を確認↓予測モデルを使ってビジネスで活⽤予測モデル作成への⼤まかな流れ
使⽤する説明変数に⽬星を付ける相関でモデルに使⽤する説明変数に⽬星をつける(サマリでも可)実際はもっと多かったです…😢⽬的変数と⽐較的相関している変数をチェック!
使⽤するモデルを決める線形回帰をチョイス!①重要な指標を⾒つけるのに適している②変数の関係性を理解しやすい③説得⼒のある説明ができる
「変数重要度」タブで重要な指標を⾒つけることができるが、線形回帰などの統計のモデルは他の変数を⼀定にした上での重要度がわかる。重要な変数を⾒つけるのに適している①重要な指標を⾒つけるのに適している
「予測」タブを使うことで、他の変数を⼀定にした上での⽬的変数と予測変数との関係性がわかる。販売個数が上がるのか下がるのかの関係性が直感的に理解できる。②それぞれの変数の関係性を理解しやすい
「係数」タブでは、その変数が有意かどうか、予測変数の値が1上がった時に、⽬的変数の値がどれだけ上がる(下がる)のかがわかる。その変数が有意かどうかは説明の上で重要になる。また、1ポイント上がった時の効果がわかるため説明しやすい。③販売⼒との関係性を説得⼒をもった説明ができる
⽬的変数:販売個数販売価格発売⽉発売週気温調査項⽬①調査項⽬②調査項⽬③・・説明変数:線形回帰のモデルを作成たったこれだけ
ここを⼊れ替えるだけなので超簡単!!変数の候補が多いと⼊れ替えや⽐較が⼤変なので、総当たりとかできたらいいな・・・様々な説明変数の組み合わせを試す
1. 予測精度の評価2. デザイン調査により新商品の販売⼒を予測3. 販売⼒⾃体にランク付け(店当り販売個数3個以上:A、2個以上:B、1個以上:C)4. 予測された販売⼒にランクをもとにラベル付け5. 結果をもとに今後のアクションを決めるここまで来たらゴールまであとちょっとモデルの評価 ⇒ ビジネスへの応⽤の流れは以下の通り
感覚的に実務に使えそうかモデルは説明できてるかR2乗:⽬的変数(週販個数)のばらつきを予測変数でどれだけ説明できているか。0から1の間を取り、1に近ければ近いほどモデルが⽬的変数をうまく予測できていると⾔える。RMSE:予測値と実測値の平均的なズレを表す。値が⼩さくなればなるほど、ズレが少ないためにうまく予測できていると⾔える。1. 予測精度の評価
チョコレート アイスR2乗 0.37 0.77RMSE 0.32 1.46MAPE 10.5 % 14.1 %考察データを溜めて精度を上げる必要はあるが、誤差のレベルは許容範囲内季節要因もあり誤差が⼤きいデータを溜めて各指標の関係性や⼊れ替えも随時検討⽬指せ0.8!せめて0.5は超えたい…10%付近にしたい…感覚的に…1. 予測精度の評価
商品名 販売⼒ 変数7 変数11 変数32 変数14ガーナいちご2.8 5 180 50 10トッポ抹茶2.3 5 150 40 8商品名 販売⼒ 変数7 変数11 変数32 変数14ガーナいちご ? 5 180 50 10トッポ抹茶 ? 5 150 40 825線形回帰 モデル2.デザイン調査により新商品の販売⼒を予測予測モデルのためのデータ予測する
2.デザイン調査により新商品の販売⼒を予測販売⼒が知りたい新商品新商品の販売⼒を作ったモデルを使って予測①②③④
2.デザイン調査により新商品の販売⼒を予測予測された販売⼒(販売個数)では、良い悪いの判断は?
2.0 3.0下位20%上位20%中間60%3.販売⼒⾃体にランク付け商品⼒商品⼒個数ABC
4.予測された販売⼒にランクをもとにラベル付け新商品のランク付けができた!
5. 結果をもとに今後のアクションを決める販売⼒の予測値(店舗当たり個数)ランク3個以上 A2個以上 B1個以上 C改善の余地あり再検討…いい感じかも♪ABC新商品に対する意思決定を、ランクに基づいて⾏えるようになった
現状と今後ランクをもとにデザイン評価をテスト的に進めるが、予測モデルはまだまだ不安定。なので・・・他社品を含めた調査データや販売データをもとに、今回作成した予測モデルでうまくいくかを検証しつつ、予測モデルのブラッシュアップも同時に⾏っていく。
・どの要素が販売⼒に結び付いているのか⇒売上と消費者調査の関係性を理解する・新商品の販売⼒を予測⇒ブランドごとの売れる傾向や需要予測・デザインの善し悪しを計る基準値の設定⇒予測された販売⼒をもとに、このデザインで売れるかどうか、もし売れなそうであれば再度デザインを考えることにつなげられる。今回分かったこと、できたこと
・項⽬を選択するだけなのでRとか使えなくてもOK・様々な統計モデルを簡単に試して⽐較できる・重要度や変数同⼠の関係性が視覚的に理解できる・⼀度モデルを作ってしまえば、他の⼈も再現できる形でデータを共有できるため、誰でも同じモデルを使うことができるExploratoryを使ってよかったこと
おわり