Upgrade to Pro — share decks privately, control downloads, hide ads and more …

製品Aの処方可能性の高い医師を特定する

 製品Aの処方可能性の高い医師を特定する

Sho Sakuma

March 08, 2020
Tweet

Other Decks in Business

Transcript

  1. 1.本分析の背景と目的 0 0 0 0 0 0 0 0 0

    0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0% 25% 50% 75% 100% 201801 201803 201805 201807 201809 201811 201901 201903 201905 201907 201909 201911 202001 202003 抗体Total EHL 4Total SHL 7Total SHL 6Total SHL 5Total SHL 4Total 製品ATotal EHL 3Total SHL 3Total EHL 2Total SHL 2Total EHL 2Total SHL 1Total • 5月より入社した弊社Xにおいて、某希少疾患 領域(以下、疾患Y)のマーケティング業務を 担当している • 取り扱う2製品のうちの1つである製品Aは、 2018年4月に発売し2年以上が経過している が、売上、製品シェアが伸び悩んでいる • 今期の目標である『30例の新規患者処方』を 達成するために、ターゲット医師495名のなか から、製品Aを処方してくれる可能性の高い医 師に活動を集中させる必要性がある • よって、『過去製品Aの処方の有無』を目的変 数とした分類モデルを構築し、製品A処方の 可能性の高い医師を特定することを本分析の 目的とする 疾患Y治療薬の 市場シェア(value base)
  2. 2.分析サマリー 使用データ 目的 分析結果 • 製品Aの処方可能性の高い医師の特定 • 製品Aのターゲット医師の属性データ • 過去のX社のターゲット医師への活動データ

    • 各施設への自社・他社品の納入データ 分析方針 • 解釈可能性を重視し、ロジスティック回帰にてモデル作成 • AUCにてモデルのあてはまりの良さを検証 • 構築したモデルに、未処方医師データを入れ、処方可能性の高い上位200-300名を抽出 (使用した各特徴量について) • 以下の6つの特徴量を予測モデルの特徴量として採用した 1. Drの抗体薬シェア →シェアが高いほうが、処方しにくい傾向がある 2. Drの所属施設形態(国公立施設か否か)→国公立施設所属Drは処方しにくい傾向がある 3. 所属エリア(首都圏エリア) →首都圏エリアDrは処方しにくい傾向がある 4. 製品Aキーメッセージ合意の有無 →メッセージ合意がえられているDrは処方しやすい傾向がある 5. 所属科(小児科か否か) →小児科Drは処方しにくい傾向がある 6. 19/20期の、対競合でのSoV平均値 →SoVが高かったDrは処方しやすい傾向がある • 上記特徴量を用いたロジスティック回帰モデルにて導出された、『未処方であるが、処方確度が10%以上』のDr計230名を、今後製 品Aの活動対象とすることとした
  3. 3.分析詳細 データ収集 データ前処理 特徴量選択 モデル構築と 汎化性能の検証 モデルを用いた 処方予測作成 概要 手法

    • 製品Aのターゲット医師( 計495名分)の属性デー タ、またこれまでの弊社活 動データを入手する • 属性データは営業部より提 供 • 活動データは2年分を CoMEXチームより提供 • N/A • 属性データと活動データを 統合する • 数値データの外れ値を確 認、除外 • データの分散を正規分布に 近づけるためのlog化処理 • Pythonでの可視化 • Excel • 用意した特徴量を可視化 して全体像を把握する • ロジスティック回帰モデルの 予測モデルの特徴量として 採用するものを決定する • matplotlib • Statsmodelで統計学的 有意な特徴量を抽出 • 医師データを訓練データ、 テストデータに分割し、訓 練データでロジスティック回 帰モデルを作成 • テストデータでモデル性能を 検証する • Scikit-learn ロジスティッ ク回帰 • AUCにて当てはまりの良さ を検証 • 構築されたモデルを用いて 、未処方医師の処方可能 性を予測する • 上位200-300名程度を 選定し、今後の集中活動 対象と決定する • Scikit-learn ロジスティッ ク回帰
  4. 3-1.分析詳細 -データ収集 • 分析工程を始めるまえに、弊社内で『予測に役立ちそうな特徴量』の洗い出しを実施した • 予測に効きそうなものでも、入手できないものが複数存在することが判明した 特徴量 大項目 特徴量 中項目

    入手の可否 備考、初期仮設 医師属性データ 所属施設タイプ 〇 • 大学、国公立、一般、クリニック • 国公立は薬剤購買費用の縛りがあるため、製品Aの購入をしやすい? 所属科 〇 • 小児科、血液内科、感染症内科がメイン • 活動性の高い小児を多くみている小児科が、製品Aを処方しやすい? Tier 〇 • 弊社での活動重点度(4段階) • 最も活動をかけているTier-1が処方しやすい? エリア 〇 • 弊社都合でわけているエリア(4エリア) • 都市部よりも、製薬メーカー活動が薄い地方のほうが処方しやすい? 各薬剤の処方割合 〇 • 疾患Y領域の医師個人の各薬剤処方割合 • 抗体薬(新規薬剤で現在トップシェア)を多く使用している医師は、製品Aを処方しにくい? 医師の専門領域 ✖ • 医師が学位をとった専門領域が疾患Y関連もしくはそれに近しいものであれば、製品Aのベネフィットを理解してくれやすい? • 社内で把握できていない、二次情報も限られる 疾患Y領域製品の市場 性 △ • 製品市場性が高い(≒患者を多く診察している)医師ほど、処方してくれるのでは? • 個々のDrのデータまでは把握できず、病院の納入データを使用することとした 競合品の使用状況 △ • 特定の競合品を使用している医師ほど、製品Aを使用しやすい/しにくいのでは? • 個々のDrのデータまでは把握できず、病院の納入データを使用することとした 学会所属 ✖ • 疾患Y関連学会所属の医師ほど処方しやすい? • ただ、昨今の状況下では学会名簿の入手は不可、弊社でも管理していない 活動データ 訪問データ △ • 訪問を多くできている医師は処方しやすいのでは? • 過去2年分は入手可能だが、製品A発売開始時のデータは入手不可 製品メッセージへの合意 △ • 製品Aのベネフィットを理解し合意してくれていれば、処方しやすい傾向があるのでは? • 過去に取っていたデータはノイズが多いため使用できないと判断し、本年7月からの活動記録を参照することにした 講演会/学会共催セミナ ー参加記録 ✖ • MRによる宣伝より講演会がより処方インパクトがあるはず? • MR活動報告データではカバーされていないため使用できない
  5. 3-2.分析詳細 -データ前処理 特徴量 大項目 特徴量 中項目 前処理の方法 医師属性データ 所属施設タイプ •

    国公立施設の購買制限が製品Aの処方に影響している、という仮説に基づき、国公立の1/0で定義 所属科 • 複数所属科のなかで、小児科が製品A処方可能性が高いという予測のもと、小児科とそれ以外の2値で定義 Tier • 弊社規定している4段階のまま準備 エリア • 弊社規定している4エリアのまま準備 各薬剤の処方割合 • 製品種別では分類が細かすぎるため、SHL(もっとも古典的な製剤)、EHL(数年前より使用されている比較的新しい作用 機序の製剤)、抗体(最も新しく、投与回数が少ない製剤)の3つで定義した 疾患Y領域製品の市場性 • 施設納入金額データで医師の市場データと代替した • 0となっている施設所属Drは削除、またlong tail型のデータのためlog化の処理を行った 競合品の使用状況 • 施設納入金額データで医師の市場データと代替した 活動データ 訪問データ • 毎月の訪問回数と、各月のShare of Voice(%)を乗じて、対競合での活動量を規定した • 過去1年分の対競合訪問量を訪問データとして使用した 製品メッセージへの合意 • 3つの製品ベネフィットのうち1つ以上で合意が得られているか否かで1/0データとした • カテゴリーデータについては、あまり分類が細かくなりすぎないよう同種のものをまとめるなどの処理を施した • 数値データは分散値をみながら、外れ値を処理したり、また全体をlog化する処理を行った
  6. 4. 考察と今後のステップ検討 1. 各特徴量について  国公立施設が、薬剤購入費用に制限があるものの、あまり使用されていない製品Aのような製品への影響は限定的と考えらえた  小児科医は当初製品Aへの興味が高いと思われていたが、製品Aの投与回数の多さ、その煩雑さがむしろ若年者に敬遠されている可能性が疑 われるため、今後は成人や活動性の低い患者へのアプローチも同時に検討すべきと考えられる 

    初期仮説の通り、抗体薬が多く使用されている医師については製品Aの必要性が薄く、よって従来型製剤を多く使用している医師が今後も活動 対象の中心と考えられる  製品メッセージに合意いただいている医師は処方確率が6倍程度となるため、初期訪問で製品データを紹介し、その合意如何で訪問やアクション 継続するかを判断できる可能性がある 2. 分析精度について  今回の分析により、処方可能性が低い約半数の医師を活動対象から除外しても問題がないと判断されるため、アクションに反映することで生産 性向上につながると考えられる 3. 今後のステップ検討  本分析で決定したセグメントを翌月より営業活動に反映し、call allocationを実施する(本年11月まで固定)  本分析にかかわらず、営業活動の精度をみるために有用と思われるデータは分析用に取っておく必要がある(→講演会活動、学会所属など)  また、デジタルプロモーションが7月より展開されており、タイムリーに多くのデータが入手できるようになることが期待されるため今後の分析には特 徴量として検討する