Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
医師向けQAサイトのための推薦システム開発
Search
Ryusuke_Tanaka
December 10, 2019
Technology
1
1.6k
医師向けQAサイトのための推薦システム開発
【Merpay x M3 x PFN 共催】 Machine Learning Night にて登壇した時の資料です。
自社プロダクトをベースとして活用した新しいプロダクトを作った時の話です。
Ryusuke_Tanaka
December 10, 2019
Tweet
Share
More Decks by Ryusuke_Tanaka
See All by Ryusuke_Tanaka
An Effective Approach to Unsupervised Machine Translationの紹介
ryusuketa
0
120
Universal Decompositional Semantics on Universal Dependencies
ryusuketa
0
77
Learning Dual Retrieval Module for Semi-supervised Relation Extractionの紹介
ryusuketa
0
72
動画視聴を整数倍(最大値)で_効率化するchrome extension作った
ryusuketa
0
77
双曲空間への単語埋め込みと QAサービスでの自然言語処理を 用いた推薦システムについて
ryusuketa
0
550
Other Decks in Technology
See All in Technology
「Chatwork」の認証基盤の移行とログ活用によるプロダクト改善
kubell_hr
1
200
Snowflake Summit 2025 データエンジニアリング関連新機能紹介 / Snowflake Summit 2025 What's New about Data Engineering
tiltmax3
0
310
AWS アーキテクチャ作図入門/aws-architecture-diagram-101
ma2shita
30
11k
250627 関西Ruby会議08 前夜祭 RejectKaigi「DJ on Ruby Ver.0.1」
msykd
PRO
2
320
生成AI時代の開発組織・技術・プロセス 〜 ログラスの挑戦と考察 〜
itohiro73
1
270
AWS テクニカルサポートとエンドカスタマーの中間地点から見えるより良いサポートの活用方法
kazzpapa3
2
550
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
26k
Witchcraft for Memory
pocke
1
440
なぜ私はいま、ここにいるのか? #もがく中堅デザイナー #プロダクトデザイナー
bengo4com
0
480
HiMoR: Monocular Deformable Gaussian Reconstruction with Hierarchical Motion Representation
spatial_ai_network
0
110
「良さそう」と「とても良い」の間には 「良さそうだがホンマか」がたくさんある / 2025.07.01 LLM品質Night
smiyawaki0820
1
220
CI/CD/IaC 久々に0から環境を作ったらこうなりました
kaz29
1
180
Featured
See All Featured
Optimising Largest Contentful Paint
csswizardry
37
3.3k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.4k
Bash Introduction
62gerente
614
210k
Optimizing for Happiness
mojombo
379
70k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Building a Modern Day E-commerce SEO Strategy
aleyda
42
7.3k
Practical Orchestrator
shlominoach
188
11k
The Language of Interfaces
destraynor
158
25k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Java REST API Framework Comparison - PWX 2021
mraible
31
8.6k
Being A Developer After 40
akosma
90
590k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Transcript
Copyright © 2019 M3, Inc. All rights reserved. インターネットを活用し、 健康で楽しく長生きする人を1人でも増やし、
不必要な医療コストを1円でも減らすこと 医師向けQAサイトのための 推薦システム開発 2019年12月10日
Copyright © 2019 M3, Inc. All rights reserved. 1 ◼
田中 龍亮(たなか りゅうすけ) – 2019年4月 エムスリー入社 – 前職ではセンサーデータを用いたPoC – 大学院では音響信号処理+機械学習の応用 – エムスリーではコンテンツへのタグづけ 機械翻訳、推薦などに着手 右はジャグリングしてたときの写真です (写真アップデートするためにジャグリングしたい 自己紹介
Copyright © 2019 M3, Inc. All rights reserved. 2 医師の診療において、専門外の症例情報に関する情報ニーズに応えるサイト
サイト中の一機能として医師に対して表示質問のパーソナライズしたい要望 推薦システム的課題としてはコールドスタート →(当然ですが)少ない工数で作りたいので、既存プロダクトの活用を考える 医師向けQAサイト
Copyright © 2019 M3, Inc. All rights reserved. 3 feedback(強)
・検索キーワード ・アンケート feedback(中) ・関連記事一覧 feedback(弱) ・アクセスログ Gauss (item, tag, score) Maxwell (user, tag, score) Archimedes (推薦システム) 各サービス分析 サービスの パーソナライズ プロジェクト Isaacs ・EntityLinking ・一覧ページ Knuth ・検索エンジン ・パーソナライズ • 全体を一つのプロダクトだと考え成長させる。 Feynman ・クローラー ・コンテンツ作成支援 3 弊チームMLプロダクトの思想
Copyright © 2019 M3, Inc. All rights reserved. 4 各々、社内のニーズを満たすために作られたプロダクトである一方
パーソナライズするためのユーザー素性とアイテム素性が容易に取れる状態になっている →新規プロダクト開発でも少ない工数で済む! 糖尿病 1型糖尿病 ・・・ Maxwell: 医師の “疾患/薬剤” に対するタグ付け (コンテンツクリックログに基づ く) Gauss: コンテンツに 登場する ”疾患/薬剤”名の抽出(タグ) 糖尿病、合併症、... インスリン、肝機能障害、… 骨粗鬆症、骨折 プロダクト一部紹介(本推薦システムの立役者) m3.com ユーザ m3.com コンテンツ m3.com コンテンツ m3.com コンテンツ
Copyright © 2019 M3, Inc. All rights reserved. 5 素朴なアイデア:ユーザーに紐づくタグとコンテンツに紐づくタグをマッチングさせる
一方でタグ情報のみでは疎 タグ全体では4000個程度実際につけられているのにに対して、 質問文は短く、タグは一件あたり 1-3個程度しかつかない 最低でも10件推薦する要件だがこれでは必要数出せないユーザーが存在しうる → 疾患/薬剤タグを分散表現に落とし込み、密にする。 ベースロジック 糖尿病 1型糖尿病 ・・・ maxwellによる 医師の興味タグ付け Gaussによる質問内の 疾患/薬剤名抽出 糖尿病、合併症、... インスリン、肝機能障害、 … 骨粗鬆症、骨折
Copyright © 2019 M3, Inc. All rights reserved. 6 -
コンテンツに含まれる疾患/薬剤名を抽出して、それをitemとした user x itemの行列を作り行列分解で、疾患 /薬剤名の埋め込み表現を得る(値は閲覧数) - 埋め込みの学習時に次の情報を利用してグラフラプラシアン正則化を導入 - ICD10分類と呼ばれる疾患名の関係性を含んだ木構造 - 疾患と薬剤の投薬関係 - 弊社コンテンツにおいて登場が希少な疾患も学習できるようにするため - タグの埋め込みの和で質問およびユーザー埋め込みを得て、類似度計算 - - 素朴にword embeddingで良いのでは? - 言語的な近さではなく、疾患や薬剤としての専門性の近さが欲しい ロジック - item embedding 糖尿病 インス リン 骨折 子宮癌 ... ユー ザー1 3 4 1 0 ... ユー ザー2 0 0 3 0 ... ユー ザー3 2 1 2 0 ... ユー ザー4 0 0 0 4 ... ... ... ... ... ... 糖尿病 インスリン 骨折 子宮ガン 埋め込み
Copyright © 2019 M3, Inc. All rights reserved. 7 2型糖尿病に対するcos類似度
'ジャディアンス': 0.8617, 'トラゼンタ': 0.8495 'スーグラ': 0.8303, 'クレメジン': 0.7988 'アトーゼット': 0.7970, '低血糖': 0.7827, 'スージャヌ': 0.7547, 'トルリシティ': 0.7501, 'ロトリガ': 0.7488, 'ゼチーア': 0.7483 埋め込み例 1型糖尿病に対するcos類似度 'ランタス': 0.6063, 'ノボラピッド': 0.5892, 'メトホルミン': 0.5878, 'オゼンピック': 0.5792, '肥満症': 0.5702, '糖尿病合併症': 0.5351, 'フレックス': 0.5268, '慢性腎臓病': 0.51808, 'トレシーバ': 0.5150 'その他のグルコース調節・膵内分泌障害 ': 0.4982, それぞれ2型糖尿病に対応する薬、1型糖尿病に対応する薬が上位にでている (メトホルミンとオゼンピックは2型糖尿病に処方するもので意図外 …
Copyright © 2019 M3, Inc. All rights reserved. 8 -
比較的診療科にマッチした結果になっている(データお見せできませんが … - 一部厳しいものもある - クリック数の少ないユーザーなどに関しては補完など行う - 疾患・薬剤情報が抜けない場合 - 年齢情報、性別、副作用、飲み合わせ、安全性、有効性 … - Gaussのタグづけへフィードバックをすることで解決しうる 有効なタグが増えるのでGaussとMaxwellの成長へつながる - “専門外の疑問に応える”ことをまだ叶えられていない - 専門”以外”となってしまうと範囲が広く狙い撃ちがむずかしい - ローンチ後のサイトのログ次第 - 専門外といえど質問には傾向があるかもしれない - 診療科、疾患という軸だけではなく、保守的か革新的かの医師本人の性格軸なども 有効かもしれない 実際に見た結果+課題