Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
医師向けQAサイトのための推薦システム開発
Search
Ryusuke_Tanaka
December 10, 2019
Technology
1
1.7k
医師向けQAサイトのための推薦システム開発
【Merpay x M3 x PFN 共催】 Machine Learning Night にて登壇した時の資料です。
自社プロダクトをベースとして活用した新しいプロダクトを作った時の話です。
Ryusuke_Tanaka
December 10, 2019
Tweet
Share
More Decks by Ryusuke_Tanaka
See All by Ryusuke_Tanaka
An Effective Approach to Unsupervised Machine Translationの紹介
ryusuketa
0
120
Universal Decompositional Semantics on Universal Dependencies
ryusuketa
0
85
Learning Dual Retrieval Module for Semi-supervised Relation Extractionの紹介
ryusuketa
0
82
動画視聴を整数倍(最大値)で_効率化するchrome extension作った
ryusuketa
0
82
双曲空間への単語埋め込みと QAサービスでの自然言語処理を 用いた推薦システムについて
ryusuketa
0
590
Other Decks in Technology
See All in Technology
バグハンター視点によるサプライチェーンの脆弱性
scgajge12
2
450
Claude Code Getting Started Guide(en)
oikon48
0
140
Docker, Infraestructuras seguras y Hardening
josejuansanchez
0
150
Agents IA : la nouvelle frontière des LLMs (Tech.Rocks Summit 2025)
glaforge
0
380
pmconf2025 - 他社事例を"自社仕様化"する技術_iRAFT法
daichi_yamashita
0
500
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
37k
日本Rubyの会の構造と実行とあと何か / hokurikurk01
takahashim
3
470
プロダクトマネージャーが押さえておくべき、ソフトウェア資産とAIエージェント投資効果 / pmconf2025
i35_267
2
340
著者と読み解くAIエージェント現場導入の勘所 Lancers TechBook#2
smiyawaki0820
7
2.8k
Microsoft Agent 365 を 30 分でなんとなく理解する
skmkzyk
1
300
“決まらない”NSM設計への処方箋 〜ビットキーにおける現実的な指標デザイン事例〜 / A Prescription for "Stuck" NSM Design: Bitkey’s Practical Case Study
bitkey
PRO
1
340
「え?!それ今ではHTMLだけでできるの!?」驚きの進化を遂げたモダンHTML
riyaamemiya
10
4.4k
Featured
See All Featured
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.6k
Product Roadmaps are Hard
iamctodd
PRO
55
12k
Learning to Love Humans: Emotional Interface Design
aarron
274
41k
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
GraphQLとの向き合い方2022年版
quramy
50
14k
Git: the NoSQL Database
bkeepers
PRO
432
66k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
36
6.2k
Leading Effective Engineering Teams in the AI Era
addyosmani
8
1.2k
For a Future-Friendly Web
brad_frost
180
10k
What's in a price? How to price your products and services
michaelherold
246
12k
Raft: Consensus for Rubyists
vanstee
140
7.2k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.1k
Transcript
Copyright © 2019 M3, Inc. All rights reserved. インターネットを活用し、 健康で楽しく長生きする人を1人でも増やし、
不必要な医療コストを1円でも減らすこと 医師向けQAサイトのための 推薦システム開発 2019年12月10日
Copyright © 2019 M3, Inc. All rights reserved. 1 ◼
田中 龍亮(たなか りゅうすけ) – 2019年4月 エムスリー入社 – 前職ではセンサーデータを用いたPoC – 大学院では音響信号処理+機械学習の応用 – エムスリーではコンテンツへのタグづけ 機械翻訳、推薦などに着手 右はジャグリングしてたときの写真です (写真アップデートするためにジャグリングしたい 自己紹介
Copyright © 2019 M3, Inc. All rights reserved. 2 医師の診療において、専門外の症例情報に関する情報ニーズに応えるサイト
サイト中の一機能として医師に対して表示質問のパーソナライズしたい要望 推薦システム的課題としてはコールドスタート →(当然ですが)少ない工数で作りたいので、既存プロダクトの活用を考える 医師向けQAサイト
Copyright © 2019 M3, Inc. All rights reserved. 3 feedback(強)
・検索キーワード ・アンケート feedback(中) ・関連記事一覧 feedback(弱) ・アクセスログ Gauss (item, tag, score) Maxwell (user, tag, score) Archimedes (推薦システム) 各サービス分析 サービスの パーソナライズ プロジェクト Isaacs ・EntityLinking ・一覧ページ Knuth ・検索エンジン ・パーソナライズ • 全体を一つのプロダクトだと考え成長させる。 Feynman ・クローラー ・コンテンツ作成支援 3 弊チームMLプロダクトの思想
Copyright © 2019 M3, Inc. All rights reserved. 4 各々、社内のニーズを満たすために作られたプロダクトである一方
パーソナライズするためのユーザー素性とアイテム素性が容易に取れる状態になっている →新規プロダクト開発でも少ない工数で済む! 糖尿病 1型糖尿病 ・・・ Maxwell: 医師の “疾患/薬剤” に対するタグ付け (コンテンツクリックログに基づ く) Gauss: コンテンツに 登場する ”疾患/薬剤”名の抽出(タグ) 糖尿病、合併症、... インスリン、肝機能障害、… 骨粗鬆症、骨折 プロダクト一部紹介(本推薦システムの立役者) m3.com ユーザ m3.com コンテンツ m3.com コンテンツ m3.com コンテンツ
Copyright © 2019 M3, Inc. All rights reserved. 5 素朴なアイデア:ユーザーに紐づくタグとコンテンツに紐づくタグをマッチングさせる
一方でタグ情報のみでは疎 タグ全体では4000個程度実際につけられているのにに対して、 質問文は短く、タグは一件あたり 1-3個程度しかつかない 最低でも10件推薦する要件だがこれでは必要数出せないユーザーが存在しうる → 疾患/薬剤タグを分散表現に落とし込み、密にする。 ベースロジック 糖尿病 1型糖尿病 ・・・ maxwellによる 医師の興味タグ付け Gaussによる質問内の 疾患/薬剤名抽出 糖尿病、合併症、... インスリン、肝機能障害、 … 骨粗鬆症、骨折
Copyright © 2019 M3, Inc. All rights reserved. 6 -
コンテンツに含まれる疾患/薬剤名を抽出して、それをitemとした user x itemの行列を作り行列分解で、疾患 /薬剤名の埋め込み表現を得る(値は閲覧数) - 埋め込みの学習時に次の情報を利用してグラフラプラシアン正則化を導入 - ICD10分類と呼ばれる疾患名の関係性を含んだ木構造 - 疾患と薬剤の投薬関係 - 弊社コンテンツにおいて登場が希少な疾患も学習できるようにするため - タグの埋め込みの和で質問およびユーザー埋め込みを得て、類似度計算 - - 素朴にword embeddingで良いのでは? - 言語的な近さではなく、疾患や薬剤としての専門性の近さが欲しい ロジック - item embedding 糖尿病 インス リン 骨折 子宮癌 ... ユー ザー1 3 4 1 0 ... ユー ザー2 0 0 3 0 ... ユー ザー3 2 1 2 0 ... ユー ザー4 0 0 0 4 ... ... ... ... ... ... 糖尿病 インスリン 骨折 子宮ガン 埋め込み
Copyright © 2019 M3, Inc. All rights reserved. 7 2型糖尿病に対するcos類似度
'ジャディアンス': 0.8617, 'トラゼンタ': 0.8495 'スーグラ': 0.8303, 'クレメジン': 0.7988 'アトーゼット': 0.7970, '低血糖': 0.7827, 'スージャヌ': 0.7547, 'トルリシティ': 0.7501, 'ロトリガ': 0.7488, 'ゼチーア': 0.7483 埋め込み例 1型糖尿病に対するcos類似度 'ランタス': 0.6063, 'ノボラピッド': 0.5892, 'メトホルミン': 0.5878, 'オゼンピック': 0.5792, '肥満症': 0.5702, '糖尿病合併症': 0.5351, 'フレックス': 0.5268, '慢性腎臓病': 0.51808, 'トレシーバ': 0.5150 'その他のグルコース調節・膵内分泌障害 ': 0.4982, それぞれ2型糖尿病に対応する薬、1型糖尿病に対応する薬が上位にでている (メトホルミンとオゼンピックは2型糖尿病に処方するもので意図外 …
Copyright © 2019 M3, Inc. All rights reserved. 8 -
比較的診療科にマッチした結果になっている(データお見せできませんが … - 一部厳しいものもある - クリック数の少ないユーザーなどに関しては補完など行う - 疾患・薬剤情報が抜けない場合 - 年齢情報、性別、副作用、飲み合わせ、安全性、有効性 … - Gaussのタグづけへフィードバックをすることで解決しうる 有効なタグが増えるのでGaussとMaxwellの成長へつながる - “専門外の疑問に応える”ことをまだ叶えられていない - 専門”以外”となってしまうと範囲が広く狙い撃ちがむずかしい - ローンチ後のサイトのログ次第 - 専門外といえど質問には傾向があるかもしれない - 診療科、疾患という軸だけではなく、保守的か革新的かの医師本人の性格軸なども 有効かもしれない 実際に見た結果+課題