Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
医師向けQAサイトのための推薦システム開発
Search
Ryusuke_Tanaka
December 10, 2019
Technology
1
1.5k
医師向けQAサイトのための推薦システム開発
【Merpay x M3 x PFN 共催】 Machine Learning Night にて登壇した時の資料です。
自社プロダクトをベースとして活用した新しいプロダクトを作った時の話です。
Ryusuke_Tanaka
December 10, 2019
Tweet
Share
More Decks by Ryusuke_Tanaka
See All by Ryusuke_Tanaka
An Effective Approach to Unsupervised Machine Translationの紹介
ryusuketa
0
100
Universal Decompositional Semantics on Universal Dependencies
ryusuketa
0
65
Learning Dual Retrieval Module for Semi-supervised Relation Extractionの紹介
ryusuketa
0
50
動画視聴を整数倍(最大値)で_効率化するchrome extension作った
ryusuketa
0
67
双曲空間への単語埋め込みと QAサービスでの自然言語処理を 用いた推薦システムについて
ryusuketa
0
400
Other Decks in Technology
See All in Technology
AIエージェントを現場に導入する目線とは
masahiro_nishimi
1
1.5k
dxd2024-生成AIに振り回された3か月間の成功と失敗/dxd2024-link-and-motivation
lmi
2
260
OSSコミットしてZennの課題を解決した話
dyoshikawa1993
0
150
What is DRE? - Road to SRE NEXT@広島
chanyou0311
3
630
Scaling Technical Excellence at 104: Evolution in AWS and Developer Empowerment
scotthsieh825
1
150
AutomatedLabを使って内部ペンテストを勉強しよう! -やられ社内ネットワークの自動構築-
n_etupirka
1
610
MySQLのロックの種類とその競合
yoku0825
6
1.6k
Azure Pipelinesを使用したCICDベースラインアーキテクチャ実践
yuriemori
0
190
簡単に始めるSnowflakeの機械学習
nayuts
1
190
開発生産性をむしろ向上させる セキュリティパートナーの作り方 / Dev Productivity Con 2024
flatt_security
0
360
AOAI Dev Day LLMシステム開発 Tips集
hirosatogamo
15
3.7k
How to Think Like a Performance Engineer
csswizardry
4
590
Featured
See All Featured
Automating Front-end Workflow
addyosmani
1362
200k
How to train your dragon (web standard)
notwaldorf
79
5.5k
Bootstrapping a Software Product
garrettdimon
PRO
304
110k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
16
1.6k
How to Think Like a Performance Engineer
csswizardry
4
590
Dealing with People You Can't Stand - Big Design 2015
cassininazir
360
22k
Building Effective Engineering Teams - LeadDev
addyosmani
47
2.2k
Keith and Marios Guide to Fast Websites
keithpitt
408
22k
From Idea to $5000 a Month in 5 Months
shpigford
377
46k
4 Signs Your Business is Dying
shpigford
178
21k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
26
2.1k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
17
1.5k
Transcript
Copyright © 2019 M3, Inc. All rights reserved. インターネットを活用し、 健康で楽しく長生きする人を1人でも増やし、
不必要な医療コストを1円でも減らすこと 医師向けQAサイトのための 推薦システム開発 2019年12月10日
Copyright © 2019 M3, Inc. All rights reserved. 1 ◼
田中 龍亮(たなか りゅうすけ) – 2019年4月 エムスリー入社 – 前職ではセンサーデータを用いたPoC – 大学院では音響信号処理+機械学習の応用 – エムスリーではコンテンツへのタグづけ 機械翻訳、推薦などに着手 右はジャグリングしてたときの写真です (写真アップデートするためにジャグリングしたい 自己紹介
Copyright © 2019 M3, Inc. All rights reserved. 2 医師の診療において、専門外の症例情報に関する情報ニーズに応えるサイト
サイト中の一機能として医師に対して表示質問のパーソナライズしたい要望 推薦システム的課題としてはコールドスタート →(当然ですが)少ない工数で作りたいので、既存プロダクトの活用を考える 医師向けQAサイト
Copyright © 2019 M3, Inc. All rights reserved. 3 feedback(強)
・検索キーワード ・アンケート feedback(中) ・関連記事一覧 feedback(弱) ・アクセスログ Gauss (item, tag, score) Maxwell (user, tag, score) Archimedes (推薦システム) 各サービス分析 サービスの パーソナライズ プロジェクト Isaacs ・EntityLinking ・一覧ページ Knuth ・検索エンジン ・パーソナライズ • 全体を一つのプロダクトだと考え成長させる。 Feynman ・クローラー ・コンテンツ作成支援 3 弊チームMLプロダクトの思想
Copyright © 2019 M3, Inc. All rights reserved. 4 各々、社内のニーズを満たすために作られたプロダクトである一方
パーソナライズするためのユーザー素性とアイテム素性が容易に取れる状態になっている →新規プロダクト開発でも少ない工数で済む! 糖尿病 1型糖尿病 ・・・ Maxwell: 医師の “疾患/薬剤” に対するタグ付け (コンテンツクリックログに基づ く) Gauss: コンテンツに 登場する ”疾患/薬剤”名の抽出(タグ) 糖尿病、合併症、... インスリン、肝機能障害、… 骨粗鬆症、骨折 プロダクト一部紹介(本推薦システムの立役者) m3.com ユーザ m3.com コンテンツ m3.com コンテンツ m3.com コンテンツ
Copyright © 2019 M3, Inc. All rights reserved. 5 素朴なアイデア:ユーザーに紐づくタグとコンテンツに紐づくタグをマッチングさせる
一方でタグ情報のみでは疎 タグ全体では4000個程度実際につけられているのにに対して、 質問文は短く、タグは一件あたり 1-3個程度しかつかない 最低でも10件推薦する要件だがこれでは必要数出せないユーザーが存在しうる → 疾患/薬剤タグを分散表現に落とし込み、密にする。 ベースロジック 糖尿病 1型糖尿病 ・・・ maxwellによる 医師の興味タグ付け Gaussによる質問内の 疾患/薬剤名抽出 糖尿病、合併症、... インスリン、肝機能障害、 … 骨粗鬆症、骨折
Copyright © 2019 M3, Inc. All rights reserved. 6 -
コンテンツに含まれる疾患/薬剤名を抽出して、それをitemとした user x itemの行列を作り行列分解で、疾患 /薬剤名の埋め込み表現を得る(値は閲覧数) - 埋め込みの学習時に次の情報を利用してグラフラプラシアン正則化を導入 - ICD10分類と呼ばれる疾患名の関係性を含んだ木構造 - 疾患と薬剤の投薬関係 - 弊社コンテンツにおいて登場が希少な疾患も学習できるようにするため - タグの埋め込みの和で質問およびユーザー埋め込みを得て、類似度計算 - - 素朴にword embeddingで良いのでは? - 言語的な近さではなく、疾患や薬剤としての専門性の近さが欲しい ロジック - item embedding 糖尿病 インス リン 骨折 子宮癌 ... ユー ザー1 3 4 1 0 ... ユー ザー2 0 0 3 0 ... ユー ザー3 2 1 2 0 ... ユー ザー4 0 0 0 4 ... ... ... ... ... ... 糖尿病 インスリン 骨折 子宮ガン 埋め込み
Copyright © 2019 M3, Inc. All rights reserved. 7 2型糖尿病に対するcos類似度
'ジャディアンス': 0.8617, 'トラゼンタ': 0.8495 'スーグラ': 0.8303, 'クレメジン': 0.7988 'アトーゼット': 0.7970, '低血糖': 0.7827, 'スージャヌ': 0.7547, 'トルリシティ': 0.7501, 'ロトリガ': 0.7488, 'ゼチーア': 0.7483 埋め込み例 1型糖尿病に対するcos類似度 'ランタス': 0.6063, 'ノボラピッド': 0.5892, 'メトホルミン': 0.5878, 'オゼンピック': 0.5792, '肥満症': 0.5702, '糖尿病合併症': 0.5351, 'フレックス': 0.5268, '慢性腎臓病': 0.51808, 'トレシーバ': 0.5150 'その他のグルコース調節・膵内分泌障害 ': 0.4982, それぞれ2型糖尿病に対応する薬、1型糖尿病に対応する薬が上位にでている (メトホルミンとオゼンピックは2型糖尿病に処方するもので意図外 …
Copyright © 2019 M3, Inc. All rights reserved. 8 -
比較的診療科にマッチした結果になっている(データお見せできませんが … - 一部厳しいものもある - クリック数の少ないユーザーなどに関しては補完など行う - 疾患・薬剤情報が抜けない場合 - 年齢情報、性別、副作用、飲み合わせ、安全性、有効性 … - Gaussのタグづけへフィードバックをすることで解決しうる 有効なタグが増えるのでGaussとMaxwellの成長へつながる - “専門外の疑問に応える”ことをまだ叶えられていない - 専門”以外”となってしまうと範囲が広く狙い撃ちがむずかしい - ローンチ後のサイトのログ次第 - 専門外といえど質問には傾向があるかもしれない - 診療科、疾患という軸だけではなく、保守的か革新的かの医師本人の性格軸なども 有効かもしれない 実際に見た結果+課題