Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
医師向けQAサイトのための推薦システム開発
Search
Ryusuke_Tanaka
December 10, 2019
Technology
1
1.6k
医師向けQAサイトのための推薦システム開発
【Merpay x M3 x PFN 共催】 Machine Learning Night にて登壇した時の資料です。
自社プロダクトをベースとして活用した新しいプロダクトを作った時の話です。
Ryusuke_Tanaka
December 10, 2019
Tweet
Share
More Decks by Ryusuke_Tanaka
See All by Ryusuke_Tanaka
An Effective Approach to Unsupervised Machine Translationの紹介
ryusuketa
0
110
Universal Decompositional Semantics on Universal Dependencies
ryusuketa
0
72
Learning Dual Retrieval Module for Semi-supervised Relation Extractionの紹介
ryusuketa
0
66
動画視聴を整数倍(最大値)で_効率化するchrome extension作った
ryusuketa
0
70
双曲空間への単語埋め込みと QAサービスでの自然言語処理を 用いた推薦システムについて
ryusuketa
0
510
Other Decks in Technology
See All in Technology
ExaDB-XSで利用されているExadata Exascaleについて
oracle4engineer
PRO
3
300
AWSアカウントのセキュリティ自動化、どこまで進める? 最適な設計と実践ポイント
yuobayashi
7
1.6k
Log Analytics を使った実際の運用 - Sansan Data Hub での取り組み
sansantech
PRO
0
110
生成AI×財務経理:PoCで挑むSlack AI Bot開発と現場巻き込みのリアル
pohdccoe
1
810
クラウド食堂とは?
hiyanger
0
130
MIMEと文字コードの闇
hirachan
2
1.5k
Amazon Q Developerの無料利用枠を使い倒してHello worldを表示させよう!
nrinetcom
PRO
2
120
開発者のための FinOps/FinOps for Engineers
oracle4engineer
PRO
2
260
いまからでも遅くない!コンテナでWebアプリを動かしてみよう!コンテナハンズオン編
nomu
0
180
Platform Engineeringで クラウドの「楽しくない」を解消しよう
jacopen
4
210
【Snowflake九州ユーザー会#2】BigQueryとSnowflakeを比較してそれぞれの良し悪しを掴む / BigQuery vs Snowflake: Pros & Cons
civitaspo
2
580
MLflowはどのようにLLMOpsの課題を解決するのか
taka_aki
0
130
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
99
5.4k
Designing for humans not robots
tammielis
250
25k
Practical Orchestrator
shlominoach
186
10k
Designing for Performance
lara
605
68k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
1.1k
The Language of Interfaces
destraynor
156
24k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.2k
Building Adaptive Systems
keathley
40
2.4k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
Embracing the Ebb and Flow
colly
84
4.6k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Building Flexible Design Systems
yeseniaperezcruz
328
38k
Transcript
Copyright © 2019 M3, Inc. All rights reserved. インターネットを活用し、 健康で楽しく長生きする人を1人でも増やし、
不必要な医療コストを1円でも減らすこと 医師向けQAサイトのための 推薦システム開発 2019年12月10日
Copyright © 2019 M3, Inc. All rights reserved. 1 ◼
田中 龍亮(たなか りゅうすけ) – 2019年4月 エムスリー入社 – 前職ではセンサーデータを用いたPoC – 大学院では音響信号処理+機械学習の応用 – エムスリーではコンテンツへのタグづけ 機械翻訳、推薦などに着手 右はジャグリングしてたときの写真です (写真アップデートするためにジャグリングしたい 自己紹介
Copyright © 2019 M3, Inc. All rights reserved. 2 医師の診療において、専門外の症例情報に関する情報ニーズに応えるサイト
サイト中の一機能として医師に対して表示質問のパーソナライズしたい要望 推薦システム的課題としてはコールドスタート →(当然ですが)少ない工数で作りたいので、既存プロダクトの活用を考える 医師向けQAサイト
Copyright © 2019 M3, Inc. All rights reserved. 3 feedback(強)
・検索キーワード ・アンケート feedback(中) ・関連記事一覧 feedback(弱) ・アクセスログ Gauss (item, tag, score) Maxwell (user, tag, score) Archimedes (推薦システム) 各サービス分析 サービスの パーソナライズ プロジェクト Isaacs ・EntityLinking ・一覧ページ Knuth ・検索エンジン ・パーソナライズ • 全体を一つのプロダクトだと考え成長させる。 Feynman ・クローラー ・コンテンツ作成支援 3 弊チームMLプロダクトの思想
Copyright © 2019 M3, Inc. All rights reserved. 4 各々、社内のニーズを満たすために作られたプロダクトである一方
パーソナライズするためのユーザー素性とアイテム素性が容易に取れる状態になっている →新規プロダクト開発でも少ない工数で済む! 糖尿病 1型糖尿病 ・・・ Maxwell: 医師の “疾患/薬剤” に対するタグ付け (コンテンツクリックログに基づ く) Gauss: コンテンツに 登場する ”疾患/薬剤”名の抽出(タグ) 糖尿病、合併症、... インスリン、肝機能障害、… 骨粗鬆症、骨折 プロダクト一部紹介(本推薦システムの立役者) m3.com ユーザ m3.com コンテンツ m3.com コンテンツ m3.com コンテンツ
Copyright © 2019 M3, Inc. All rights reserved. 5 素朴なアイデア:ユーザーに紐づくタグとコンテンツに紐づくタグをマッチングさせる
一方でタグ情報のみでは疎 タグ全体では4000個程度実際につけられているのにに対して、 質問文は短く、タグは一件あたり 1-3個程度しかつかない 最低でも10件推薦する要件だがこれでは必要数出せないユーザーが存在しうる → 疾患/薬剤タグを分散表現に落とし込み、密にする。 ベースロジック 糖尿病 1型糖尿病 ・・・ maxwellによる 医師の興味タグ付け Gaussによる質問内の 疾患/薬剤名抽出 糖尿病、合併症、... インスリン、肝機能障害、 … 骨粗鬆症、骨折
Copyright © 2019 M3, Inc. All rights reserved. 6 -
コンテンツに含まれる疾患/薬剤名を抽出して、それをitemとした user x itemの行列を作り行列分解で、疾患 /薬剤名の埋め込み表現を得る(値は閲覧数) - 埋め込みの学習時に次の情報を利用してグラフラプラシアン正則化を導入 - ICD10分類と呼ばれる疾患名の関係性を含んだ木構造 - 疾患と薬剤の投薬関係 - 弊社コンテンツにおいて登場が希少な疾患も学習できるようにするため - タグの埋め込みの和で質問およびユーザー埋め込みを得て、類似度計算 - - 素朴にword embeddingで良いのでは? - 言語的な近さではなく、疾患や薬剤としての専門性の近さが欲しい ロジック - item embedding 糖尿病 インス リン 骨折 子宮癌 ... ユー ザー1 3 4 1 0 ... ユー ザー2 0 0 3 0 ... ユー ザー3 2 1 2 0 ... ユー ザー4 0 0 0 4 ... ... ... ... ... ... 糖尿病 インスリン 骨折 子宮ガン 埋め込み
Copyright © 2019 M3, Inc. All rights reserved. 7 2型糖尿病に対するcos類似度
'ジャディアンス': 0.8617, 'トラゼンタ': 0.8495 'スーグラ': 0.8303, 'クレメジン': 0.7988 'アトーゼット': 0.7970, '低血糖': 0.7827, 'スージャヌ': 0.7547, 'トルリシティ': 0.7501, 'ロトリガ': 0.7488, 'ゼチーア': 0.7483 埋め込み例 1型糖尿病に対するcos類似度 'ランタス': 0.6063, 'ノボラピッド': 0.5892, 'メトホルミン': 0.5878, 'オゼンピック': 0.5792, '肥満症': 0.5702, '糖尿病合併症': 0.5351, 'フレックス': 0.5268, '慢性腎臓病': 0.51808, 'トレシーバ': 0.5150 'その他のグルコース調節・膵内分泌障害 ': 0.4982, それぞれ2型糖尿病に対応する薬、1型糖尿病に対応する薬が上位にでている (メトホルミンとオゼンピックは2型糖尿病に処方するもので意図外 …
Copyright © 2019 M3, Inc. All rights reserved. 8 -
比較的診療科にマッチした結果になっている(データお見せできませんが … - 一部厳しいものもある - クリック数の少ないユーザーなどに関しては補完など行う - 疾患・薬剤情報が抜けない場合 - 年齢情報、性別、副作用、飲み合わせ、安全性、有効性 … - Gaussのタグづけへフィードバックをすることで解決しうる 有効なタグが増えるのでGaussとMaxwellの成長へつながる - “専門外の疑問に応える”ことをまだ叶えられていない - 専門”以外”となってしまうと範囲が広く狙い撃ちがむずかしい - ローンチ後のサイトのログ次第 - 専門外といえど質問には傾向があるかもしれない - 診療科、疾患という軸だけではなく、保守的か革新的かの医師本人の性格軸なども 有効かもしれない 実際に見た結果+課題