Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
医師向けQAサイトのための推薦システム開発
Search
Ryusuke_Tanaka
December 10, 2019
Technology
1
1.6k
医師向けQAサイトのための推薦システム開発
【Merpay x M3 x PFN 共催】 Machine Learning Night にて登壇した時の資料です。
自社プロダクトをベースとして活用した新しいプロダクトを作った時の話です。
Ryusuke_Tanaka
December 10, 2019
Tweet
Share
More Decks by Ryusuke_Tanaka
See All by Ryusuke_Tanaka
An Effective Approach to Unsupervised Machine Translationの紹介
ryusuketa
0
110
Universal Decompositional Semantics on Universal Dependencies
ryusuketa
0
74
Learning Dual Retrieval Module for Semi-supervised Relation Extractionの紹介
ryusuketa
0
67
動画視聴を整数倍(最大値)で_効率化するchrome extension作った
ryusuketa
0
71
双曲空間への単語埋め込みと QAサービスでの自然言語処理を 用いた推薦システムについて
ryusuketa
0
530
Other Decks in Technology
See All in Technology
AIでめっちゃ便利になったけど、結局みんなで学ぶよねっていう話
kakehashi
PRO
0
180
DuckDB MCPサーバーを使ってAWSコストを分析させてみた / AWS cost analysis with DuckDB MCP server
masahirokawahara
0
1.3k
更新系と状態
uhyo
7
1.6k
QA/SDETの現在と、これからの挑戦
imtnd
0
130
クラウド開発環境Cloud Workstationsの紹介
yunosukey
0
180
システムとの会話から生まれる先手のDevOps
kakehashi
PRO
0
290
JPOUG Tech Talk #12 UNDO Tablespace Reintroduction
nori_shinoda
2
140
React ABC Questions
hirotomoyamada
0
450
3月のAWSアップデートを5分間でざっくりと!
kubomasataka
0
120
Porting PicoRuby to Another Microcontroller: ESP32
yuuu
4
430
彩の国で始めよう。おっさんエンジニアから共有したい、当たり前のことを当たり前にする技術
otsuki
0
150
サーバレス、コンテナ、データベース特化型機能をご紹介。CloudWatch をもっと使いこなそう!
o11yfes2023
0
180
Featured
See All Featured
Bash Introduction
62gerente
611
210k
It's Worth the Effort
3n
184
28k
A Tale of Four Properties
chriscoyier
158
23k
BBQ
matthewcrist
88
9.6k
What’s in a name? Adding method to the madness
productmarketing
PRO
22
3.4k
Visualization
eitanlees
146
16k
Docker and Python
trallard
44
3.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Mobile First: as difficult as doing things right
swwweet
223
9.6k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
32
5.4k
Navigating Team Friction
lara
184
15k
Transcript
Copyright © 2019 M3, Inc. All rights reserved. インターネットを活用し、 健康で楽しく長生きする人を1人でも増やし、
不必要な医療コストを1円でも減らすこと 医師向けQAサイトのための 推薦システム開発 2019年12月10日
Copyright © 2019 M3, Inc. All rights reserved. 1 ◼
田中 龍亮(たなか りゅうすけ) – 2019年4月 エムスリー入社 – 前職ではセンサーデータを用いたPoC – 大学院では音響信号処理+機械学習の応用 – エムスリーではコンテンツへのタグづけ 機械翻訳、推薦などに着手 右はジャグリングしてたときの写真です (写真アップデートするためにジャグリングしたい 自己紹介
Copyright © 2019 M3, Inc. All rights reserved. 2 医師の診療において、専門外の症例情報に関する情報ニーズに応えるサイト
サイト中の一機能として医師に対して表示質問のパーソナライズしたい要望 推薦システム的課題としてはコールドスタート →(当然ですが)少ない工数で作りたいので、既存プロダクトの活用を考える 医師向けQAサイト
Copyright © 2019 M3, Inc. All rights reserved. 3 feedback(強)
・検索キーワード ・アンケート feedback(中) ・関連記事一覧 feedback(弱) ・アクセスログ Gauss (item, tag, score) Maxwell (user, tag, score) Archimedes (推薦システム) 各サービス分析 サービスの パーソナライズ プロジェクト Isaacs ・EntityLinking ・一覧ページ Knuth ・検索エンジン ・パーソナライズ • 全体を一つのプロダクトだと考え成長させる。 Feynman ・クローラー ・コンテンツ作成支援 3 弊チームMLプロダクトの思想
Copyright © 2019 M3, Inc. All rights reserved. 4 各々、社内のニーズを満たすために作られたプロダクトである一方
パーソナライズするためのユーザー素性とアイテム素性が容易に取れる状態になっている →新規プロダクト開発でも少ない工数で済む! 糖尿病 1型糖尿病 ・・・ Maxwell: 医師の “疾患/薬剤” に対するタグ付け (コンテンツクリックログに基づ く) Gauss: コンテンツに 登場する ”疾患/薬剤”名の抽出(タグ) 糖尿病、合併症、... インスリン、肝機能障害、… 骨粗鬆症、骨折 プロダクト一部紹介(本推薦システムの立役者) m3.com ユーザ m3.com コンテンツ m3.com コンテンツ m3.com コンテンツ
Copyright © 2019 M3, Inc. All rights reserved. 5 素朴なアイデア:ユーザーに紐づくタグとコンテンツに紐づくタグをマッチングさせる
一方でタグ情報のみでは疎 タグ全体では4000個程度実際につけられているのにに対して、 質問文は短く、タグは一件あたり 1-3個程度しかつかない 最低でも10件推薦する要件だがこれでは必要数出せないユーザーが存在しうる → 疾患/薬剤タグを分散表現に落とし込み、密にする。 ベースロジック 糖尿病 1型糖尿病 ・・・ maxwellによる 医師の興味タグ付け Gaussによる質問内の 疾患/薬剤名抽出 糖尿病、合併症、... インスリン、肝機能障害、 … 骨粗鬆症、骨折
Copyright © 2019 M3, Inc. All rights reserved. 6 -
コンテンツに含まれる疾患/薬剤名を抽出して、それをitemとした user x itemの行列を作り行列分解で、疾患 /薬剤名の埋め込み表現を得る(値は閲覧数) - 埋め込みの学習時に次の情報を利用してグラフラプラシアン正則化を導入 - ICD10分類と呼ばれる疾患名の関係性を含んだ木構造 - 疾患と薬剤の投薬関係 - 弊社コンテンツにおいて登場が希少な疾患も学習できるようにするため - タグの埋め込みの和で質問およびユーザー埋め込みを得て、類似度計算 - - 素朴にword embeddingで良いのでは? - 言語的な近さではなく、疾患や薬剤としての専門性の近さが欲しい ロジック - item embedding 糖尿病 インス リン 骨折 子宮癌 ... ユー ザー1 3 4 1 0 ... ユー ザー2 0 0 3 0 ... ユー ザー3 2 1 2 0 ... ユー ザー4 0 0 0 4 ... ... ... ... ... ... 糖尿病 インスリン 骨折 子宮ガン 埋め込み
Copyright © 2019 M3, Inc. All rights reserved. 7 2型糖尿病に対するcos類似度
'ジャディアンス': 0.8617, 'トラゼンタ': 0.8495 'スーグラ': 0.8303, 'クレメジン': 0.7988 'アトーゼット': 0.7970, '低血糖': 0.7827, 'スージャヌ': 0.7547, 'トルリシティ': 0.7501, 'ロトリガ': 0.7488, 'ゼチーア': 0.7483 埋め込み例 1型糖尿病に対するcos類似度 'ランタス': 0.6063, 'ノボラピッド': 0.5892, 'メトホルミン': 0.5878, 'オゼンピック': 0.5792, '肥満症': 0.5702, '糖尿病合併症': 0.5351, 'フレックス': 0.5268, '慢性腎臓病': 0.51808, 'トレシーバ': 0.5150 'その他のグルコース調節・膵内分泌障害 ': 0.4982, それぞれ2型糖尿病に対応する薬、1型糖尿病に対応する薬が上位にでている (メトホルミンとオゼンピックは2型糖尿病に処方するもので意図外 …
Copyright © 2019 M3, Inc. All rights reserved. 8 -
比較的診療科にマッチした結果になっている(データお見せできませんが … - 一部厳しいものもある - クリック数の少ないユーザーなどに関しては補完など行う - 疾患・薬剤情報が抜けない場合 - 年齢情報、性別、副作用、飲み合わせ、安全性、有効性 … - Gaussのタグづけへフィードバックをすることで解決しうる 有効なタグが増えるのでGaussとMaxwellの成長へつながる - “専門外の疑問に応える”ことをまだ叶えられていない - 専門”以外”となってしまうと範囲が広く狙い撃ちがむずかしい - ローンチ後のサイトのログ次第 - 専門外といえど質問には傾向があるかもしれない - 診療科、疾患という軸だけではなく、保守的か革新的かの医師本人の性格軸なども 有効かもしれない 実際に見た結果+課題