【2025年10月~12月】医療分野 ×LLM研究紹介

【2025年10月~12月】医療分野×LLM研究紹介 ※ 今回は当該期間に含まれない前の時期の内容が多いです。

4B, 27BのモデルがHuggingface上で公開されています。 https://huggingface.co/google/medgemma-27b-it MedGemma（Google, 2025/7）医療ドメインのVLMといえば！ SigLIPという画像エンコーダを匿名化された医療画像で事前学習。 - 胸部X線画像
- 皮膚病学画像 - 眼科学画像 - 組織病理学画像等。 ReXVQA[PSB2026]というベンチマークでもその強さが検証されています！ MedGemma 83.24% JanusPro-7B 66.56% Qwen2.5-VL 65.55% 医療ドメイン特化の効果が顕著に見られる！ https://arxiv.org/abs/2507.05201

SIPの新しい医療 LLM（NII, 2025/11） https://huggingface.co/SIP-med-LLM/SIP-jmed-llm-3-8x13b- AC-32k-instruct 研究用途限定・商用利用不可ベースモデルはLLM-JP-3, 8x13BのMoE（Mixture of Experts）モデルのようです。
ベンチマークスコアは12/4現在見受けられません。国産の最新医療LLM！

MedAgentBench（Jiang et al., NEJMAI, 2025/8） StanfordMLチームから, AgentBenchを医療用に発展させたベンチマークが公開されました。　https://github.com/stanfordmlgroup/MedAgentBench DockerとAPIKEYですぐ動かせそう医療AIエージェントの評価研究！
- Gorilla(2023)という若干古めの研究が BFCLという名で引用されているが... （？） Claudeがbest success rateで69.67%でした。 success rateが伸び悩んだ一因としては、想定したフォーマット通りの回答を出力するように制御しきれていない点が挙げられています。

MedTutor（Jang et al., EMNLP2025）医療の教育にも活用！ https://aclanthology.org/2025.emnlp-demos.24.pdf vLLMを用いたRAGシステムで症例報告を教育コンテンツに RAGシステムの設計方法としても参考になる部分が。
本研究はRadiologyが対象だが, 他の領域にも転用可能性が高い。評価には専門の放射線科医が参画。alignment度合いは中であり、まだまだ専門家の存在も重要。

How far are we from Baymax?（Wang et al., 2025/5）医療AIといえば「ベイマックス」！ということで、現状のLLM
Agentがどこまでの性能を発揮するのかを調べたサーベイ論文となります。論文内に画像貼ってあるけど権利とか大丈夫なのだろうか。。。（・ー・） https://arxiv.org/pdf/2502.11211 医療LLMのサーベイ論文まとめ方や考察など、あまり示唆などは無いかな ...という感じだったので調査用に。ドメイン特化LLMでおなじみの米Hippocratic AI社は、2024年の時点でPolarisというconstellation architectureを発表している。さすが。 https://arxiv.org/pdf/2403.13313 各個別タスクに対する試みとしては成功例が順調に増えているが、それらを統合することによって全体のワークフローの効率性向上が見込めるかはまた別の話、という課題感がある。

NeurIPS 2025 関連論文調査 NeurIPSをチェック！ • MedChain ◦ personalization, interactivity, sequentialityに重きをおいた臨床判断の
新たなベンチマーク • CARES ◦ 医療における安全性評価のための18000種のプロンプトを含むデータセット • Cure-Bench ◦ Drug Decision-MakingをReasoning LLMで解くタスクの様 ◦ 学会と並走する形で、Kaggleで開催されていた ◦ こういうのに参加してみるのも面白そう

余談 2025年下半期はあまり目玉の発表は無さげ ...（見落としていたらすみません） OpenMedicalLLMというリーダーボードが現在はエラーが出てしまう ...

【2025年10月~12月】医療分野 ×LLM研究紹介

【2025年10月~12月】医療分野 ×LLM研究紹介

Stardust

More Decks by Stardust

Featured

Transcript