JJSIMQA l Llama3-Preferred-MedSwallow-70B2 l 作成者:株式会社Preferred Networks l 評価データ:IgakuQA 関連研究 [1] https://www.anlp.jp/proceedings/annual_meeting/2024/pdf_dir/P9-4.pdf [2] https://tech.preferred.jp/ja/blog/llama3-preferred-medswallow-70b/
l MedQA4:医師国家試験 l MedMCQA5:医学部⼊学試験 l PubMedQA6:PubMedのアブストから作成(yes, no, maybeの3択) l MMLU7:マルチタスク⾔語理解ベンチマーク 関連研究 [1] https://www.nature.com/articles/s41586-023-06291-2 [2] https://arxiv.org/pdf/2311.16452 [3] https://arxiv.org/abs/2402.10373 [4] https://www.mdpi.com/2076-3417/11/14/6421 [5] https://aclanthology.org/D19-1259.pdf [6] https://proceedings.mlr.press/v174/pal22a/pal22a.pdf [7] https://openreview.net/pdf?id=d7KBjmI3GmQ
Extraction l Text Classification l Natural Language Inference l Semantic Textual Similarity l Information Retrieval l Text Summarization/Generation l Text Simplification 関連研究 https://arxiv.org/pdf/2311.05112
各Datasetは100件ずつ (全件のデータも公開) l 形式はtag, question, option, answerを含むcsv l 正解ラベル分布は均衡に l ライセンスは元データに従う データセットの概要(JMED-LLM) https://github.com/sociocom/JMED-LLM
Disease Recognition) 症例報告(50件),読影レポート(50件) l 6: MRNER-medicine (Medical Report Medicine Recognition) 症例報告のみ(読影レポートに該当エンティティが存在しないため) l m-key(薬品名):66件 l m-val(薬品に関わる値):34件 l 7: NRNER (Nursing Report Named Entity Recognition) 模擬看護記録のみ(ライセンス異なるためMRNERと別タスクに) l d(患者に認められた症状):50件 l m-key(薬品名):25件 l m-val(薬品に関わる値):25件 タスク5, 6, 7(固有表現抽出)