Slide 2
Slide 2 text
2
論文情報
タイトル: DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
• 論文: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
• モデル: https://huggingface.co/deepseek-ai/DeepSeek-R1
• 著者: Daya Guo, Dejian Yang, Haowei Zhang, Junxiao Song, Ruoyu Zhang, Runxin Xu, Qihao Zhu,
Shirong Ma, PeiyiWang, Xiao Bi, Xiaokang Zhang, Xingkai Yu, Yu Wu, Z.F.Wu, Zhibin Gou, Zhihong
Shao, Zhuoshu Li, Ziyi Gao, and many more
• 所属:DeepSeek-AI
選んだ理由:
一般のニュースでも話題になっている中国で開発された世界トップレベルのLLMについて読み
解きたいと思った。