2,000,000 Claude 3 200,000 InternLM 2.5 1,000,000 Yi 200k 200,000 Llama 3.1 128,000 Phi3 128k 128,000 Deepseek-V2 128,000 • オープンなモデルでも,100K〜1Mの入力長を扱えるようになってきた • 長い文章をそのままモデルに入力できるように. • 一方で,長い入力に対してモデルがどのように振る舞うのかの検証は少ない • (注)下記は全て2024年以降のモデル.論文発表時点では16,000token程度が主流