Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Context Window のお話

schroneko
September 25, 2023

Context Window のお話

https://llm-app.connpass.com/event/296674/

上記イベントの登壇資料です。

schroneko

September 25, 2023
Tweet

More Decks by schroneko

Other Decks in Programming

Transcript

  1. Context Window のお話 もしトークン数を気にせず LLM が使えたら? 林 祐太 / ぬこぬこ

    @schroneko ※このページは削除して構いません USE TEMPLATE Click 1
  2. - 林 祐太 / ぬこぬこ - 12 月から LLM 無職→転職

    - 専門は核融合(核融合はいいぞ!) 自己紹介 2
  3. - 性能評価で GPT-4 と僅差 - 100k Tokens まで入力可 - GPT-4

    の RLHF 味がない 😆😆😆うれしい😆😆😆 ただ、日本で使えるようになる のはもう少し...! Claude のここがすごい! https://chat.lmsys.org/?arena 7 ※ VPN 接続での利用はやめましょう!
  4. - 8月31日の論文 - Context Window の拡張手法 - Llama 2 7B

    / 13 B を 4k → 128k(16~32倍) - 性能劣化はほぼなし(0.49%) https://arxiv.org/abs/2309.00071 https://github.com/jquesnelle/yarn 論文紹介 YaRN: Efficient Context Window Extension of Large Language Models 13
  5. - 9月20日の論文 - Vision Transformer に RetNet を適用 - 計算コストが下がるだけでなく性能向上

    https://arxiv.org/abs/2309.11523 論文紹介 RMT: Retentive Networks Meet Vision Transformers 14
  6. - 9月21日の論文 - Context Window の拡張手法 - Llama 2 7B

    / 13 B / 70B を 4k から 100k / 6k / 32 k に拡張 https://arxiv.org/abs/2309.12307 https://github.com/dvlab-research/LongLoRA 論文紹介 LongLoRA: Efficient Fine-tuning of Long-Context Large Language Models 15
  7. 20