Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Transformerの推論を線形時間にして皆を驚かせましょう

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
Avatar for 小島瑞貴 小島瑞貴
May 30, 2026
21

 Transformerの推論を線形時間にして皆を驚かせましょう

Avatar for 小島瑞貴

小島瑞貴

May 30, 2026

Transcript

  1. 7 状態をNNで表現するのは妥当…? 1/2 目的は、Transformerの状態の圧縮 Transformer: ☛ 状態は今までのキーとバリューの保存 ☛ 特徴量はクエリqに対して、キーとの類似度によるバリューの重みづけ 本手法:

    キーをバリューに結び付ける関数 を学習 ☛ 特徴量は、クエリqに対して、関数 の入力とする ☛ (入力である)キーとの類似度で、(重みづけ後の)特徴量が出てくる