Upgrade to Pro — share decks privately, control downloads, hide ads and more …

金研究室 勉強会 『Attention is all you need』

winnie279
August 12, 2021

金研究室 勉強会 『Attention is all you need』

Attention is all you need, Ashish et al., 2017, arXiv:1706.03762

winnie279

August 12, 2021
Tweet

More Decks by winnie279

Other Decks in Science

Transcript

  1. Attention Is All You Need Ashish et al., 2017, arXiv:1706.03762

    金研 機械学習勉強会 2021/08/12 中村勇士
  2. Transformerとは? • RNNの問題点 ◦ 長い入力が苦手 ◦ 勾配消失問題が起こりやすい ◦ 並列化が困難 →

    GPUによる学習の効率化・大量のデータによる学習が困難 • Transformerによる解決 ◦ 再帰や畳み込みを使用しない ◦ 大規模なモデル・データを使用可能 ◦ 精度の大幅な向上
  3. • エンコーダ(左) ◦ input ◦ N = 6 • デコーダ(右)

    ◦ output ◦ N = 6 モデル:エンコーダ・デコーダ input からの 出力
  4. モデル:埋め込み / ポジショナル・エンコーディング • 埋め込み:単語のベクトル化 ◦ • ポジショナル・エンコーディング ◦ 構造のベクトル化

    ◦ 再帰や畳み込みの必要がなくなる ◦ モデルの学習が容易になる pos: 単語の順番, i: 次元, d model : 全体の次元数
  5. Transformerの活用 • 自然言語処理(NLP) ◦ BERT ◦ GPT-3 ◦ DALL・E(テキストから画像生成) •

    その他 ◦ 地震学:EQTransformer(地震動検出・フェーズピック) ◦ 生物学:AlphaFold2(タンパク質の構造予測) ◦ 音楽:Music Transformer(作曲)
  6. おまけ • Transformer解説:GPT-3、BERT、T5の背後にあるモデルを理解する ◦ AINOW ◦ https://ainow.ai/2021/06/25/256107 • The Illustrated

    Transformer ◦ Jay Alammar ◦ http://jalammar.github.io/illustrated-transformer • Embedding Projector ◦ http://projector.tensorflow.org/