Slide 4
Slide 4 text
Amazonでいただいたコメント
https://www.amazon.co.jp/Vision-Transformer%E5%85%A5%E9%96%80-
Computer-Library/dp/4297130580/
Vision Transformer(ViT)について、前半は余り数式もなく、平易に書かれているので、
何周かすれば段々理解が深まると思います。
…
一方で、後半は数式が増えて来て、数学が苦手な人には苦しい内容となっています。
この本を読んだ一番の収穫は、Vision Transformerが何をやっているのかを概ね理解出
来た点と、何故上手く行くのかはまだ誰もよく分かっていないという事が分かった点(笑)。
「最近Vision Transformer系のモデルの名前をよく聞く。でも一から勉強するのも大変だし、
今やっている仕事はResnetでそこそこ上手くいっているし、後回しで良いか」といったレベ
ル感の人に最適だと思う。
ViTの概念的な説明から実装、応用まで幅広くポイントを抑えている。
特にCNNとの対比や各論文のモチベーションについては簡潔ながら丁寧に書かれている。
4/24