vison transformer vit 论文阅读
An Image is Worth 16x16 Words
20年的论文看成10年的哈斯我了
[2010.11929] 一张图像胜过 16x16 个单词:用于大规模图像识别的转换器 --- [2010.11929] An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
为什么transformer好训练,transformer很好训练吗
为什么 transformer性能不会饱和