ViT（Vision Transformer）原理与代码精讲

Rating 5.0 out of 5 (1 ratings in Udemy)

What you'll learn

掌握ViT原理
掌握ViT的Pytorch实现代码
学习Transformer的原理
学习einops和einsum的使用方法

Description

Transformer在许多NLP(自然语言处理)任务中取得了最先进的成果。 ViT (Vision Transformer)是Transformer应用于CV（计算机视觉）领域里程碑式的工作，后面发展出更多的变体，如Swin Transformer。

ViT (Vision Transformer)模型发表于论文An Image is Worth 16X16 Words: Transformer For Image Recognition At Scale，使用纯Transformer进行图像分类。ViT在JFT-300M数据集上预训练后，可超过卷积神经网络ResNet的性能，并且所用的训练计算资源可更少。

本课程对ViT的原理与PyTorch实现代码进行精讲，来帮助大家掌握其详细原理和具体实现。其中代 …

Duration 3 Hours 58 Minutes

Paid

Self paced

Intermediate Level

Simplified Chinese (China)

Rating 5.0 out of 5 (1 ratings in Udemy)

Go to the Course
We have partnered with providers to bring you collection of courses, When you buy through links on our site, we may earn an affiliate commission from provider.