博文

An Image is Worth 16x16 Words: Transformers for Image Recogn

已有 1911 次阅读 2022-2-14 11:05 |系统分类:科研笔记

题目： MAE的介绍与研究 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

主讲人：杜启蒙

地点：腾讯会议

时间：2022年02月14日周一晚 8点30分

简介：1)介绍Vision Transformerde的背景及方法介绍

2)介绍MAE在imageNet数据集自编码效果说明

3)代码进度

参考文献：

[2]Masked Autoencoders Are Scalable Vision Learners, Kaiming He ，Xinlei Chen （Facebook AI Research, FAIR）,/arxiv.org/pdf/2111.06377.pdf

[3]李沐视频：https://www.bilibili.com/video/BV1sq4y1q77t?spm_id_from=333.999.0.0

转载本文请联系原作者获取授权，同时请注明本文来自周池春科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3453120-1325232.html

上一篇：513 讨论班多模态任务综述（余卓航）
下一篇：基于机器学习的期权对冲最优策略的研究介绍刘召聪

收藏 IP: 182.241.13.*| 热度|

数据加载中...

返回顶部