zhouchichun的个人博客分享 http://blog.sciencenet.cn/u/zhouchichun

博文

An Image is Worth 16x16 Words: Transformers for Image Recogn

已有 1911 次阅读 2022-2-14 11:05 |系统分类:科研笔记

题目: MAE的介绍与研究 An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale

主讲人:杜启蒙

地点:腾讯会议

时间:2022年02月14日 周一晚 8点30分

简介:1)介绍Vision Transformerde的背景及方法介绍

      2)介绍MAEimageNet数据集自编码效果说明

         3)代码进度    

参考文献:

[1]An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale.Alexey DosovitskiyLucas BeyerAlexander KolesnikovDirk WeissenbornXiaohua ZhaiThomas UnterthinerMostafa DehghaniMatthias MindererGeorg HeigoldSylvain GellyJakob UszkoreitNeil Houlsby ,arxiv.org/abs/2010.11929

[2]Masked Autoencoders Are Scalable Vision Learners, Kaiming He Xinlei Chen Facebook AI Research, FAIR,/arxiv.org/pdf/2111.06377.pdf

[3]李沐视频:https://www.bilibili.com/video/BV1sq4y1q77t?spm_id_from=333.999.0.0




https://blog.sciencenet.cn/blog-3453120-1325232.html

上一篇:513 讨论班 多模态任务综述 (余卓航)
下一篇:基于机器学习的期权对冲最优策略的研究介绍 刘召聪
收藏 IP: 182.241.13.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 11:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部