zhouchichun的个人博客分享 http://blog.sciencenet.cn/u/zhouchichun

博文

513 讨论班 多模态任务综述 (余卓航)

已有 1596 次阅读 2022-2-12 22:13 |系统分类:科研笔记

题目:多模态综述

主讲人:余卓航

地点:腾讯会议

时间:20220213 周日 晚8点30分

简介:1)多模态数据集介绍

2)多模态研究方向

3)多模态论文

参考文献:[1] Vaswani, Ashish, et al. "Attention is all you need." Advances in neural information processing systems 30 (2017).

[2] Chen, Yen-Chun, et al. "Uniter: Universal image-text representation learning." European conference on computer vision. Springer, Cham, 2020.

[3] Lin, T.Y., Maire, M., Belongie, S., Hays, J., Perona, P., Ramanan, D., Doll′ ar, P.,

Zitnick, C.L.: Microsoft coco: Common objects in context. In: ECCV (2014)

[4] Plummer, B.A., Wang, L., Cervantes, C.M., Caicedo, J.C., Hockenmaier, J., Lazeb-

nik, S.: Flickr30k entities: Collecting region-to-phrase correspondences for richer

image-to-sentence models. In: ICCV (2015)




https://blog.sciencenet.cn/blog-3453120-1325050.html

上一篇:题目:星系形态有监督分类研究 (巴朔)
下一篇:An Image is Worth 16x16 Words: Transformers for Image Recogn
收藏 IP: 182.241.13.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-4 18:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部