博文

Luc Van Gool团队 | 深度学习视角下的视频息肉分割

已有 2089 次阅读 2022-12-1 14:46 |个人分类:好文推荐|系统分类:论文交流

在深度学习时代下，苏黎世联邦理工大学Luc Van Gool团队呈现了首个关于视频息肉分割(VPS)技术的系统性研究。近年来，由于缺乏具有大规模细粒度分割标签的数据集，视频息肉分割研究领域的发展并不顺利。为解决上述问题，本文首次引入一个具有逐帧标注的高质量视频息肉分割数据集SUN-SEG，其中包含了来自著名SUN数据集中的158690张结肠镜视频帧。并额外提供了不同类型的标签，即：属性标签、目标掩码、边缘标签、线标签和多边形标签。其次，本文设计了一个简单且高效的基线模型PNS+，其包含全局编码器、局部编码器和归一化自注意力(NS)模块。本文接着在SUN-SEG数据集上广泛地评测了13个经典的息肉/目标分割模型，并且提供了基于属性的评测结果。最后，本文讨论了领域内亟待解决的几个问题，并为视频息肉分割研究社区提出了若干潜在研究方向。

springer截图.jpg

图片来自Springer

结直肠癌(CRC)是全球第二大致命癌症和第三大常见的恶性肿瘤，据估计每年会在全球范围内造成数百万人发病和死亡。结直肠癌患者在第一阶段的生存概率超过95%，但在第四和第五阶段却大幅下降到35%以下。因此，通过结肠镜、乙状结肠镜等筛查技术对阳性结直肠癌病例进行早期预诊，对于提高患者生存率具有重要意义。为达到预防目的，内科医师可以切除有癌变风险的结肠息肉。然而，这一过程高度依赖于医师的经验水平，且出现了较高的息肉漏诊率(即：22%-28%)。

近年来，人工智能(AI)技术被医生用于执行结肠镜检查过程中进行病变息肉自动检测。然而，开发出具有令人满意的检测率的人工智能方案仍具有挑战性，其主要存在以下两个问题：

(a)有限的标注数据：深度学习模型通常需要具有密集标注的大规模视频数据集。此外，研究社区内也缺乏一个广泛认可的评测基准用于评估对比方法的版实能力(例如：准确率和效率)。

(b)动态复杂性：结肠镜检查通常涉及到不太理想的相机运动和图像采集条件，包括息肉的多样性(例如：边缘对比度、形状、方向、角度)、肠道杂物(例如：水流、残留物)和成像退化(例如：颜色失版、镜面反射)。

为此，本文呈现了一个系统性的研究工作，用以推动深度学习模型在视频息肉分割(VPS)领域的发展。主要贡献如下:

•视频息肉分割数据集：本文提出一个名为SUN-SEG的大规模视频息肉分割数据集，其包含了从SUN中选取的158690个视频帧。本文还提供了各类标签，包括：属性标签、目标掩码、边缘标签、线标签和多边形标签，用于进一步推动结肠镜诊断、定位及其衍生任务的发展。

SUN-SEG数据集详细统计信息：

https://github.com/GewelsJI/VPS/blob/main/docs/DATA_DESCRIPTION.md

•视频息肉分割基线模型：本文设计了一个简单且高效的视频息肉分割基线模型，名为PNS+，其由一个全局编码器、一个局部编码器和两个归一化自注意力(NS)模块组成。全局编码器和局部编码器分别用于从锚帧和多个连续帧中提取长期和短期表征。归一化自注意力模块则用于在所提取特征之间耦合注意力线索时，动态地更新感受野。实验表明PNS+在具有挑战性的SUN-SEG数据集上取得了最佳性能。

归一化.jpg

基于归一化自注意力(NS)模块(b)的PNS+网络的框架流程图(a)

•视频息肉分割评测基准：为了对视频息肉分割发展提供更为全面的理解，本文进行了首个大规模基准评测，其包含了对13个(即：5个基于图像和8个基于视频)前沿的息肉分割/目标分割方法进行评测。根据评测基准的结果，本文观察到视频息肉分割任务尚未很好的解决。这为未来进一步的探索留下了很大的空间。

全文下载：

Video Polyp Segmentation: A Deep Learning Perspective

Ge-Peng Ji, Guobao Xiao, Yu-Cheng Chou, Deng-Ping Fan, Kai Zhao, Geng Chen, Luc Van Gool

https://link.springer.com/article/10.1007/s11633-022-1371-y

https://www.mi-research.net/en/article/doi/10.1007/s11633-022-1371-y

【本文作者】

MIR为所有读者提供免费寄送纸刊服务，如您对本篇文章感兴趣，请点击下方链接或扫描下方二维码填写收件地址，编辑部将在7个工作日内为您免费寄送纸版全文！

说明：如因疫情原因无法寄达的，将推迟邮寄时间，咨询电话010-82544737

收件信息登记：

https://www.wjx.cn/vm/rfQWEKc.aspx

Machine Intelligence Research（简称MIR，原刊名International Journal of Automation and Computing）由中国科学院自动化研究所主办，于2022年正式出版。MIR立足国内、面向全球，着眼于服务国家战略需求，刊发机器智能领域最新原创研究性论文、综述、评论等，全面报道国际机器智能领域的基础理论和前沿创新研究成果，促进国际学术交流与学科发展，服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划"，已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等数据库收录。

专题综述 | 高效的视觉识别: 最新进展及类脑方法综述

北大黄铁军团队 | 专题综述：视觉信息的神经解码

专题综述 | 迈向脑启发计算机视觉的新范式

专题好文 | 新型类脑去噪内源生成模型: 解决复杂噪音下的手写数字识别问题

Top综述集锦 | 进化计算、知识挖掘、自然语言处理、人脸素描合成、机器人辅助手术...

戴琼海院士团队 | 用以图像去遮挡的基于事件增强的多模态融合混合网络

ETH Zurich重磅综述 | 人脸-素描合成：一个新的挑战

综述：从远程操作到自动机器人辅助显微手术

华南理工詹志辉团队 | 综述: 面向昂贵优化的进化计算

北科大殷绪成团队 | 弱相关知识集成的小样本图像分类

东南大学张敏灵团队 | 基于选择性特征增广的多维分类方法

联想CTO芮勇团队 | 知识挖掘：跨领域的综述

中科院自动化所何晖光团队 | 一种基于RGEC的新型网络

最新好文 | 基于因果推断的可解释对抗防御

复旦邱锡鹏团队 | 综述：自然语言处理中的范式转换

精选综述 | 用于白内障分级/分类的机器学习技术

MIR第一期：主编谭铁牛院士寄语, MIR第一期正式出版！

MIR第二期：聚焦知识挖掘、5G、强化学习等领域；来自联想研究院、中科院自动化所等团队

MIR第三期：聚焦自然语言处理、机器学习等领域；来自复旦大学、中科院自动化所等团队

MIR第四期：来自苏黎世联邦理工学院Luc Van Gool教授团队、清华大学戴琼海院士团队等

MIR第五期：重磅专题 | 类脑机器学习

喜报 | MIR被 ESCI 收录！

喜报 | MIR 被 EI 与 Scopus 数据库收录

喜报！MIR入选“中国科技核心期刊

转载本文请联系原作者获取授权，同时请注明本文来自陈培颖科学网博客。
链接地址：https://blog.sciencenet.cn/blog-749317-1366060.html

上一篇：智能科学创新讲堂 | 东南大学张敏灵: 多维分类的研究
下一篇：报喜！MIR入选2022年国际影响力TOP期刊榜单

收藏 IP: 159.226.180.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

陈培颖

扫一扫，分享此博文

Chenfiona的个人博客分享 http://blog.sciencenet.cn/u/Chenfiona

博文

Luc Van Gool团队 | 深度学习视角下的视频息肉分割

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

陈培颖

全部作者的其他最新博文

全部精选博文导读

Chenfiona的个人博客分享 http://blog.sciencenet.cn/u/Chenfiona

博文

Luc Van Gool团队 | 深度学习视角下的视频息肉分割

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

陈培颖

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)