||

智能科学创新讲堂·AI新锐系列由国际人工智能期刊Machine Intelligence Research (MIR)主办,分若干专题,聚焦机器智能领域的最新进展与前沿探索,面向全球青年学者,定期邀请他们分享在人工智能顶级会议或权威期刊上发表的代表性成果。讲堂旨在搭建一个展示青年科研力量、促进跨机构与跨学科交流的平台,激发智能科学领域的创新思维与学术合作,推动青年人才成长与前沿研究传播。
智能科学创新讲堂·总第二十三讲
“隐性视觉感知”专题
智能科学创新讲堂本期聚焦"隐性视觉感知"专题。"隐性视觉感知"专题专注于伪装目标检测、透明物体分割、阴影检测等隐性视觉感知前沿研究,并积极探索其在医疗影像(如息肉检测)等领域的应用拓展。旨在让这个重要而富有挑战性的研究主题更加活跃,通过开放的学术交流不断迸发新的思想火花,推动学术社区繁荣和领域持续进步,促进计算机视觉与医疗影像等交叉领域的深入交流与合作,逐步打通不同应用场景的技术壁垒。
南开大学孙国磊教授将开启本专题本年度最后一场分享会,杜克大学何春明博士担纲主持。2025年12月11日 (周四) 10:00,四大平台同步直播,诚邀您预约收看!
往期分享回放:
第1期 · CVPR 2025最新工作 | 视角重构:环境感知驱动的无监督伪装目标检测新范式
第2期 · TPAMI 2025最新工作 | SAM赋能: 不完全监督下伪装目标分割的统一解决方案
第3期 · ICCV 2025最新工作 | LawDIS: 语言与窗口双控的主体目标分割方法
第4期 · ICCV 2025最新工作 | 重新思考在无约束场景中检测显著与伪装目标
主持人简介

何春明 博士
何春明,杜克大学博士生,主要研究方向为多模态大模型辅助的真实世界感知与理解。以第一作者/通讯作者在TPAMI, TNNLS, TITS, TCSVT, CVPR, ICCV, NeurIPS, ICLR, ICML等顶级会议与期刊上发文数十篇。曾获杜克大学John Chambers奖学金和Pratt-Gardner奖学金。
分享主题 & 分享嘉宾简介
分享主题:
复杂感知挑战: 多模态基础模型驱动的感知新范式
分享人:

孙国磊 教授
孙国磊,南开大学教授、博导,国家级青年人才。博士毕业于ETH Zurich,师从国际计算机视觉顶尖科学家Luc Van Gool教授。并随后担任博士后研究员。曾在阿联酋人工智能研究院任研究工程师。研究方向为多模态大模型,视频理解,模型轻量化和底层视觉。在CCF-A类等国际顶级期刊和会议上发表论文40余篇,谷歌学术论文总引用9000余次。
MIR计算机视觉相关文章推荐:
https://www.mi-research.net/en/topic?id=424dd21b-9fbb-468c-abb9-213d9898bb22
报告摘要
在人工智能和计算机视觉快速发展的领域,视觉语言模型(VLMs)以及视觉基础模型(SAM2)正在为解决高难度感知任务开辟新路径。本次报告将探讨一系列创新方法,利用这些强大工具突破少样本学习、伪装视频目标检测以及长时间视频跟踪等方面的局限。首先,我们介绍基于视觉语言模型的广义少样本3D点云分割,该方法通过整合VLMs,在极少样本条件下实现高效、泛化的3D点云分割。该方法在多样化场景中展现出鲁棒性能,大幅降低对海量标注数据的依赖。其次,我们将介绍一种可在伪装视频中精准分割任意目标的方法,其将SAM2扩展至动态视频中的伪装场景。通过自适应特征融合与运动感知优化,显著提升了与背景融合目标的分割精度,适用于安防监控与野生动物监测等领域。最后,我们提出通过层次化运动估计与内存优化提升SAM2的长时序跟踪能力,增强SAM2在长序列中的性能。通过优化内存占用并进行多尺度运动估计,实现长时间可靠跟踪,有效缓解目标漂移。这些工作展示了VLMs与基础模型如何适应真实世界感知难题,为构建更通用更鲁邦的AI系统铺平道路。我们将讨论核心思想、实验结果以及该领域的未来方向。
讨论环节
参与嘉宾:
分享人:孙国磊,南开大学
主持人:何春明,杜克大学
观看渠道
直播通道①:
哔哩哔哩APP搜索"中国科学院自动化所”或扫描下方二维码,直播当天点击头像即可进入

直播通道②:中国科学院自动化研究所 视频号

直播通道③:机器智能研究MIR 视频号

直播通道④:蔻享学术
点击下方链接进入"智能科学创新讲堂"主题页,直播当天选择相应直播即可观看
https://www.koushare.com/homepage/332528
直播服务
微信微信公众号"机器智能研究MIR”(发布最新讲座资料)

直播群:实时更新通知 (请备注: 研究方向+姓名)


∨
关于Machine Intelligence Research
Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区;2025年发布的最新影响因子达8.7,继续跻身JCR Q1区,最佳排名进入全球第6名;2025年一举进入中国科学院期刊分区表计算机科学二区。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-16 06:43
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社