||

第 7 期 机器智能前沿论坛·第7期将采取线下的方式、在2025年国际图象图形学学术会议(ICIG 2025)期间进行。本期聚焦"多模态智能感知与表征学习",邀请了4位嘉宾进行分享。2025年11月2日(周日)13:00,MIR与您相约徐州! 往期论坛精彩回顾: 【回放】机器智能前沿论坛·第2期 | 伪装场景感知及多模态应用 【回放】机器智能前沿论坛·第3期 | 大规模预训练: 数据、模型和微调 【回顾-线下】机器智能前沿论坛·第4期 | 多模态数据感知与学习 论坛简介 时间:2025年11月2日(周日) 13:00-15:00 地点:徐州宝信君澜度假酒店 二层彭氏厅 日程安排:
论坛简介:
一、基本情况
本次论坛由CSIG视觉检测专委会联合中国科学院自动化研究所主办英文学术期刊Machine Intelligence Research(MIR)共同举办。讲者阵容包括赫然研究员、马佳义教授、江俊君教授、罗娜副研究员等多位在多模态感知、三维视觉、生成模型、脑机接口等前沿方向有深厚积累的专家学者。论坛旨在推动多模态环境下鲁棒表征学习与智能感知技术的深度融合,涵盖从理论算法、数据集构建到实际应用的广泛议题。
二、举办背景与必要性
随着深度学习技术的持续演进,人工智能正从单模态理解向多模态融合加速发展。多模态人工智能不仅能够协同视觉、语言、语音、触觉等多种信息源,提升系统在复杂环境中的感知与推理能力,更被认为是实现下一代人工智能的关键路径。人类天生具备多模态学习能力,即便在信息缺失的情况下仍能形成整体认知,因此如何让机器具备类似的能力已成为学术界与工业界共同关注的焦点。
另一方面,三维视觉感知技术的进步与多模态融合的紧密结合,正在机器人导航、人机交互、增强现实、数字孪生、智能制造等众多领域中发挥核心作用。多模态三维感知系统通过整合视觉、深度、红外、事件等多种数据源,显著提升了智能体对复杂环境的理解与交互能力。
Machine Intelligence Research(MIR)作为中国科学院自动化研究所主办、谭铁牛院士主编的国际高水平期刊,长期以来持续推动机器智能领域的前沿交流与成果传播。本次论坛依托MIR已积累的学术影响力与品牌效应,整合"多模态表征学习"与"三维视觉感知"两大前沿方向,既是对当前研究热点的积极响应,也为跨领域合作提供了宝贵平台。
三、拟达到的目的与意义
本论坛旨在构建一个贯通学术研究与产业实践的高水平交流平台,推动多模态智能感知与表征学习技术的创新与发展。通过邀请深耕领域前沿的专家学者、分享最新研究成果与应用案例,论坛将深入探讨多模态数据融合、三维视觉建模、生成式模型安全、脑机接口等多维议题,促进理论方法突破与技术落地结合。
论坛不仅致力于推动学术共同体内的深入讨论,更希望加强学术界与产业界的联动,推动多模态技术在具身智能、数字医疗、工业检测等实际场景中的广泛应用,为我国乃至全球人工智能前沿发展注入新动能。


范登平,南开大学教授、博导,计算机科学与技术系主任,曾在瑞士苏黎世联邦理工学院担任博士后、曾任阿联酋起源人工智能研究院研究主管。研究方向为计算机视觉、认知计算和医学图像分析。在伪装场景理解方向上有突出成果,谷歌学术引用33,000+次,H指数62,7篇论文单篇引用超1300次(最高5900余次)。是CSIG杰出会员、CCF-CV执行委员,担任MIR/IEEE TIP (SCI 1区)编委、CVPR'23-26/NeurIPS'24-25/MICCAI'24-25领域主席,获得CCF优秀博士学位论文奖、吴文俊优秀青年奖、吴文俊人工智能科学技术奖自然科学二等奖(排四),2021-2024连续四年入选斯坦福全球前2%顶尖科学家榜单、入选2024和2025年斯坦福全球前2%“终身科学影响力榜单”。

讲者简介:
赫然,中国科学院自动化所多模态人工智能系统全国重点实验室研究员,IAPR/IEEE Fellow,IEEE TIFS副主编。从事人工智能、模式识别和计算机视觉研究。承担国家青年科学基金ABC类以及北京杰出青年科学基金等项目。在本领域国际主流期刊TPAMI和IJCV上发表论文23篇,第一作者11篇论文引用过百;研究工作获CAAI技术发明一等奖、CSIG自然科学一等奖、北京市科技进步二等奖等。指导学生获得IEEE SPS最佳青年论文奖、ICPR最佳科学论文奖、北京市优秀博士论文、中国科学院优秀博士论文、IEEE生物特征理事会优秀博士论文。曾/现任TIP资深编委、TPAMI\TCSVT\TBIOM\IJCV\PR\TMLR和自动化学报等国内外期刊编委,四次获最佳编委奖,以及NIPS\ICML\ICCV\CVPR\ECCV\ICLR\AAAI\IJCAI等会议领域主席。
报告简介:
近年来,以GPT-4o为代表的多模态基础大模型已成为新的研究热点,尤其是基于大语言模型进行多模态感知与推理,不断涌现的新能力显示出了通向通用人工智能的潜力。本报告梳理从大语言模型和视觉基础模型到多模态基础大模型的发展脉络,围绕多模态基础大模型的数据、评测、架构、训练和应用等方面展开全方位阐述,并探讨目前存在的问题以及未来的发展方向。

讲者简介:
马佳义,武汉大学电信院教授、博导。研究方向为计算机视觉、信息融合等。发表CVPR、ICCV、IEEE TPAMI、IJCV、Cell等中国科学院一区/CCF A类论文200余篇,获钱学森论文奖、Information Fusion最佳论文奖,谷歌学术引用四万余次,H指数92。曾获湖北省自然科学一等奖(序1),担任Information Fusion、IEEE TIP、IEEE/CAA JAS等期刊AE。
报告简介:
图像融合技术旨在将来自不同源图像中的互补信息集成于一体,生成一幅能够全面表征成像场景的融合图像,从而显著提升目标识别、场景感知与环境理解的能力。本报告以应用导向的多模态图像融合为核心,剖析该领域当前面临的挑战与发展机遇,并系统介绍若干代表性方法。重点围绕未配准多模态图像融合、高低层视觉任务协同下的图像融合、具备退化鲁棒性与文本控制能力的图像融合等方向展开讨论,同时结合典型应用场景,展示其实际价值与广阔的应用前景。




关于Machine Intelligence Research
Machine Intelligence Research(简称MIR,原刊名International Journal of Automation and Computing)由中国科学院自动化研究所主办,于2022年正式出版。MIR立足国内、面向全球,着眼于服务国家战略需求,刊发机器智能领域最新原创研究性论文、综述、评论等,全面报道国际机器智能领域的基础理论和前沿创新研究成果,促进国际学术交流与学科发展,服务国家人工智能科技进步。期刊入选"中国科技期刊卓越行动计划",已被ESCI、EI、Scopus、中国科技核心期刊、CSCD等20余家国际数据库收录,入选图像图形领域期刊分级目录-T2级知名期刊。2022年首个CiteScore分值在计算机科学、工程、数学三大领域的八个子方向排名均跻身Q1区,最佳排名挺进Top 4%,2023年CiteScore分值继续跻身Q1区。2024年获得首个影响因子(IF) 6.4,位列人工智能及自动化&控制系统两个领域JCR Q1区;2025年发布的最新影响因子达8.7,继续跻身JCR Q1区,最佳排名进入全球第6名;2025年一举进入中国科学院期刊分区表计算机科学二区。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-16 07:19
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社