Chenfiona的个人博客分享 http://blog.sciencenet.cn/u/Chenfiona

博文

直播预告 | 基于文本提示与可控扩散模型引导的真实伪装图像生成

已有 333 次阅读 2026-4-14 09:45 |个人分类:最新资讯|系统分类:博客资讯

新新标签.jpg

智能科学创新讲堂·AI新锐系列由国际人工智能期刊Machine Intelligence Research (MIR)主办,分若干专题,聚焦机器智能领域的最新进展与前沿探索,面向全球青年学者,定期邀请他们分享在人工智能顶级会议或权威期刊上发表的代表性成果。讲堂旨在搭建一个展示青年科研力量、促进跨机构与跨学科交流的平台,激发智能科学领域的创新思维与学术合作,推动青年人才成长与前沿研究传播。

智能科学创新讲堂·总第二十四讲

“隐性视觉感知”专题

智能科学创新讲堂本期聚焦"隐性视觉感知"专题。"隐性视觉感知"专题专注于伪装目标检测、透明物体分割、阴影检测等隐性视觉感知前沿研究,并积极探索其在医疗影像(如息肉检测)等领域的应用拓展。旨在让这个重要而富有挑战性的研究主题更加活跃,通过开放的学术交流不断迸发新的思想火花,推动学术社区繁荣和领域持续进步,促进计算机视觉与医疗影像等交叉领域的深入交流与合作,逐步打通不同应用场景的技术壁垒。

南京航空航天大学李文通副教授将开启本专题本年度第一场分享会,牛津大学田昕博士担纲主持2026年4月16日(周四) 15:00,四大平台同步直播,诚邀您预约收看!

往期分享回放:

https://space.bilibili.com/583634554/lists/697159?type=series

主持人.jpg

分享人.jpg

报告摘要

本报告分享一种名为CT-CIG 的文本引导可控扩散生成方法,来解决现有伪装图像生成方法中存在的忽视伪装物体与背景环境逻辑关系、导致生成结果缺乏自然真实感的问题。方法通过视觉语言模型构建高质量图文数据,设计“伪装揭示对话机制”生成文本提示,并结合二值掩码实现准确几何控制。同时引入频率交互细化模块增强纹理细节、减少伪影。实验在LAKE-RED 和 COD10K 上表明,该方法在 FID、KID 和 CLIP Score 等指标上优于多种先进方法。

观看渠道

直播通道①:

哔哩哔哩APP搜索"中国科学院自动化所”或扫描下方二维码,直播当天点击头像即可进入

b站.png

直播通道②:中国科学院自动化研究所 视频号

自动化所.png

直播通道③:机器智能研究MIR 视频号MIR.png

直播通道④:蔻享学术

点击下方链接进入"智能科学创新讲堂"主题页,直播当天选择相应直播即可观看

https://www.koushare.com/homepage/332528 

直播服务.jpg

640.jpg

纸刊免费寄送

Machine Intelligence Research

MIR为所有读者提供免费寄送纸刊服务,如您对本篇文章感兴趣,请点击下方链接填写收件地址,编辑部将尽快为您免费寄送纸版全文!

说明:如遇特殊原因无法寄达的,将推迟邮寄时间,咨询电话010-82544737

收件信息登记:

https://lcn76mgd97vz.feishu.cn/share/base/form/shrcnsQ6cmRjqoxPF5WDowSBFVr



https://blog.sciencenet.cn/blog-749317-1530294.html

上一篇:悉尼科技大学等团队 | 用于裂缝检测的高性能视觉特征提取自监督模型DinoV2
下一篇:对话优博·第3期 | 博士生如何做好系统性科研?
收藏 IP: 159.226.179.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-4-21 22:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部