|||
我今年九月份即将开始的博士生涯研究的核心问题是:“该不该注意这一块?”在人眼预注意视觉基础上,有两个因素导致人去注意或是试图看得更清楚,一是外界的刺激超过了某个阀值,二是与以往的知识经验产生“共鸣”。我的核心任务,就是建立一种机制,能去衡量外界刺激和经验“共鸣”的强度——或称之为结构显著性和经验显著性。需要一个显著性函数统一这两种不同权重的显著性,从而为回答“该不该注意这一块?”提供定量依据。
另一个需要解决的关键问题是:“如何扫描搜索?”,人眼看世界,可分为“宏镜头”和“精视野”两部分,精视野分辨率最高,但范围有限;宏镜头视野宽广,但分辨率随与精视野区距离的增大而下降。精视野和宏镜头随者人的控制动态变化转换改变聚焦点,这种聚焦点转换的诱因正是在上面提到的外界刺激和对经验的“共鸣”。对于计算机视觉而言,分辨率的变化可以用Gabor Function来描述,但聚焦的自动切换机理必须能用显著性函数来表征。难就难在自动二字,因为现在是运动的机器拿着相机,而不是人拿着相机。
有了处理结构显著性和经验显著性不同权重的显著性函数,就可以对待固定的典型的识别目标进行穷尽性的参考特征优化与选择,进而进行组织与描述。这样做是为了构建目标分层次模块化结构的特征模型,从而能够进行基于特征分量分组的分级序贯处理。通俗的讲,就是“重要的客人优先招呼,次要的客人不能放过,一般的客人有条件再说”。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 01:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社