|
引用本文
赵晓佳, 徐婷婷, 陈勇勇, 徐勇. 基于一步张量学习的多视图子空间聚类. 自动化学报, 2023, 49(1): 40−53 doi: 10.16383/j.aas.c220138
Zhao Xiao-Jia, Xu Ting-Ting, Chen Yong-Yong, Xu Yong. One-step tensor learning for multi-view subspace clustering. Acta Automatica Sinica, 2023, 49(1): 40−53 doi: 10.16383/j.aas.c220138
http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c220138
关键词
多视图子空间聚类,张量奇异值分解,一步化学习,图学习
摘要
现有多视图子空间聚类算法通常先进行张量表示学习, 进而将学习到的表示张量融合为统一的亲和度矩阵. 然而, 因其独立地学习表示张量和亲和度矩阵, 忽略了两者之间的高度相关性. 为了解决此问题, 提出一种基于一步张量学习的多视图子空间聚类方法, 联合学习表示张量和亲和度矩阵. 具体地, 该方法对表示张量施加低秩张量约束, 以挖掘视图的高阶相关性. 利用自适应最近邻法对亲和度矩阵进行灵活重建. 使用交替方向乘子法对模型进行优化求解, 通过对真实多视图数据的实验表明, 较于最新的多视图聚类方法, 提出的算法具有更好的聚类准确性.
文章导读
人类借助于日渐先进的数据收集和信息技术, 在不同领域中获取到不同类型的多数图数据, 更加全面地挖掘出隐藏在数据中特征和结构信息[1-2]. 如图1(a) 视频监控通过采集不同时态下的图像, 更加有助于理解行人的姿态、面部表情等行为动作; 图1(b) 采集不同视角下的汽车图片, 有助于更加清晰地刻画车辆的全貌; 图1(c) 表示的是一张人脸图像在Local Binary Pattern[3]、Gabor[4]、Histogram of Oriented Gradients[5]等描述下的特征表示. 多视图数据可以反映出更加全面的信息, 结合不同的应用场景, 衍生出多种多视图学习应用, 如多视图聚类[2, 6-9], 多视图半监督分类[10], 多视图分类[11], 多视图检索[12]等等. 由于现实生活中的数据大多没有样本标签并且标签信息的获取十分复杂, 在进行基于标签的分类操作时会耗费很大的人力、物力. 另一方面, 随着聚类算法的成熟, 一些聚类算法[13-14]的性能逐渐逼近分类算法, 多视图聚类引起了广泛关注.
图 1 多视图数据示例
现有的单视图聚类和多视图聚类算法的性能高度依赖于亲和度矩阵的质量, 其核心是构造一个具有判别性的亲和度矩阵. 对亲和度矩阵求解的方法大致划分为三大类, 分别是基于图[15-16]、基于核[17-18]和基于子空间[7, 19-23]的方法. 例如, Liang等[15]提出了同时对视图间的一致性和差异性进行建模的图聚类方法; Wang等[16]提出了同时学习数据相似度矩阵和聚类结构的聚类方法. 然而基于图的聚类方法是根据原始数据的特征直接进行图的构建, 容易受到噪声和异常值影响. 为了处理非线性复杂数据的聚类问题, 文献[17]通过使用核技巧将稀疏子空间聚类扩展到非线性流形; Yin等[18]将对称正定矩阵嵌入到再生核希尔伯特空间中, 有效地揭示了潜在的子空间结构. 但是基于核的聚类方法的性能在很大程度上依赖于核函数的选择, 而在实践中如何选择核函数仍是一个待探索的问题. 为了提升鲁棒性, 子空间聚类方法利用独立的两步骤去学习亲和度矩阵, 即1) 根据原始数据的特征矩阵对其进行自表示, 利用特定正则项求得自表示矩阵; 2) 通过自表示矩阵固定得到亲和度矩阵, 来描述未标记数据点之间的成对关系. 例如, 稀疏子空间聚类 (Sparse subspace clustering, SSC)[22]和低秩表示(Low-rank representation, LRR)[21]是两种最具代表性的子空间聚类算法. 他们分别利用l1l1范数和核范数得到了稀疏和低秩的自表示矩阵. Gao等[24]采用谱聚类的方式整合不同视图的子空间聚类结果以获得一致性的指示矩阵.
为了挖掘多视图特征的高阶相关性, Zhang等[6]和Xie等[7]相继提出将所有视图的自表示矩阵拼接成一个三阶张量, 即包含了二维点对点的维度, 同时囊括了一个新的视图维度. Chen等[25], Zhang等[26]和Wu等[27]均采用张量这一数据结构来处理多视图聚类的问题, 并利用联合学习和张量低秩优化的思想以学习一个更具辨别性的亲和度矩阵. 此类方法的核心是低秩张量分解技术. 现有常见的张量分解技术为CANDECOMP/PARAFAC分解[28]、Tucker分解[29]、张量奇异值分解(Tensor singular value decomposition, t-SVD)[30]. 其中基于t-SVD的张量核范数是张量多秩l1l1范数的最紧凸松弛, 在低秩近似理论与应用中取得了优异性能. 文献[2]采用基于t-SVD的张量多秩最小化方法, 隐式地过滤掉高维噪声. 文献[31]采用了自适应近邻的方法, 为每个数据点分配最佳近邻来学习相似性矩阵, 以捕获数据的局部特征. 但这些方法都基于根据某种运算, 如指数法[32]、绝对对称化[6]、平方运算[33]等, 利用自表示矩阵固定求解亲和度矩阵, 即两者的求解过程独立进行, 无法有效地挖掘两者间的高度相关性, 不能获取更优的亲和度矩阵.
为了解决上述问题, 本文提出了一种新颖的基于一步张量学习的多视图子空间聚类算法, 它可以有效地降低噪声和异常值的影响并探究亲和度矩阵和表示张量之间的高度相关性, 以获得更优的亲和度矩阵, 进而得到更优的多视图聚类性能. 本文的贡献总结如下: 1) 针对多视图聚类问题, 提出了一种基于一步张量学习的多视图子空间聚类算法, 该算法通过学习一个鲁棒的低秩张量表示进行聚类, 充分挖掘了数据的多模态信息, 具有较高的鲁棒性与准确率. 2) 与现有多视图聚类算法相比, 该算法在一个统一框架下对表示张量与亲和度矩阵进行联合学习, 相互促进. 利用t-SVD对表示张量进行高阶约束, 减少噪声和异常值的影响. 并采用自适应近邻法重建亲和度矩阵, 以获得更加灵活的图用于多视图聚类. 3) 该算法采用交替方向乘子法进行有效优化. 在多个数据集上验证了所提出方法在解决多视图聚类问题上的优越性.
图 2 张量奇异值分解示例
图 3 基于一步张量学习的多视图子空间聚类结构图
针对多视图聚类两步化求解亲和度矩阵、如何探索多视图之间的高阶相关性的问题, 本文提出了一种基于一步张量学习的多视图子空间聚类方法. 本方法借助图学习的思想, 利用张量三维数据结构的属性来充分挖掘多视图数据的底层低维结构. 具体地, 本算法将特定于视图的表示矩阵拼接为三维张量以探索数据间高阶相关性, 并采用t-SVD(如式(4)所示)低秩约束以寻求一个‘干净’的表示张量. 通过引入‘一步化’联合学习框架, 有效地实现表示张量和亲和度矩阵的共同优化, 克服了对亲和度矩阵固定求解的问题. 此外, 还采用自适应最近邻方案, 共同学习一个鲁棒的低秩张量图. 由于该算法涉及多个优化变量, 故采取交替方向乘子法进行交替优化. 在六个多视图数据集上的实验表明本方法的有效性和鲁棒性. 在后续工作中, 考虑将‘一步化’联合求解的方法拓展到深度学习中, 借助卷积神经网络来学习更具判别性的亲和度矩阵.
作者简介
赵晓佳
哈尔滨工业大学(深圳)计算机科学与技术学院硕士研究生. 主要研究方向为多视图聚类. E-mail: 21S151152@stu.hit.edu.cn
徐婷婷
哈尔滨工业大学(深圳)计算机科学与技术学院硕士研究生. 主要研究方向为低秩张量近似. E-mail: 21S151168@stu.hit.edu.cn
陈勇勇
哈尔滨工业大学(深圳)计算机科学与技术学院助理教授. 主要研究方向为机器学习和模式识别. 本文通信作者. E-mail: YongyongChen.cn@gmail.com
徐勇
哈尔滨工业大学(深圳)计算机科学与技术学院教授. 主要研究方向为机器学习, 模式学习, 生物信息学和视频分析. E-mail: yongxu@ymail.com
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 15:48
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社