||
采用深度残差学习的AprilTag手术器械定位与跟踪
钟吉浩1,廖胜辉2,姜闻博3,李建锋2,刘立宏4,奎晓燕3
(1. 中南大学 计算机学院,长沙 410017;2. 中南大学 湘雅二医院 康复医学科,长沙 410011;3. 上海交通大学医学院附属第九人民医院 3D打印技术临床转化研发中心,上海 200011;4. 吉首大学 计算机科学与工程学院,湖南吉首 416000)

摘要:手术导航技术通过实时追踪手术器械的空间位姿,为外科医生提供精确引导,是现代精准医疗的重要技术基础。作为一种视觉参考标记系统,AprilTag在手术器械定位中具有成本低、部署灵活等优势。然而,传统基于几何约束的位姿估计方法在复杂手术环境中面临检测误差累积、对环境干扰敏感等问题,难以满足高精度手术导航的要求。为此,本文提出一种融合几何方法与深度学习的AprilTag位置跟踪方法。该方法通过构建深度残差学习网络,学习图像特征对位姿误差的影响规律,从而实现对传统几何方法的智能修正。该方法采用ResNet18提取深层图像特征,对AprilTag位姿信息进行编码,并利用双分支融合网络学习几何预测结果与器械真实位置之间的残差。同时,设计加权损失函数以兼顾旋转误差与平移误差。在真实手术器械数据集上的实验结果表明,与传统几何方法相比,该方法的平均位置误差降低了48.44%,平均旋转误差降低了9.66%。此外,与其他视觉定位方法的对比实验进一步验证了该方法在复杂场景下具有更优的综合性能。
关键词:AprilTag,深度学习,位姿跟踪,残差学习,手术器械追踪
扫二维码浏览全文

Cite this article
Zhong, J., Liao, S., Jiang, W. et al. Deep Residual Learning-Based AprilTag Surgical Instrument Localization and Tracking. J. Shanghai Jiaotong Univ. (Sci.) (2026). https://doi.org/10.1007/s12204-026-2931-z
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-6-27 12:24
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社