|||
【CAA期刊】《模式识别与人工智能》第37卷 第1期
基于三路径网络的医学图像分割方法
蒋清婷1, 叶海良1, 曹飞龙1
1.中国计量大学 理学院 应用数学系 杭州 310018
摘要: 卷积神经网络由于强大的特征提取能力在医学图像分割任务上取得一定进展,但仍需提升边缘分割的准确性.为此,文中提出基于边缘选择图推理的三路径网络,包括目标定位路径、边缘选择路径和细化路径.在目标定位路径中,设计多尺度特征融合模块,聚合高级特征,实现病变区域的定位.在边缘选择路径中,构造边缘选择图推理模块,用于低级特征的边缘筛选,并进行图推理,保证病变区域的边缘形状.在细化路径中,建立渐进式组级细化模块,逐步细化不同尺度特征的结构信息与细节信息.此外,引入融合加权Focal Tversky 损失和加权交并比损失的复合损失,减轻类不平衡的影响.在公开数据集上的实验表明,文中方法性能较优.
关键词: 图神经网络, 医学图像分割, 深度学习, 边缘学习
引用本文:
蒋清婷, 叶海良, 曹飞龙. 基于三路径网络的医学图像分割方法[J]. 模式识别与人工智能, 2024, 37(1): 1-12.
JIANG Qingting, YE Hailiang, CAO Feilong. Medical Image Segmentation Method with Triplet-Path Network. Pattern Recognition and Artificial Intelligence, 2024, 37(1): 1-12.
面向序列诊断的强化计算机自适应测验方法
刘子瑞1, 吴金泽2, 姚方舟1, 刘淇1, 陈恩红1, 沙晶2, 王士进2, 苏喻3
1.中国科学技术大学 计算机科学与技术学院 合肥 230027;2.科大讯飞股份有限公司 合肥 230088;3.合肥师范学院 计算机与人工智能学院 合肥 230061
摘要: 计算机自适应测验旨在根据学生历史表现为学生选择合适的题目,快速有效地测量学生的真实能力.然而在智能教育场景下,现有自适应测验策略仍存在目标复杂和知识稀疏等问题.为此,文中构建用于智能场景的可精准测评学生知识能力的面向序列诊断的强化计算机自适应测验方法,包括基于序列诊断的学生模拟器和学生画像模型,并针对真实场景中自适应测验的目标复杂性,设计薄弱点准确率、预测表现耦合、自适应测验时长、测验异常率和测验的难度结构这5个评价指标.进一步地,提出基于强化学习的计算机自适应测验选题策略,利用双通道自注意力学习及矛盾学习模块缓解知识稀疏的问题.真实数据上的实验表明,文中选题策略不仅可高效测量学生真实能力,还可优化学生的作答体验,同时选择的题目也具有一定的可解释性,从而为智能教育场景下的计算机自适应测验提供一个可行方案.
关键词:智能教育, 个性化教育, 计算机自适应测验, 强化学习, Q学习
引用本文:
刘子瑞, 吴金泽, 姚方舟, 刘淇, 陈恩红, 沙晶, 王士进, 苏喻. 面向序列诊断的强化计算机自适应测验方法[J]. 模式识别与人工智能, 2024, 37(1): 13-26.
LIU Zirui, WU Jinze, YAO Fangzhou, LIU Qi, CHEN Enhong, SHA Jing, WANG Shijin, SU Yu. Computerized Adaptive Testing Method Based on Reinforcement Learning for Series Diagnosis. Pattern Recognition and Artificial Intelligence, 2024, 37(1): 13-26.
支持亿级数据的高效密文范围查询完整性验证
王肇康1, 潘佳辉1, 周璐1
1.南京航空航天大学 计算机科学与技术学院 南京 211106
摘要: 密文查询的完整性验证机制能在保护人工智能应用数据隐私的同时,为查询结果的可靠性提供保证.然而,现有针对密文范围查询的完整性验证方法存在验证数据结构构建开销较高、数据可扩展性较差的缺陷.为此,文中分析ServeDB(Secure Verifiable and Efficient Framework)计算性能瓶颈产生的原因,并基于分析结论提出基于立方格索引的密文范围查询完整性验证方法(Cube-Cell-Based Authentication Tree, CubeTree).CubeTree采用基于分位数归一化的数据重分布优化方法,平衡数据记录在值域空间中的分布,降低数据记录的编码开销.进一步提出基于平衡K叉树的扁平化结构以及基于立方格索引的验证数据结构,合并具有相同编码的数据记录,采用立方格作为基本验证单元,大幅降低验证数据结构的冗余性,减少构造过程的计算与存储开销.在真实数据集与合成数据集上的实验表明,CubeTree能显著降低验证数据结构的构建开销以及查询完整性证明的生成与校验开销,并可高效处理亿级规模的大型数据集.
关键词:应用安全, 密文范围查询, 查询完整性验证, 验证数据结构, 立方格索引
引用本文:
王肇康, 潘佳辉, 周璐. 支持亿级数据的高效密文范围查询完整性验证[J]. 模式识别与人工智能, 2024, 37(1): 27-46.
WANG Zhaokang, PAN Jiahui, ZHOU Lu. Efficient Encrypted Range Query Integrity Authentication for Hundreds of Millions of Records. Pattern Recognition and Artificial Intelligence, 2024, 37(1): 27-46.
基于“人-机-环”信息流的机器人手术系统研究与展望
崔皓鑫1,2, 王嵘3, 郑楠2, 章颂2, 任瞳3, 梁渝靖3
1.中国科学院大学 人工智能学院 北京 100049;2.中国科学院自动化研究所 多模态人工智能系统全国重点实验室 北京 100190;3.中国人民解放军总医院 第六医学中心 心血管病医学部 成人心脏外科 北京100853
摘要: 机器人手术系统凭借微创、精细、灵活、无震颤等优势,在多个外科领域不断得到普及应用.然而,现有的机器人手术系统尚未充分发挥人和机器各自的优势,在智能化交互方面的表现有待提高.因此,文中首先从系统科学的角度分析机器人手术系统中交互关系的发展,并从多方面提出当前人机交互的不足.然后,构建面向机器人手术系统的“人-机-环”信息流框架,以机器人辅助乳内动脉获取手术场景为例,梳理“人-机-环”各部分之间的复杂交互.最后,基于“人-机结合”理论,结合构建的“人-机-环”信息流框架,提出以“人机融合智能共进”为目标的新一代机器人手术系统的设计思路,为实现更安全高效的机器人微创外科手术目标提供借鉴.
关键词:综合集成, 人机系统, 信息流, 机器人手术系统
引用本文:
崔皓鑫, 王嵘, 郑楠, 章颂, 任瞳, 梁渝靖. 基于“人-机-环”信息流的机器人手术系统研究与展望[J]. 模式识别与人工智能, 2024, 37(1): 47-57.
CUI Haoxin, WANG Rong, ZHENG Nan, ZHANG Song, REN Tong, LIANG Yujing. Research and Prospect of Robotic Surgical System Based on Human-Machine-Environment Information Flow. Pattern Recognition and Artificial Intelligence, 2024, 37(1): 47-57.
基于融合Lasso的非参数加性分位数回归模型
付漫侠1, 周水生1
1.西安电子科技大学 数学与统计学院 西安 710126
摘要: 加性分位数回归为非线性关系的建模提供一种灵活、鲁棒的方法.拟合加性分位数模型的方法通常使用样条函数逼近分量,但需要先验的选择节点,计算速度较慢,并不适合大规模数据问题.因此文中提出基于融合Lasso的非参数加性分位数回归模型(Nonparametric Additive Quantile Regression Model Based on Fused Lasso, AQFL),是在融合Lasso罚和l2罚之间折衷的可对加性分位数回归模型进行估计和变量选择的模型.融合Lasso罚使模型能快速计算,并在局部进行自适应,从而实现对所需分位数甚至极端分位数的预测.同时结合l2罚,在高维数据中将对响应影响较小的协变量函数值压缩为零,实现变量的选择.此外,文中给出保证收敛到全局最优的块坐标ADMM算法(Block Coordinate Alternating Direction Method of Multipliers, BC-ADMM),证明AQFL的预测一致性.在合成数据和碎猪肉数据上的实验表明AQFL在预测准确性和鲁棒性等方面较优.
关键词:分位数回归, 加性模型, 融合Lasso罚, l2罚
引用本文:
付漫侠, 周水生. 基于融合Lasso的非参数加性分位数回归模型[J]. 模式识别与人工智能, 2024, 37(1): 58-72.
FU Manxia, ZHOU Shuisheng. Nonparametric Additive Quantile Regression Model Based on Fused Lasso. Pattern Recognition and Artificial Intelligence, 2024, 37(1): 58-72.
基于多重视觉注意力的唇语识别
谢胤岑1, 薛峰2, 曹明伟3
1.合肥工业大学 计算机与信息学院 合肥 230601;2.合肥工业大学 软件学院 合肥 230601;3.安徽大学 计算机科学与技术学院 合肥 230601
摘要: 唇语识别是将单个说话人嘴唇运动的无声视频翻译成文字的一种技术.由于嘴唇运动幅度较小,现有唇语识别方法的特征区分能力和泛化能力都较差.针对该问题,文中分别从时间、空间和通道三个维度研究唇语视觉特征的提纯问题,提出基于多重视觉注意力的唇语识别方法(Lipreading Based on Multiple Visual Attention Network, LipMVA).首先利用通道注意力自适应校准通道级别的特征,减轻无意义通道的干扰.然后使用两种粒度不同的时空注意力,抑制不重要的像素或帧的影响.CMLR、GRID数据集上的实验表明LipMVA可降低识别错误率,由此验证方法的有效性.
关键词:唇语识别, 视觉语音识别, 注意力机制, 深度神经网络, 特征提取
引用本文:
谢胤岑, 薛峰, 曹明伟. 基于多重视觉注意力的唇语识别[J]. 模式识别与人工智能, 2024, 37(1): 73-84.
XIE Yincen, XUE Feng, CAO Mingwei. Lipreading Based on Multiple Visual Attention. Pattern Recognition and Artificial Intelligence, 2024, 37(1): 73-84.
基于对比优化的多输入融合拼写纠错模型
伍瑶瑶1,2,3, 黄瑞章1,2,3, 白瑞娜1,2,3, 曹军航1,2,3, 赵建辉1,2,3
1.贵州大学 文本计算与认知智能教育部工程研究中心贵阳 550025;2.贵州大学 公共大数据国家重点实验室 贵阳 550025;3.贵州大学 计算机科学与技术学院 贵阳 550025
摘要: 文本编辑工作中,中文拼写纠错必不可少.现有中文拼写纠错模型大多为单输入模型,语义信息和纠错结果存在局限性.因此,文中提出基于对比优化的多输入融合拼写纠错模型,包含多输入语义学习阶段和对比学习驱动的语义融合纠错阶段.第一阶段集成多个单模型的初步纠错结果,为语义融合提供充分的互补语义信息.第二阶段基于对比学习方法优化多个互补的句子语义,避免模型过度纠正句子,同时融合多个互补语义对错误句子进行再纠错,改善模型纠错结果的局限性.在SIGHAN13、SIGHAN14、SIGHAN15数据集上的实验表明文中方法可有效提升纠错性能.
关键词:中文拼写纠错, 多输入语义学习, 互补语义融合, 对比学习优化
引用本文:
伍瑶瑶, 黄瑞章, 白瑞娜, 曹军航, 赵建辉. 基于对比优化的多输入融合拼写纠错模型[J]. 模式识别与人工智能, 2024, 37(1): 85-94.
WU Yaoyao, HUANG Ruizhang, BAI Ruina, CAO Junhang, ZHAO Jianuhi. Multi-input Fusion Spelling Error Correction Model Based on Contrast Optimization. Pattern Recognition and Artificial Intelligence, 2024, 37(1): 85-94.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 04:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社