|
巩依典1 ,诸云1*
(南京理工大学自动化学院,210094)
1* 诸云,南京理工大学副研究员,中国自动化学会“智向未来”自动化与人工智能百人科普团专家
摘 要:机器视觉作为人工智能科学的分支,以光学照明、成像系统和视觉信息处理为三大结构,旨在模仿人眼视觉功能,将经典领域内需以人眼处理的部分转向机器智能化处理方向,并逐步应用于各行各业。本文以机器视觉为基础,引申论述了其在国内外的发展状况、关键技术的突破研究以及最新的应用状况,并在文章结尾对其未来的发展进行了总结分析。
关键词:机器视觉,光学照明,智能化处理
A Review of the Current Situation and Development of Machine Vision Research
Gong Yidian 1, Zhuyun 1*
(School of Automation, Nanjing University of Science and Technology,210094)
Abstract: Machine vision is a branch of artificial intelligence science.it takes optical lighting, imaging systems and visual information processing as three major structures.it aims to imitate the visual function of the human eye, turn the part of the classical field that is processed by the human eye to the direction of machine intelligent processing, and gradually apply to industry, agriculture, transportation, medical and other fields. This paper summarizes the development status of machine vision technology in home and abroad, the research status of key technologies and the application fields of machine vision technology, and finally analyzes and summarizes its development direction.
Key words: Machine vision; Optical illumination; Intelligent processing
机器视觉指计算机模仿人的视觉功能,从观测物体中获取诸如色彩、大小等视觉信息,再进一步对信息进行数字化处理,最终用于检测、控制的一门学科,它涵盖图像处理、人工智能、模式识别等诸多学科[1]。随着我国制造业转型的不断深入以及人工智能技术的不断兴起,机器视觉技术也凭借其精度高、实时性强、自动化与智能化逐渐渗透于工业、农业、交通、医疗等诸多行业。
机器视觉系统的结构主要由光学照明、成像系统和视觉信息处理三部分构成。如图1.1所示,一个经典的机器视觉系统由光源、光学成像系统、图像捕捉系统、图像采集与数字化模块、智能图像处理与决策模块、控制执行模块构成。首先摄像及通过光学照明系统捕捉到被测目标的图像信息,通过图像采集与数字化模块将其变成用于智能图像处理的数字信息,再根据像图像的固有特点如亮度、色彩等信息,通过各种算法抽取被测目标的显著特征。最后,再根据预设准则判断输出结果,从而控制驱动执行模块进行反馈处理[2]。
图1.1 机器视觉系统结构图
本文将从机器视觉的国内外发展现状、关键技术、应用领域三个方面论述当前时代机器视觉的研究状况。
我国机器视觉的发展较为迟缓。20世纪80年代,对于机器视觉的研究水平仅仅是不停留在理论知识探讨和实验室的工作中,即便如此,对于机器视觉也有了较为明确的定义:机器视觉是通过特征提取、符号表示、语义解释三个主要步骤处理输入的二维图像,从而得到三维的景象描述的感知过程。同时对于机器视觉的发展也有了一定规划,使其在工业自动化、遥感、目标跟踪、导航等方面获得越来越多的应用。90年代初期少数视觉技术公司开始成立,但由于市场需求不大,且自身产出较为单一,机器视觉技术仍旧不算火热。直至1998年,大量外资企业在华建厂,机器视觉技术正式开始发展,并开始历经两个个发展阶段:初步应用阶段和高速发展阶段。
初步应用阶段:有了20世纪下半叶的理论积累和初步实践,加之市场急需以机器视觉代替传统人力进行检测和控制的普遍状况,机器视觉逐渐走入各个企业的研究领域。李庆中[3]团队应用机器视觉技术与机电一体化技术观测处理苹果的实时状态,实现图像信息处理并探索水果自动分级机械的产业化。应义斌[4]团队通过确定图像处理窗口、利用Sobel算子和Hilditch细化边缘,提出凭借红绿两种颜色在损坏边缘处的分量,实现检测黄花梨的外形尺寸与表现状态。因此,这一时期围绕着工业和农业的缺陷检测技术、农作物分级技术、定位与测量技术有了重大的突破,同时国内的图像研究、焊接领域也开始利用机器视觉技术处理难题,极大的提高了生产的质量与效率,极大程度减少了人工带来的失误。
高速发展阶段:2008年之后大量从事于相机、镜头、光源、图像处理软件的厂商加入市场,为机器视觉技术研究提供了硬件、软件两大平台,同时基于机器视觉技术而开发的产品与也在此浪潮中不断优化,关键技术也凭借这一浪潮逐渐突破,机器视觉技术来到了高速发展阶段。与此同时,工业、交通与医疗领域广泛受到关注,在这些领域中机器视觉的作用逐渐不可替代。近年来,国家为推动2025年在中国基本实现工业化,大力促进工业智能化,机器视觉技术已有了极大的进展,2014年翟敬梅团队[5]对视觉识别和检测系统进行模块化处理,通过建立抓取系统的参数化模型给出图像坐标到机器人坐标的转换算法, 利用NI Vision中提供的图像处理、模式匹配等方法,实现机器人对目标的成功抓取。2023年刘红[6]团队提出一种基于机器视觉的集成电路板焊点缺陷识别方法。获取集成电路板焊点图像,通过傅里叶变换转换集成电路板焊点图像缺陷数据,引用Rician噪声的期望值对其噪声偏差校正,通过高阶奇异值分解方法获取焊点图像块硬阈值;对焊点图像进行阈值分割,利用连通链码对二值图像展开边界跟踪,提取集成电路板焊点缺陷特征,通过将提取的特征输入Adaboost分类算法构建分类器中,最终准确识别全部焊接缺陷。综上,机器视觉技术在国内各个领域的比重逐渐加大,但与国外相比,国内仍有基础部件如图像传感器、镜头等依赖进口,且创新性不强。
国外机器视觉的发展较为成熟,搜索2013-2021年间国外机器视觉专利数量,出现136867个结果[7]。在2016-2019年间,开发数量出现了明显的停顿。而在2019-2021年疫情期间,卫生安全原则的突出使得开发医药技术的公司在开发数量上处于领先地位,大量的专利工作致力于机器人过程自动化(RPA)-手术导航系统中的计算机视觉领域,用于跟踪或引导手术器械的设备。在这136,867件专利中,英特尔公司占有95,545件专利,涵盖便携式虚拟现实、超分辨率可视化、手势识别系统和方法、图像流切换领域;微软共占有91,982件专利,涵盖软件范围包括用户界面、追踪视力的目标定位、稳定运动、增强现实中虚拟对象的捕捉、与图像投影的虚拟交互、从场景重构中学习图像处理任务。谷歌共占有45672件专利,领域主要为视觉搜索、获得触摸传感器和眼睛识别的输入控制的方法和系统,手势,动作,输入系统,用户界面等。同时由于人工智能技术和机器学习算法领域的研究成果不断增多,不仅给企业带来了额外的利润,还为医疗领域提供了强有力的支持。arXiv.org是最大的免费科学文章电子出版物档案馆之一,有8000多篇关于机器视觉的文章。它们的数量近年来显著增长——从每年几百只增加到2000只,而且还在继续增加。以上数据表明企业与相关部门对于机器视觉的研究兴趣极大,且研究方向更加深入与复杂。
除此之外,国外在计算机视觉领域的会议和竞赛的数量也有所增加。kaggle.com平台作为一个机器学习网站,自2010年以来一直举办分析和预测建模竞赛。2010至2018年,计算机视觉相关比赛仅举办了两场,但自2018年以来,比赛每年举行一次,一些活动已成为年度活动,如NYU Computer Vision - CSCI-GA,AU-ECE-CVML2021。
机器视觉从根本上讲,指对人眼视觉功能的模拟,因此在机器视觉系统中图像质量的好坏直接影响系统本身,而影响获取图像质量好坏的一个重要因素便是光源。由于普通照明环境下时间和空间的复杂度太高,所以一般使用人为控制的光学照明系统来进行照明操作。普遍来讲, 光照技术直接影响图像目标的亮度, 要使最终生成的目标图像持久且稳定,则必须使其整体暴露在摄像装置之下,并且降低环境中的干扰光强度,从而生成有利于研究的图像目标。
光源主要有以下类型:白炽灯泡、荧光灯管、氙灯、LED、X射线管[8]。表2.1列举出各类光源的性能特点。
表2.1 不同光源类型的特点
光源类型 | 优点 | 缺点 |
白炽灯 | 相对较亮,可在低压工作 | 发热严重、寿命短 |
荧光灯 | 闪烁频率可控,价格便宜,光照面积大 | 寿命短,光谱分布不均 |
氙灯 | 极亮的白光,有短弧灯(点亮时间1-2μs)、长弧灯、闪光灯(每秒200多次)可选 | 供电复杂、昂贵 |
LED | 可制作成红外、可见光、近紫外、白色LED,可制作闪光灯,亮度易控 | 性能和环境温度有关 |
X射线管 | 具有穿透作用,可探测物体内部 | 没有高对比度和噪声 |
要使最终获得的图像质量更优,除了选择应用在特定环境中的光源类型,还必须考虑以下因素:被测物体的物理特征、被测物体的运动状态、应用环境、光源与物体的距离。因此,在选择合适的光源类型后还必须选择合适的布局方式。
现阶段,基于光学照明斑马技术公司[9]发明了一种针对DPM标记的漫射和直接照明的机器视觉系统的光学布置,它的照明组件具有与电路板可操作地多个光源、与多个光源相邻定位的漫射器,漫射器被配置成用于生成漫射光图案,以及多个光源相邻定位的光管,用于生成直接照明图案和离轴照明图案。
成像系统是机器视觉技术中“视”的部分,包括镜头、工业相机、图像采集卡等相关设备[10]。
镜头按照焦距可分为广角镜头、中焦距镜头、长焦距镜头;按功能可分为变焦距镜头、定焦距镜头、定光圈镜头等。镜头的正确选择关系着成像质量、检测精度和后续相机工作距离。随着科学技术的不断增强,闽都创新实验室于2022年发明了一种高倍率长工作距同轴照明远心光学系统及镜头,极大程度解决了小F数下同时兼备高倍率及高成像质量的难题,该远心光学系统具有小F数、结构紧凑、高像质、低畸变和高分辨率的优点,且放大倍率为 10X,适合集成到机器视觉图像采集系统。
工业相机[11]是将光学模拟信号转换为数字信号的设备,传统工业相机图像传感器一般为电荷耦合元件(charge coupled device,CCD),随着CMOS传感器技术的发展,CCD在最大分辨率、功耗、采集速度及生产成本上都有了不同程度的改良。
图像采集卡为两类,模拟采集卡和数字采集卡。模拟采集卡用于将相机中的图像信息进行采样、量化,并转化为数字信息进行处理。而数字采集卡则将相机端的数字图像信号转化成PCIE格式,最终被主机解读、存储和处理。总之,图像采集卡的作用就是将图片转化为数字信号进行存储。
视觉信息处理作为机器视觉的关键,旨在对摄像装置获取的图像进行处理分析,实现对特定目标的分析检测,并做出对应的处理。视觉信息处理包括图像预处理、特征分析理解两个部分。
图像预处理旨在提高初始图像质量,为后续图像分析处理制造良好的条件,其中包括图像增强、去噪、配接等过程。而在成像阶段,由于各种干扰,初步获取的图像常常含有高斯、泊松等多种噪声,因此还需对图像进行去噪,一般的去噪方法有空间去噪法与变换域去噪法[12]。
特征分析理解通常分为图像分割、提取关键特征、实现目标分类与检测三个步骤。图像分割指根据目标的图像特征将其划分为多个具有不同特征的区域,从而使所以观测的目标更加清晰,常见的图像分割方法包括区域分割方法、基于边缘的分割方法、基于神经网络语义分割方法等。提取关键特征指根据分割后图像的形状、纹理、颜色等对其明显部分进行提取,以便下一步分类与检测。实现目标分类与检测指通过各种分类算法如模式匹配、深度学习、支持向量机分类算法对特征进行分类,从而完成图像的处理和识别。
工业领域,机器视觉在无人制造生产领域具有重要的作用。通过在现代工厂装配线上安装摄像机,实现通过器视觉质量控制和自动化的应用[13]。同时,机器视觉仍可被用来进行表面瑕疵检测、辅助智能装配与分拣、板件的尺寸测量。
表面瑕疵检测方面,如杨晨[14]团队为了满足企业在实际生产中焊后微通道换热器缺陷自动化检测需求,应用机器视觉技术,设计了一种换热器翅片虚焊和翅片损伤的缺陷检测方法使对换热器翅片缺陷检测识别率可达到97%。辅助智能装配与分拣方面,如王洋洋[15]团队针对使用传统离线或示教编程方式工业机器人无法开展复杂分拣环境作业任务的问题,以ABB 工业机器人、OMRON 机器视觉、西门子 S7-1200PLC 等为硬件基础,搭建了基于机器视觉的工业机器人分拣系统平台。板件的尺寸测量方面,如李小菁[16]团队针对大多数小型零件尺寸测量采用人工方式效率低、精度差的问题,设计了一套基于机器视觉的小型零件尺寸测量系统,实现了小型零件多个集合参数的一键测量。
农业领域,机器视觉技术主要应用于播种、施肥、喷洒农药、田间除草、嫁接秧苗、收割等农业机械或农业机器人[17],同时也可用于农作物病虫监视、农作物产品质量检测。
农业机器人方面,如孙丹[18]团队分析农业机器人自主作业的过程,设计了一款可以根据农作物的生长情况灵活进行浇水、施肥和除草等作业的农业机器人。农作物病虫害监视方面,如潘梅[19]团队采用机器视觉技术针对茶尺蠖精确植保,实现自动、精准施药。农作物产品质量检测方面,如吴伟锋[20]团队采用机器视觉技术提取不同活力水平紫苏种子的表型指标,结合单粒发芽情况及群体发芽试验,通过相关性分析,成功筛选出可替代的种子活力快检指标。
交通领域,计算机视觉(CV)在智能交通系统(ITS)中的应用越来越广泛,涵盖方面有自动驾驶、机器人定位、车辆检测、辅助驾驶、智能交通视频监控、行人检测以及人脸识别[21]。其中自动驾驶技术的发展,为解决交通监控、事件检测与管理、道路收费、路况监测等领域的问题[22]提供了更有效的方法。
在减少人流拥挤程度方面,Bhatt[23]团队研究了一种利用固定单摄像机进行人员检测计数系统,系统会统计公共汽车上的人数,并在下一站显示,以减少人群的密集程度,同时也可实时检测公交车上的可用座位。在智能交通视频监控方面,Dingjie Zhang[24]团队设计了一种智能交通管理系统,实现对各种交通路口的场景进行实时监控分析,准确识别检测违规车辆,实现多种交通场景应用。在行人检测方面,Sharma[25]团队研究了一种实时警报预警系统,以避免因坑洼和流浪动物的存在而发生事故。该研究通过在GPU环境下处理的YOLO v3计算机视觉算法,实现了对车辆、动物和行人等交通实体的实时检测。
医学领域,机器视觉技术被用来进行医学影像的分析、制作辅助类康复辅具、医疗药剂成分检测分析。
医学影像的分析方面,如陈佳[26]团队研究利用影响学机器视觉技术实现了对乳腺肿瘤病理图像识别方法的优化设计,成功使乳腺肿瘤病理图像识别优化方法相较于传统图像识别方法错误率降低2.6%。辅助类康复辅具方面,如智能轮椅车、辅助起立装置和机器臂,Hartman[27]团队研发了搭载摄像机、激光传感器、陀螺仪等的智能轮椅,结合机器视觉技术与自动驾驶技术,使轮椅车实现避障、路径规划、自动驾驶三大功能。医疗药剂成分检测分析方面,范影乐[28]团队设计了一种结合机器视觉和各领域成熟技术的自动检测系统,以实现符合行业标准的四环素族抗生素残留量检测。
随着科技的不断进步,机器视觉技术在工业、农业、交通、医疗等领域的应用越来越深入。机器视觉已经成为了这些领域中不可或缺的角色。它的加入使得人们的生产和生活水平趋向智能化,并且提高了生产效率和生活质量。
随着人工智能技术的爆发,机器视觉技术将在更多领域更快更高效地发展。光学照明、成像系统和视觉信息处理也将随着科技的不断提高而不断更新。对于企业和研究者来说,升级这三个结构是值得努力和关注的方向。通过不断提升光学照明技术,可以提高图像的清晰度和质量;改进成像系统可以提高机器视觉系统的感知和分析能力;而视觉信息处理的创新则可以实现更高级别的图像识别和模式识别。
总之,机器视觉技术在不断推动科技的进步,同时也为各个领域带来了巨大的变革和发展机遇。
参考文献
[1] 章炜. 机器视觉技术发展及其工业应用[J], 2006, (02): 11-17.
[2] 唐向阳,张勇,李江有,等. 机器视觉关键技术的现状及应用展望[J], 2004, (02): 36-39.
[3] 李庆中. 苹果自动分级中计算机视觉信息快速获取与处理技术的研究[D], 2000
[4] 应义斌,景寒松,马俊福,等. 机器视觉技术在黄花梨尺寸和果面缺陷检测中的应用[J], 1999, (01).
[5] 华南理工大学. 一种基于视觉引导的工业机器人工件定位抓取方法及系统:CN201410073766.2[P]. 2014-07-02.
[6] 刘红,杨奇,陈莉. 基于机器视觉的集成电路板焊点缺陷识别方法[J]. 焊接技术, 2023.
[7] VALKO N V, OSADCHYI V V. Review of state of computer vision technologies development in the world and Ukraine [J]. Journal of Physics: Conference Series, 2022, 2288(1): 012002 (9 pp.)- (9 pp.).
[8] 尚会超,杨锐,段梦珍,等. 机器视觉照明系统的关键技术分析[J]. 中原工学院学报, 2016.
[9] 斑马技术公司. 具有针对DPM标记的漫射和直接照明的机器视觉系统中的光学布置:CN202110212880.9[P]. 2021-08-27.
[10] 陈静,宫黎明. 机器视觉在军事领域的应用现状及发展趋势[J]. 遥测遥控, 2022.
[11] 张广宇,朱家昌. 智能制造装备视觉成像技术应用现状[J]. 现代计算机, 2021.
[12] RAJNI, ANUTAM. Image denoising techniques-An overview[J]. International Journal of Computer Applications, 2014,86(16): 13–17.
[13] Roy D , Meehan K .Computer Vision Application in Industrial Automation[J]. 2021.
[14] 杨晨,徐志鹏,曹松晓,等. 基于机器视觉的微通道换热器表面缺陷检测方法[J]. 仪表技术与传感器, 2022.
[15] 王洋洋,李国利,张曌. 基于机器视觉的工业机器人分拣系统设计[J]. 电子设计工程, 2023.
[16] 李小菁. 基于机器视觉的小型零件尺寸测量系统[J]. 自动化与信息工程, 2023.
[17] QIAN C. The Application of Computer Vision Technology in the Field of Industrial Automation [J]. 2021 International Conference on Applications and Techniques in Cyber Intelligence: Applications and Techniques in Cyber Intelligence (ATCI 2021) Lecture Notes on Data Engineering and Communications Technologies (81), 2021: 274-9.
[18] 孙丹. 基于机器视觉的农业机器人自主作业设计[J]. 南方农机, 2023.
[19] 潘梅,李光辉,周小波,等. 基于机器视觉的茶园害虫智能识别系统研究与实现[J]. 现代农业科技, 2019.
[20] 吴伟锋,侯浩楠,涂柯玲,等. 基于机器视觉技术的紫苏种子活力快检指标筛选研究[J]. 中国种业, 2022.
[21] 夏永泉,JO KANG-HYUN,甘勇,等. 计算机视觉在智能交通系统中的应用研究综述[J]. 郑州轻工业学院学报(自然科学版),2014(6):52-60.
[22] DILEK E, DENER M. Computer Vision Applications in Intelligent Transportation Systems: A Survey [J]. Sensors, 2023, 23(6).
[23] BHATT S, SHAH N, PATEL S. CV Based Person Detection System for Smart Transportation; proceedings of the 3rd International Conference on Computing Science, Communication and Security (COMS), Ganpat Univ, ELECTR NETWORK, F Feb 06-07, 2022 [C]. 2022.
[24] DINGJIE Z, XIAOCHUN L, ZHIYING L, et al. Application of Computer Vision in Intelligent Transportation Management System [J]. ICICSE 2021: 2021 10th International Conference on Internet Computing for Science and Engineering, 2021: 105-9.
[25] SHARMA N, GARG R D. Advanced Transportation Safety Using Real-Time GIS-Based Alarming System for Animal-Prone Zones and Pothole Areas [J]. Journal of Transportation Engineering Part a-Systems, 2023, 149(4).
[26] 陈佳,李高军. 基于影像学机器视觉的乳腺肿瘤病理图像识别[J]. 生物医学工程研究, 2020.
[27] HARTMAN A, NANDIKOLLA VK. Human-machine interface for a smart wheelchair[J]. Journal of Robotics,2019,2019:4837058
[28] 范影乐,黄河,李轶,等. 基于机器视觉的抗生素残留量检测系统研究和开发[J]. 仪器仪表学报, 2006.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-26 05:58
Powered by ScienceNet.cn
Copyright © 2007-2025 中国科学报社