AI哲学_吴怀宇(中国科学院)分享 http://blog.sciencenet.cn/u/wuhuaiyu 博士教授。中科院博士、北京大学博士后、中国3D科技创新产业联盟副理事长、三体科技研究院院长,受聘多家机构的高端领军人才/导师//教授/研究员

博文

5.13 【3D智能十八篇之二】3D智能数字化与3D打印:用“虚拟”再造“现实”

已有 170 次阅读 2026-7-1 23:32 |系统分类:观点评述

opendai_logo.gif

「AI哲学」让人类“为自身立命”与“为AI立心”。

《道德真经集解》(宋代·董思靖)有云:“虚乃实之根”,实从虚生;实乃虚之体,虚以实成型。这一句话对虚与实的辩证哲学关系做了精彩的论述。一千年后的今天,3D智能数字化与3D打印实现了从真实物体到虚拟三维,然后又从虚拟三维再造实体的轮回转换。正可谓:虚即是实,实即是虚!3D智能数字化与3D打印的完美结合,实现了用“虚拟”再造“现实”的崭新境界。

目前,全球正在兴起新一轮数字化、智能化制造浪潮。欧美等发达国家面对近年来制造业竞争力的下降,大力倡导“再工业化、再制造化”战略。以智能数字化为核心的“第四次工业革命”引发的前提和基础是模式识别、视觉计算、自动化控制、机器学习、深度神经网络、大模型、大规模数据挖掘等学科的成熟以及大批量低成本传感设备的普及。这种深层次的产业革命,不仅将席卷人类的体力劳动岗位,也将毫不留情地占据人类之前引以为豪的脑力劳动岗位。任何能够提取出统计规律、特征描述或编码索引的日常工作都将被自动化。可以确信的是,将来一个人薪酬的高低,将取决于他掌握智能数字化的专业程度。

5.1.1  3D智能数字化设计技术的发展现状

为了让计算机知道如何更好地设计形状,目前有两大类方法可以进行3D数字化。本节介绍第一大类方法,即使用智能数字化设计软件,由设计师从无到有地设计3D数字化产品。另一大类的3D数字化就是3D扫描(俗称3D照相),对现实存在的3D物体进行扫描采集,将在下节进行介绍。

3D智能数字化设计与传统的CAD技术关系密切,是其不断发展所抵达的最新阶段。所谓CADComputer Aided Design,计算机辅助设计),是指利用计算机软件制作并模拟实物设计,展现新开发产品的外形、结构、色彩、质感等特色的过程。

提示:除了CAD,还有CAMComputer Aided Manufacturing,计算机辅助制造,利用数控机床控制刀具运动,完成零件制造)、CAEComputer Aided Engineering,计算机辅助工程分析,利用有限元计算方法分析产品的结构强度、热传导等性能)、CAPPComputer Aided Process Planning,计算机辅助工艺过程设计,利用计算机技术设计产品的加工工艺和步骤)、CAIComputer Aided Instruction,计算机辅助教学)等。CADCAECAMCAPPCAI等统称为CAX

随着社会对数字化生存的依赖日益加强,仅靠CAD技术已难以应付各行各业的需求,因此3D计算机图形学、计算机视觉、模式识别与智能系统、机器学习、AI大模型等其他交叉学科已开始融入进来,且越来越有融为一体的趋势。在本书中,我们将这种新的数字化技术统称为3D智能数字化技术。

3D设计分为两大类:实体建模和曲面建模。实体建模Solid Modeling主要面向工业设计和制造领域,如将一个圆柱体零件和一个正方体零件合并在一起,或在一个球体零件上钻一个方孔。而曲面建模(Surface Modeling,正如字面意思所揭示的,只考虑形状的表面(内部可认为是个空壳),主要面向影视动漫、游戏娱乐领域(这些领域只要求形状的外表看着逼真就行,内部是空的也没有关系)。

实体建模一般用来设计规则的几何形状,对于不规则的几何形状则有些力不从心。而3D打印的特色就在于制造那些独特的不规则形状物体。另一方面,曲面建模可以胜任复杂、精细的不规则形状(这从好莱坞大片中细节越来越逼真的怪兽、变形金刚就可窥豹一斑),然而它的缺点是形状内部是空的,无法描述形状内部的“满园春光”或“内藏乾坤”,比如复杂精巧的内嵌结构。

目前大多数3D设计软件都既可以做实体建模,也可以做曲面建模。因此,最简单的建模方法就是手工使用这些3D设计工具,如SolidWorksAutoCAD3DS MaxMayaRhino3DZBrush等常见3D商业设计软件,以及BlenderSketchUp3D免费设计软件,像在沙滩上玩沙雕一样堆积、组合、掏空实体,或像裁缝一样将一块曲面反复裁剪、拉伸、变形成最终的形状。

提示:曲面有很多种表示方法,常见的有3种:NURBS曲面、多边形曲面和细分曲面。

NURBS是非均匀有理B样条曲线(Non-Uniform Rational B-Splines)的缩写(这里的“非均匀”Non-Uniform指的是可以调节控制点的权重以创建不规则曲面,“有理”Rational指的是可以用有理多项式形式来定义),它的优点是只需操纵少数的样条控制点就可以拟合各种光滑的形状(但NURBS生成一条有棱角的边却是很困难的),如下图所示。一个复杂的三维模型可以由几个NURBS曲面构成,这些曲面在相交处的几何连续性(Geometry Continuity可分为:位置点连续G0Positional Continuity,这种连续仅仅保证曲面间没有缝隙而是完全接触,但相连处的角度可能改变很大)、切线连续G1Tangential Continuity,我们通常的倒圆角就是这种情况,在一般的产品设计中G1连续就能满足大部分产品开发需要)、曲率连续G2Curvature Continuity,其实曲面做到这一点难度已经很大,汽车流线外形中的A级曲面就需满足G2连续)、曲率变化率连续G3、曲率变化率的变化率连续G4,等等。除了几何连续性度量Gn,曲线曲面的光顺度量还可采用代数上严格定义的函数可微性,即n阶连续可微,称之为Cnn参数连续性(Parametric Continuity,如C0C1C2等等。

图片

图5-1  NURBS曲面拟合零件形状 (图片来源:Rhino

多边形Polygon曲面一般为三角形网格(Triangle Mesh,使形状由许多个三角形面片来表示,可表现复杂形状的精细细节。如下图所示是NURBS曲面转换成多边形曲面的例子。此外在工业界,人们更偏向于使用四边形网格(Quad Mesh,而不是三角网格,这是因为四边形网格的边更能反应物体表面的流线方向(Edge Flow),从而便于建模工具进行细节的生成和编辑。

图片

图5-2  NURBS曲面(左)转换成多边形曲面(右) (图片来源:Autodesk

细分Subdivision曲面,又被称为子分曲面。你只需制作一个粗糙的控制网格,然后指定一个细分规则(如Catmull-Clark规则、Loop规则),就可以自动将粗糙网格不断细化成任意光滑的曲面。好莱坞的皮克斯工作室(Pixar,现属于迪士尼)的创始人之一Edwin Catmull就是细分曲面的主要发明者,因此不难理解Pixar3D动画片大量采用了细分曲面来表现圆润平滑的形状边缘,如下图所示。

图片图片

图5-3  细分曲面可表现圆润平滑的细节 (图片来源:Pixar

手工建模是一件比较烦琐、费时的工作。比如设计一把椅子,设计完成后,如果发现中间的某个地方尺寸短了,那我们不光要修改这个地方,还要修改与之相连的两端,否则这把椅子就合拢不上了。参数化建模解决了这个问题。所谓参数化建模Parametric Modeling,也被称为基于特征的建模),就是将原有设计中的某些尺寸特征,如形状、定位或装配尺寸,设置为参数变量(所谓变量,也即不是定死的,而是可灵活调整的)。如果修改这些变量的值,计算机就会自动变动其他相关的尺寸,由此得到不同大小和形状的零件模型。参数化设计的本质是在可变参数的作用下,系统能够自动维护所有的不变参数(如椅子腿长必须为0.5m,椅子后背的长宽比必须为2:1等),以保持形状的固有特征。有了参数化设计,我们只需简单指定长、宽、高这3个参数,就能快速获得一大堆定制的茶杯形状模型,而无须费时费力地对每个茶杯的几何细节(壁厚、手柄、底座等)尺寸逐一做手工更改。

参数化设计固然灵活,但需要手工设置特征变量(包括形状特征、材料特征、精度特征、装配特征)和约束关系,所以也不是一件特别轻松愉快的活儿。于是,新一代的直接建模Direct Modeling,奉天承运、应运而生了。所谓直接建模,就是不管原有模型是有特征还是无特征的(比如从其他CAD系统读入的非参数化模型),都可以直接进行后续模型的创建,而无须关注模型的建立过程,也无须维护模型树和历史树(以创建的时间顺序列出零件的参数特征和约束关系)。这样就使得我们可以在一个自由的3D设计环境下工作,以直观的方式对模型直接进行编辑。直接建模使我们可以自然流畅地直接在模型上动态操作、实时预览,所有交互都直接对模型本身进行,修改模型也变得非常简单,如下图所示。

图片

图片

图5-4  直接建模(动态尺寸编辑与特征位置编辑)(图片来源:PTC

人类追求机器智能化的努力是无止境的(当然,原始的初衷大部分是为了让自己得以偷闲)。于是,更加智能化一点的编程式设计出现了。计算机把形状的设计过程描述成一系列有特定顺序的操作步骤,这有点像按照食谱而不是最终的外观来制作蛋糕。编程式智能设计可以轻易地在这个蛋糕上绘制几百万个规则的精美图案,而这对于手工设计来说犹如噩梦(设计师可能会被活活累瘫)。

为了生成更加丰富多变的个性图案,还可采用复杂的生长式智能系统。按照一套既定的生长规则加上随机扰动,随着时间的推移发展,将一颗种子形状不断迭代分裂,不断长出新的枝叶,最终生长成独一无二的特定形状。这种方式的建模方法,专业术语叫作过程建模Procedural Modeling,也就是说形状的建立有一个生长的过程,代表性的方法有用于植物建模的L系统(L-Systems,如下图所示)以及大名鼎鼎的分形(Fractal,参见章节4.13.2分形、混沌、难以预测的蝴蝶效应”)等。

图片

图5-5  基于L系统(L-Systems)的3D植物生长建模(图片来源:同济大学)

智能化达到一定层次后,更可让设计的形状根据未知环境实时调整,以适应各种物理或美学约束条件。因为,设计师是不可能提前知道最终的设计是什么样子的。例如,在崎岖不平的月球表面让3D打印机自动设计并制造房子,就需要根据所处的物理环境进行自适应性调整,以此来动态获得一个最优的设计形状,以保证在当前环境下建筑结构的稳定性。

采用人工智能进行设计的另一个途径是增强人和计算机之间的交互性,用户根本不需要了解计算机内部的运行原理,甚至不需要了解3D设计方法,只需从计算机推荐的参考形状中不断地做出挑选和评价(“满意”或“不满意”),然后计算机根据用户的反馈来分析用户的设计偏好,以此对参考形状进行优化调整,再重新推荐一个新的参考形状。如此反复,直到人和计算机共同合作完成一个满意的设计。在这个过程中,对人的设计水平要求大大降低,因为依托于计算机强大的分析能力和所存储的海量模型数据库(含有上百万个3D模型),用户的设计方式简单到只需告诉计算机某个设计细节“满意”还是“不满意”即可,剩下的一切都交给智能的计算机算法了。

虽然3D数字化设计技术越来越先进,但目前唯一不变的还是大家手里握着的鼠标。鼠标是2D屏幕上的人机交互工具,面对3D空间的应用越来越力不从心。这里给大家介绍一款名叫“鸟标”的交互工具。这款名叫Leonar3Do VR suite的虚拟现实(Virtual Reality,简称VR)系统,可以让用户能够在逼真的3D环境中设计形状。该技术的核心在于一款颠覆传统模式的3D鼠标:鸟标,其具有6个自由度(包括三维平移加三维转动),用于在3D空间中随心所欲地拖曳和移动3D模型,选取工具、颜色和纹理,挖除或雕刻塑像,添加或删除材料等,如下图所示。

为了达到精确逼真的视觉效果,鸟标需要配备头部运动跟踪装置和3D眼镜,以使计算机生成的3D场景跟使用者的视角相匹配。这样使用者就能像置身于一个真实的世界里那样编辑虚拟的3D物体,当编辑完成之后,可输出模型并将其3D打印成真正的物体。

图片

图5-6  鸟标在6个自由度空间中自由操作,包括三维平移加三维转动(图片来源:Leonar3Do

5.1.2  3D智能数字化扫描技术的发展现状

当然,并非人人都有能力自己设计3D形状,因此第二大类的3D数字化就是3D扫描(俗称3D逆向、3D照相),基于计算机视觉、计算机图形学、模式识别与智能系统、光机电一体化控制等技术对现实存在的3D物体进行扫描采集,以获得逼真的数字化重建。

3D扫描技术可分主动式(Active)扫描与被动式(Passive)扫描两种。

主动式扫描是对被测物体附加主动投射光,包括激光、可见白光、红外光、超声波与X射线等。其中激光线式的扫描(如手持式激光,Handhold Laser),可以扫描大型物体,但是由于每次只能投射一条光线,所以扫描速度慢。另外,由于激光会对生物体以及比较珍贵的物品造成伤害,所以不能应用于某些特定领域。而目前最新的基于结构白光(Structured Lighting)的扫描设备,能同时测量物体的一个面,点云密度大、精度高,在快速采集物体三维表面信息方面具有独特优势。除此之外还有基于时差测距(Time-of-Flight)、三角测距(Triangulation)、调变光(Modulated Lighting)和光照编码(Light Coding,如Microsoft Kinect设备就是采用此原理,具有实时性的特点)的主动式扫描技术等。

被动式扫描对被测物体不发射任何光,而是采集被测物表面对环境光线的反射,因不需要特殊规格的硬件,往往只需要一台或几台照相机获取多个视角的图片即可,因此成本非常便宜。被动式重建方法,如Autodesk123D Catch,通常基于计算机三维视觉的理论方法,如立体视觉法(Stereoscopic)、从明暗恢复形状方法(Shape from Shading)、立体光度法(Photometric Stereo)和轮廓法等。被动式扫描的精度和鲁棒性受环境光照和照片质量的影响较大。

在获得3D扫描的原始数据后,往往还需要对其进行复杂的后处理,如将多个视角的形状片段进行对齐(Alignment)和拼接配准(Registration,也被译为注册),以统一在同一个世界坐标系下。此外还需要进行漏洞修补、噪声去除、三角化、重网格化等操作,以生成最终的高质量水密(Watertight)流形曲面。目前,还没有一种成熟的3D数字化技术能够对自然界的任意形状进行全自动地真实重建,如对于人体的头发等还不能获得理想的结果。因此在实际操作过程中,往往需要同时结合多种扫描技术,以及一定的手工编辑,以获得一个好的重建质量。

值得指出的是,在获得数字化模型之后,通常还需要进行个性化编辑定制,才会最终输出到3D打印机。这种追求高附加值的个性化定制,之前都是以较大的手工工作量为代价的,尤其是当需要“大批量定制”时。因此,为提高定制效率,智能数字化技术将发挥关键作用。比如,需要为一万名用户打印定制个性化的眼镜、服装、帽子、鞋子,如果使用人工逐一为每位用户进行手工测量和手工设计,工作量和成本都将变得不可接受。而应用智能数字化技术,如采用视觉计算方法,利用摄像头自动采集、分析提取每位用户的体貌个性特征,并自动根据视觉美感进行形状设计、颜色肤色搭配等,可极大地缩减定制周期。

可以说,数字化是“第四次工业革命”的媒介和载体,而智能化则是手段和核心。目前,智能化技术的应用研究处于起步阶段,离工业化的实际应用还有一定的距离,但AI大模型出现后,最近几年发展很快。

5.1.2.1  三维扫描的发展历程

所谓3D扫描,说得通俗一点,就是类似于用我们日常的照相机对视野内的物体进行照相。区别在于照相机获得的是物体的二维图像,而3D扫描获得的是物体的三维信息。

注意:3D扫描属于逆向工程Reverse Engineering)的一种,通过扫描产品实物的3D外形来获取原本不公开的数字化设计图纸。这可能会涉及版权问题,比如将其他厂商生产的一款鞋子外形进行3D扫描(3D抄数),逆向取得设计图纸后生产以获取商业利益。

研发人员通过扫描产品实物(如市面上已有的一款鼠标),通过逆向重建软件(如Geomagic Studio)可迅速获得该款鼠标的CAD三维模型,并以此为基础,再借助正向CAD软件(如SolidWorks)加入自己的创新设计元素,即可生产出一款新型的鼠标,这样大大节省了研发人员的设计时间、提高了工作效率。整个正逆向混合设计流程如下图所示。

图片

图5-7  3D扫描与3D设计相结合的产品研发流程 (图片来源:深大三维)

3D扫描及数字化系统可广泛应用于汽车、模具制造、家具、工业检测、制鞋、医疗手术、动漫娱乐、考古、文物保护、服装设计等行业,以提高行业生产效率。下图是雕塑行业的3D扫描应用。

图片

图5-8  雕塑行业的3D扫描应用

图片

家具行业的3D扫描应用(如下图所示)。

图5-9  家具行业的3D扫描应用

大型零部件(发动机缸盖)逆向工程(如下图所示)。

图片

图5-10  发动机缸盖的扫描现场和三维数字化模型(图片来源:华朗三维)

3D扫描仪大体分为接触式和非接触式两大类。接触式三维扫描仪通过实际触碰物体表面的方式计算深度,如三坐标测量仪即典型的接触式三维测量仪。接触式测量仪精度很高,对物体表面的颜色、反射特性无要求;但缺点是,逐点测量速度慢且被测物有被探头破坏损毁的可能,因此不适用于高价值对象,如古文物、遗迹等。

非接触式三维扫描仪又分为结构光栅三维扫描仪(也称拍照式三维扫描仪)和激光扫描仪。光栅三维扫描又分白光扫描或蓝光扫描等,激光扫描仪又有点激光、线激光、面激光的区别。非接触式三维扫描仪由于采用逐线或逐面大范围扫描,所以扫描速度快而且精度高,但无法测量被遮挡的几何特征,因为要接收物体对光的反射,所以对零件表面的反光程度、颜色有要求(因此目前光学技术还不易处理高亮、镜面或半透明的表面,解决办法是可在表面喷涂白色显像剂,如喷涂白垩涂层),还容易受环境光线及散射光的影响。

这里对三维扫描仪的发展历程做一个简介。

第一代三维扫描仪:点测量

代表系统有:固定式三坐标测量机、便携式关节臂测量机、点激光测量仪。通过每一次的测量点来求得物体的表面特征,优点是精度特别高,但速度慢。

适用范围:适合做物体表面误差检测用。

第二代三维扫描仪:线扫描

代表系统有:台式三维激光扫描仪、手持式三维激光扫描仪、关节臂测量机配激光扫描测头。通过一段(不能过长,否则激光线会发散)有效的激光线照射物体表面,再通过传感器得到物体表面的三维信息。线扫描采用的光源通常为激光,而由于激光散斑效应的存在(即光波从物体表面反射时,表面各点都发出一束高度相干的子波,子波叠加的结果就形成了物体表面呈随机分布的散斑),使得要确定像点的位置会存在误差。此外,激光对被测表面的粗糙度、漫反射率和倾角敏感,存在由遮挡造成的阴影效应。

适用范围:手持式激光扫描仪非常便携,若采用普通的激光线则精度较低。这种便携性适合大型物体的直接扫描,但对于表面复杂的物体精度没有拍照式的三维扫描仪高。普通激光线虽然精度不是特别高,但最大优点是非常廉价,可以很低的成本来搭建多条激光线组对3D物体实现全方位一次性扫描。

第三代三维扫描仪:面扫描

代表系统:“拍照式”(光栅)结构光三维扫描仪,三维摄影测量系统等。通过一组(一面光)光栅的位移,再同时经过传感器而采集到物体表面的数据信息。面扫描一般采用投影仪(如高压汞灯的灯泡光源UHP)发出的白光(或蓝光,其可以避免一些光学环境的干扰而进一步提高测量精度),相比于激光极强的单色性和方向性,其相干性被大大消弱,所以在物体表面反射时散斑效应不明显,这样有利于像点位置的确定。

适用范围:应用范围非常广泛,相比于激光的线扫描,面扫描速度更快、精度更高。对于大型物体的测量,结构光要借助于摄影测量系统(如多次分段测量并拼接起来)来完成。缺点是适合测量表面起伏不大、较为平坦的物体,对于表面变化剧烈的物体,在陡峭处往往会发生相位突变,是测量精度降低。

5.1.2.2  光学三维扫描仪的原理和实例(激光、结构白光)

目前光学三维扫描仪按照其原理分为两类,一种是“拍照式”,一种是“激光式”,两者都是非接触式的,采用的是三角测距原理。以激光为光源,将激光束投射到物体表面,用CCD数码摄像机在另一位置接收激光的反射。这样,光源、物体、CCD数码摄像机三者之间就形成了一个三角形。因此,我们可以利用光源和CCD数码摄像机之间的位置和角度关系来计算物体表面点的三维坐标。激光三维扫描可以分为点扫描法和线扫描法两种,如下图所示。

图片图片

图5-11激光三维扫描原理。左上:点扫描法;右上:线扫描法;下:两个线扫描示例

(图片来源:instructables.com

“拍照式”结构光扫描仪是针对工业产品设计领域的新一代扫描仪,如下图所示,与传统的激光扫描仪的线扫描比较,面扫描的测量速度提高了很多,整体测量精度也有提高,扫描范围可达10m。两天时间即可完成整车的内外表面扫描。

图片

图5-12  “拍照式”结构光扫描仪(图片来源:Alan Robinson

结构光三维扫描仪的主要结构,由光栅投影设备及两个成一定夹角的高分辨率CCD数码摄像机所组成,如下图所示。工作原理是:将编码后的数字光栅条纹(如采用正弦明暗分布)投影在被测物表面上,光栅条纹受到物体表面高度的影响而发生变形(条纹间的正弦相位关系发生了变化),变形后的光栅条纹因此携带了物体表面的三维信息。然后由两个CCD数码摄像机获取不同角度的数字图像,经计算机算法(利用立体匹配技术、三角形测量原理、相位计算等)解码出光栅条纹变形所引起的相位变化量,即可重建出物体的3D形状。

图片

图5-13  结构光三维扫描仪原理示意图(图片来源:polymetric.de

提示:用两个CCD数码摄像机的好处是:物体、两个CCD数码摄像机三者之间直接进行三角测距。当然也可以只用一个CCD数码摄像机,但缺点是此时要根据物体、投影机、CCD数码摄像机这三者进行三角测距,然而投影机一般是不便于固定死的,若其位置有错位就会导致系统误差。

每次扫描得到物体一个侧面的形状,于是将物体转动一个角度后再扫描新的侧面,直到得到物体360°各个方位的形状。两次扫描的侧面之间要保证一小部分形状是重叠的,以便于将两个侧面拼接起来。为了便于拼接,有时还需要在物体上随机(一定不要有规律,如有规律地连成一条线)贴上一些标记点(Markers),如下图所示,邻接两个扫描面的公共标记点一般最少为3个,常见的为4个或以上。由于标记点遮盖住的形状将变成空洞(其只能通过后期修复),因此标记点一般贴在物体的平坦无特征处。

图片

 图5-14  为了便于将各个侧面拼接起来,在物体上贴上标记点(图片来源:合肥智泰)

提示:光学三维扫描适用于测量表面相对平坦的物体。在陡变不连续的曲面以及窄缝、边界处,可能会发生相位突变而造成细节丢失。

下面这张图片给出了结构光三维扫描的工作流程。首先把物体放在转盘上,并对其投射事先设计好的结构光条纹。为了唯一确定空间点的三维位置,需要投射有一定相位差的多幅光栅条纹,每幅条纹的粗细和位置都有不同,参见下图上方的中间和右边图片。当扫描完一个侧面,将转盘转一个角度再扫描下一个侧面,要保证两个侧面的形状有部分重叠;然后继续旋转、扫描,我们就获得了多个侧面的三维形状数据。最后将这些侧面拼接(也称为配准)在一个统一的世界坐标系下,于是我们就得到了一个完整的360°全方位3D模型。

图片

图片

图5-15  结构光三维扫描的工作流程 (图片来源:gdiy.com

扫描后的形状拼接、形状优化、NURBS曲面生成等过程需要配备专用的逆向软件。目前商业化的逆向工程软件有:GeomagicImagewarePolyworksCopyCADICEMSurfRE-SoftRapidform等。

从原理上讲,结构光的编码主要分为两种类型:只有黑白二值的格雷码(Gray Code、具有明暗渐变分布的正弦相移(相位偏移:Phase Shifting。其中格雷码在任意两个相邻的数之间转换时,只有一个数位发生变化,大大地减少了由一个状态到下一个状态时逻辑的混淆;另外,最大数与最小数之间也仅有一位数不同;因此格雷码在信号编码上有较高的抗干扰能力,空间定位准确,缺点是仅能对空间进行离散划分。而正弦相移具有丰富的明暗渐变层次,这种连续的划分可提高测量的细节分辨率。目前主流的方法是将两者结合起来,利用数字投影仪投射格雷码和正弦相移光珊于物体表面,通过解码、解相获取物体表面像素的格雷码值和相位值,利用格雷码值和相位值进行立体匹配获得视差,最终利用视差原理获得物体三维坐标。例如,可先利用相移图案,确保采样点的相位在范围内周期变化,再将该相位与采样点对应的格雷码结合得到绝对相位,最后将绝对相位在相位空间中的位置线性映射到投影角空间,对其进行连续划分,从而确定采样点的投射角,最后依据三角法原理实现三维测量。

无论是格雷码还是正弦相移,这黑白条纹的优点是简单方便,但缺点是需要连续拍摄多张粗细及位移(相移)变化的变形条纹照片才能计算出三维信息。

提示:我们以采用正弦相移编码的四步相位移为例介绍一下具体的计算过程。四幅光栅图像的相位移分别为,则四幅图像的光强分别为:图片

其中的三个未知量为图像的平均灰度、为图像的灰度调制、为待求解的相对相位值(也被称为相位主值)。显然,相对相位值可由以上的4个式子直接求解得出:图片 然而,虽然相对相位值在一个相位周期内唯一,但在多个光栅条纹的情况下呈锯齿起伏分布,因此还需进一步进行相位展开(Phase Unwrapping以得到连续的绝对相位值,比如采用时间相位展开算法。最后,我们就可以根据预先标定的系统参数或相位-高度映射关系,从绝对相位值计算出被测物体表面的三维点云坐标了。

假设我们连续投射6组粗细不同的条纹,而每组都位移变化了4次,这样每个CCD数码摄像机需拍摄6×424张条纹图像,两个CCD相机共需拍48张图像,这么多张图像的处理时间需要长达1s,因此黑白条纹法一般只适合静止不动的物件。如果要实时(最多1/25=0.04s)重建出运动物体的3D形状,比如将脸被人扇一巴掌的形变过程扫描下来(如下图所示),则需要原理上的改进。

图片

图5-16  运动形变物体的实时扫描 (图片来源:ETH Zurich

一种思路是将黑白条纹更改成彩色条纹,如下图所示。编码方式也做一些调整,如改为De Bruijn序列。这时只需拍摄一张(One-shot)彩色条纹图案的照片即可重建出3D信息,使实时扫描运动物体的3D形状序列成为了可能。

图片

图5-17  彩色条纹光以及实时获取的3D动态人脸表情(“笑”) (图片来源:Brown University

最后,我们介绍美国的一款名叫Artec的结构光三维扫描仪,目前被3D照相馆广泛采用,但缺点是价格昂贵。如下图所示的是Adidas Originals工作团队为香港歌星陈奕迅(Eason)所做的人体3D扫描过程。在这个扫描案例中,两名工作人员一前一后同时进行扫描,这样进一步缩短了扫描的整体时间。

图片图片

 图5-18  手持式结构光三维扫描仪的扫描案例 (图片来源:Adidas

5.1.2.3  基于Kinect3D扫描原理和设备(红外光斑、ToF

在上节我们介绍了两种光学扫描仪:激光和结构光。这两种3D扫描仪精度高,但有一些共同的缺点,比如高强度激光对人的眼睛有伤害,而高强度结构白光虽然无害,但也非常地刺眼。此外,它们的扫描速度也不是特别快,单个面的扫描时间一般都是秒级的,还没有快到毫秒级的。

因此在本节中,我们介绍一种结合激光和结构光优点的新式扫描仪:红外激光扫描仪,优点是对人眼无害且速度非常快,当然,缺点是精度要差一些,但对于3D照相馆这样的非工业级应用,目前基本可以胜任了。

红外激光扫描仪大体可以划分为两类。

基于飞行时间(ToF)原理

ToF通过测量光脉冲之间的传输延迟时间来计算深度信息。ToF是“Time of Flight”的缩写,从字面上也可知道其含义:计算光线飞行的时间。首先让装置发出脉冲光,同时在发射处接收目标物的反射光,即可通过测量时间差来算出目标物的距离。具体公式为:

目标物的距离=光的往返飞行时间×光速/2

感光芯片需要飞秒级(1飞秒只有1s的一千万亿分之一,即1e−15秒)的快门来测量光的飞行时间。ToF的代表性产品有Mesa Imaging SwissRanger 4000PMD Technologies CamCube 2.0等。

基于结构光编码原理

在上节我们已经介绍过,“结构光”指一些具有特定模式的光,其模式图案可以是点、线、面等。结构光扫描法的原理是首先将结构光投射至物体表面,再使用摄像机接收该物体表面反射的结构光图案。由于接收到的图案会因物体的立体形状而发生变形,所以可通过该图案的所处位置和变形程度来计算物体表面的空间信息。

在本节中,我们重点介绍一下目前市面上广泛使用且价格低廉的Microsoft Kinect,其采用了红外结构光编码。Kinect是微软对Xbox 360体感周边外设正式发布的名字。Kinect将人机自然交互带入全新领域,无论是游戏或应用,都可以通过身体姿态来控制。在3D打印出现后,技术人员发现了Kinect另一个功用:可以作为3D扫描仪,而且还可实现实时、动态地扫描。

Kinect获得深度数据的原理如下:红外投影机的普通激光源投射出一道“一类普通激光”(Class1 Laser),这道激光经过磨砂玻璃和红外滤光片,覆盖Kinect的可视范围,然后红外摄像头接收反射光线,以此来获得目标物体的“深度场”(Depth Field),如下图所示。

图片

图5-19  Kinect获得的3D深度场数据,不同颜色代表着不同的深度距离(图中为笔者本人)

上面这句话对于普通读者来说,可能说了等于白说。因为包含了太多的术语且不加以解释。下面,我们就抽丝剥茧般地进行详细解释。

在大学物理实验课上,我们都做过散斑实验。激光照射到粗糙物体(大多数物体表面与激光的波长相比都是粗糙的)或是穿透毛玻璃后,会形成随机的反射斑点,称为激光散斑Laser Speckles)。这些散斑会随着距离的不同变换图案:空间中任意两处散斑图案都是不同的。

激光散斑因为是随机分布的,要研究它必须使用概率统计的方法。通过统计研究,可以认识到散斑的强度分布和运动规律。最核心的本质还是刚才那句话:散斑具有高度的随机性,会随着距离的不同出现不同的图案,且空间任意两点的散斑都不相同。因此,只要在空间中打上这样的散斑,就相当于给整个空间的远近位置做了标记。这样,我们从物体的散斑图案变化就可以得知该物体所处的空间位置。

Kinect采用的光斑编码(Light Coding)就基于这个原理,如下图所示。可以看出,它与上节提到的周期性变化的二维结构光栅编码有所不同:光斑编码是直接具有三维纵深的“体编码”,只要看物体表面的光斑图案,就可以知道这个物体在什么位置。

图片

图5-20  通过红外夜视摄像机观察Kinect传感器投射出来的光斑(图片来源:zhihu.com

当然,在这之前要把整个空间的散斑图案都记录下来,所以要先做一次光源的标定。方法如下:每隔一段距离,取一个参考平面,把参考平面上的散斑图案记录下来。假设Kinect规定的用户活动范围是距离电视机14m,每隔10cm取一个参考平面,标定后保存了30幅散斑图像。这些标定结果在Kinect出厂前就已经固化在芯片中了。

用户购买Kinect后,实际测量时,Kinect会拍摄一幅待测物体的散斑图像,将这幅图像与出厂前就已标定了的30幅参考图像依次做互相关(Cross-Correlation运算,得到30幅相关度图像。在每一幅相关度图像上就会有相关性最大的峰值,这些峰值代表此处有物体存在的可能性最大,比如你的手出现在第1幅图像上的某个峰值坐标位置,你的脚出现在第5幅图像上的另一个峰值坐标位置等。把这些峰值一层层叠在一起,经过插值运算,并参照标定散斑图案时所测量的位置距离(比如第1幅图像的位置在1m处,第5幅图像的位置在1.4m处),即可得到整个物体的3D深度距离。整个原理是不是特别简单?

提示:互相关函数(Cross-Correlation表示不同过程的某一时刻的相互依赖关系或匹配程度,而自相关函数(Auto-Correlaction则表示了同一过程不同时刻的相互依赖关系。设两个函数分别为,则互相关函数定义为:

图片其中,代表卷积(Convolution。卷积可被理解为“加权平均积”,即一个函数对另一个函数做加权平均:。卷积的一个重要性质是:时间域/空间域上的卷积对应于频率域上的乘积,即两个函数卷积后的傅里叶变换等于它们的傅里叶变换的乘积,这可使傅里叶分析中许多问题的运算得到简化。自相关函数的定义则显得很简单:设原函数是,则

看到“激光”,你可能还会心存疑虑:Kinect发射的是红外线还是激光?会不会对人体有害呀?实际上,Kinect发射的是近红外激光,且符合IEC 60825-1标准中的一级(Class1)安全要求,大家大可放心。

参考:激光的波长范围包括:长波长的远红外激光(CO2激光器),近红外激光(Nd:YagNd:YVO4激光器),可见光(氖、氩激光器)和不可见的紫外光。在光谱中波长0.76400mm的一段称为红外线,红外线是不可见光线。所有的物质都可以产生红外线,其中有体温的生命体(如人类)发出的光谱属于“远红外线”,而Kinect发射的光谱属于“近红外线”。

根据对人的伤害程度可以定义激光不同的危险等级:从激光一级(在各种情况下,一级激光基本安全)到激光四级(任何情况下,四级激光是危险的)。

介绍了这么长时间,可能有些读者还没有见过Kinect的真容。下面就对Kinect关键部件做一个说明,如下图所示。

图片

图5-21  Kinect的整体外形结构

Kinect以每秒30帧的高速生成3D深度图像,也即延迟仅为1/30s33ms),因此可以实时地再现周围3D环境和捕捉动态运动目标。Kinect共有3个摄像头,中间的镜头是RGB彩色摄像头,左右两边的镜头分别为红外线发射器和红外线CMOS深度摄像头。深度感应器的有效视野范围是0.83.5mKinect在距离1m时精度大概是3mm;而当距离是3m时,精度大概是3cm因此随着距离的拉远而精度降低,所以扫描时应在有效扫描范围内尽可能地拉近与被测对象的距离

下面介绍一下Kinect3D扫描操作过程。Kinect体积很小,可以方便地进行手持式扫描。当然,你也可以将Kinect放在一个能上下滑动的垂直支架上(便于从上到下扫描人体),并将扫描对象放置在可360°旋转的圆形电动转台上,如下图所示。

图片

图5-22  Kinect放置在支架上扫描人体 (图片来源:mbot3d

值得指出的是,第一代的Kinect扫描精度不是很高(一般不高于1mm),输出的原始3D数据有很多噪声,如果直接用于人像扫描则效果欠佳。这时,轮到3D智能数字化技术大展身手了。可结合数字滤波,加上3D模型库数据驱动的方法,使原始的粗糙表面“旧貌换新颜”,如下图所示。

图片

图5-23  3D智能数字化技术修复原始粗糙表面(下图第2个),获得细致表面(下图第3个)(图片来源:University Erlangen-Nuremberg

5.1.3  3D打印技术的发展现状

近年来,我们从各类媒体上获得的关于3D打印的新闻逐渐增多,比如时尚的衣服、合脚的鞋子、营养的食物、后现代的房屋和自行车、汽车、无人飞机等都被打印出来了,3D打印正在以一种不可思议的速度渗透进我们生活中“衣食住行”的各个方面。

《老子》(六十四章)有云:“合抱之木,生于毫末;九层之台,起于累土”。两千年前思想家老子的这句话几乎准确地“预言”了3D打印的过程:从“”米级(如标准的1.75mm3.0mm)的细丝或更细的粉“”开始,通过逐层“”积的方式,制造出3D物体。其次,以3D打印机这么小小的一台机器,谁又能想到它竟被英国著名经济学杂志《经济学人》声称将引发史诗般宏大的全球新一轮工业革命呢?通过老子的这句深含哲理的话,我们可以领悟到:不要小看了事物的毫末之始,新工业革命的“九层之台”正由它而立起!

3D打印(三维打印)是增材制造技术(AMAdditive Manufacturing)的俗称。3D打印,名为“打印”,实为“制造”,结合智能数字化,更可实现“创造”!实际上,在大量的英文文献中,3D打印(3D Printing)常被称作3D Fabrication3D制造),这更准确地描述了3D打印的本质。

作为“第四次工业革命”的前沿代表技术──3D数字化打印,成功地将虚拟的数字智能化技术与实实在在的工业产品桥接在一起。作为快速成型技术的一种,与传统的“切削去除材料”的加工技术(如3D雕刻)完全不同,3D打印以经过智能化处理后的3D数字模型文件为基础,运用粉末状金属或塑料等可热熔黏合材料,通过分层加工、叠加成型的方式“逐层增加材料”来生成3D实体。由于可采用各种各样的材料(液体、粉末、塑料丝、金属、沙子、纸张,甚至巧克力、人体干细胞等),而且可以自由成型(任意复杂的中空、多孔、镶嵌形状),所以3D打印机是名副其实的“万能制造机”。

3D打印之所以具有革命性的意义,主要是集两大突出优势于一身。1)个人只需在计算机中进行智能化设计,然后将复杂作业流程转化为数字化文件,发送到3D打印机即可实现制造。整个过程中,用户根本无须掌握各种复杂的制造工艺和加工技能,这样大幅降低了制造业的技术门槛。2由于3D打印的逐层加工、累积成型的特点,制造几乎不受结构复杂度的限制,结合智能数字化设计,可轻松实现产品的个性化定制。

通俗来讲,只要你能够设计出来,你就能够通过3D打印技术打印出任何你想要的个性化产品。3D打印无须机械加工或任何模具,就可加工任意复杂的中空形状,解决了许多过去难以制造的复杂结构零件(如复杂的航空发动机叶片)的成型问题。而且产品结构越复杂,制造效率优势(研制周期缩短、原材料节省)越显著。

下图所示的这些雕塑都是用复杂的激光烧结而成的。对于要求具有复杂的内部中空、凹陷、互锁或者有大量规则细节图案的形状加工,3D打印机是首选的制造设备。智能数字化设计(下图左1)可对零件进行优化,减轻重量,同时保持原有强度和其他关键性能。由于是一次成型,使产品成为一个整体,这样也减少(或免除零部件的装配。目前3D打印在电影制作、游戏动漫、医疗、教育、建筑、文物考古、生产制造业都发挥了其独特的作用。

图片

图5-24  3D打印出的任意复杂设计形状,传统制造工艺无法加工(图片来源:Bathsheba Sculpture

耐克(Nike)“Vapor Laser Talon”跑鞋,如下图所示,抛弃了传统制鞋工艺,使用3D打印制造,只有158.7g(相当于3枚鸡蛋的重量),可以帮助运动员在草地赛场上“飞”起来。这款鞋子仅在7个月之内,就已经试做、试用了成百上千双,直到最终满意定型。传统工艺在如此短的时间内根本无法做到,只能通过3D打印来实现。

图片

图5-25  耐克的定制跑鞋,仅3枚鸡蛋重,让运动员找到“飞一样”的感觉 (图片来源:Nike



https://blog.sciencenet.cn/blog-4099-1541844.html

上一篇:5.12 【3D智能十八篇之一】3D智能:计算机视觉与计算机图形学在AI下的融合
下一篇:5.14 【3D智能十八篇之三】3D打印机的工作原理和家族



    
收藏 IP: 180.79.10.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-7-5 02:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部