|
科学技术的总体论
(1)科学的最主要的特征,应该是数量化和量化分析吧。数量化,是考察/观测的领域的活动,量化分析,是总结归纳和分析数据的领域活动,它给出数量间关系的模型(也称“理论”)。
主要的、主流的特征,就是如上;但是并不排除占据次要地位的,比如说分类学,“非参数统计”等等,那些不是严格的数值间的关系、模型。
人类最早的“结绳记事”,是全部我们现有科学体系的一个起始点。
(2)延循前一篇博客文中“二局之论”的观点,“大统一”显然不能实现在客观世界、对于客观世界进行考察的这个领域中;客观世界本质上是多样化的,统一个鬼哟(需要多么的无知无畏);那么是实现在模型、理论的领域中吗?几十、上百年以来,好像是这么个趋势,很多人的研究都是在这个方向上的;不过这件事恐怕很难,难以找到这样的“大统一”的模型或者理论;更为重要的是,客观世界的本质,永远不可能是模型所解释的那样的“大统一”(即便是有这种大统一的理论;把模型含义当成客观世界本身,大多数“科学家”都或多或少有这种倾向);很多迹象表明,在数据处理的方法和技术、技巧的层面,倒是可能统一的,以下说明。
(3)假定x-y平面上有一条曲线,这条曲线表明了x-y两个量之间存在一定的函数关系,写成y=f(x)。这种“映射”(函数是映射的一种),可分成两个步骤进行,一是x向x0,x1,x2等等映射,二是y等于这些x0,x1,x2等等的线性组合,这实际上也就是幂级数展开。当然也可以是按指数函数、三角函数展开(得到傅里叶级数什么的)。在x0,x1,x2等等张开的高维空间中(可以是无限维的),组合系数是这个高维空间中的一个点,这个点标识了函数f(▪)。
张开高维空间的这些“基函数”(指x0,x1,x2等等,或者一族指数函数,一族三角函数),一般性的要求是“正交、完备”,不过未必需要“统计独立”(或称“不相关”)。
(4)从观测领域得到的数据,如果只是一个点的话,未免少了一些,很难说含有什么有价值的信息;如果是两个点的话,那么至少程度上可以确定一条直线;如果是三个点或者以上的话,对于线性关系是足够多了;从更多的、过分多的数据点中,可以抽取出“变量之间的某种确定性关系(或称函数关系)”,还要加上噪声。在数据处理的领域,基本的、普遍性的做法,是概率的,统计的;只是因为以往生产力不够发达,技术力量不足够,所以人们的关注点,更多是放在了数据点不太多的那样一些情况下,有时还会成心地用理想化条件,排除掉一些测试考察中的复杂化的变数。
运动学关系,动力学关系(最终形成牛顿力学),几个电磁现象及相应的总结归纳(最终由麦克斯韦统一成电磁学理论),以及光谱学规律(后来导致量子力学),都是比较简单的,变量之间关系的推定,倒还比较好处理。
但是量化分析领域中,违背简化处理原则的,一个是概率与统计的思想,一个是级数展开的思想,一直都是存在的;当简单化处理,不能够分析更为复杂的事物或者现象的时候,这类复杂化的方法,就能够见效了;并且现在看来,面向级数分解(成分分解,谱分析)、面向变换到高维处理的方法,更具有普遍性、一般性,更具有“大一统”的性质。
我们目前所遇到的科学问题,还有什么是不涉及矩阵运算的吗,或者说能离开矩阵运算的吗?从早前的MATLAB(矩阵实验室)软件,到更新一些的大数据挖掘、AI人工智能,哪一种解算不依赖于矩阵呢?将自变量向基函数做映射,就得到了代表参量之间函数关系的、高维空间的矢量,对于矢量进行变换,实际也就是函数的变换。由于有了(3)中的第一步,矩阵的计算、处理,目前来看,是一统天下的数值处理的方法了。
且不论物理领域中大名鼎鼎的矩阵力学。
(5)怎么知道是展开成幂级数,三角函数级数,还是按能量本征函数做展开呢,这当然要取决于观测域所处理的具体问题。当然希望“基函数”具有某种“好”的性质,比如有限项后可以安全地截断,不影响近似的精度,在某些算符作用下“不变”,等等。不过都不重要,用平面波展开,和用球谐函数展开,本质上都是可以的,实践中或许球谐函数做自洽计算时,收敛要快速许多而已。
变量多于两个,也是依此类推,扩展这种向高维和成分分解的思路而已。
怪不得量子力学中,将矢量变换的操作称作算符;该算符在一组基下,具有矩阵表示;表示又分为可约的,不可约的,又牵引出特征标等等的概念来。
(6)以上,阐述了一种观点,即,在量化分析和处理的领域,在具体处理数据的方法上,存在着“大一统”的技术手段。
当前处理复杂事物,乃至社会现象时,人工智能中普遍性的方法为深度学习神经网络,这个东西兼具概率统计的特征,和矩阵化处理的特征。所谓的特征提取,无非是将整体输入分解为一个个特征而已(按权重叠加起来,构成整体)。
(7)以往观察领域的技术手段不足够,所以数据处理领域中,处理的多是较为简单的数量关系,比如求求均值,众数,标准差,求求两变量间的线性关系,非线性函数关系,等等,这些也都罢了。当前所面临的,已经是观察领域技术手段充分发展的时代了(还要继续发展下去),数据量越来越多,越来越丰富(从各个侧面来描述事物),而数据分析和处理的领域,同样也有了越来越强大的计算本领,越来越强大的处理数据、挖掘有价值信息的技术手段,而数据分析处理的基本方法,大的思路,已经能够“统一”,从这个整体论角度来进行考察,能看见的只有“技术”,“科学原理”已经隐去了(观测靠技术,数据处理靠技术,而且还倾向于是规范、统一化的技术)。
(8)那些为科学理论做铺垫的概念、描述,依然熠熠闪光着,不过真的无法进行无限度的推广(“破坏力”终究不是一种物理作用力吧);在深度神经网络中,事物的特征处于隐含层,或者由分散的输入输出关系和一大堆权重来隐式地表达;如此,站在神经网络(机器人)的立场来看,它是很蔑视地看待人类所发明的那些概念的,情况不正是如此吗?
(9)放弃掉所谓的“大一统理论”吧,回归正常的理性与认知,搞清楚仅是我们处理数据的方式方法,有统一的可能;追求数据分析技术上的统一,可称作是“科技复兴”(以对应于那个 “文艺复兴”;不过所复兴的那个“文艺”,本身并没有什么确凿的信史依据)。
(10)较大的难点在于(3)中的第一步,要映射到怎样的高维空间;如果这个问题有比较统一性的解决途径的话,则第二步具体地确定线性组合的那些系数,倒是问题不大。
当前来看,“建统计模型+MCMC(马尔科夫-蒙特卡洛)抽样+贝叶斯参数推断”,至少可以算做优秀的方案之一吧。这个技术,本身是概率-统计性的,不仅对数据分辨其中的成分,还考虑噪声-残差;马尔科夫链和蒙特卡洛各有特点,蒙特卡洛仿真更是几乎在各细分的工程领域都能够见到,是带有普遍性光环的技术方法;核心的焦点,仍然是落在如何建统计模型,也就是如何映射到高维,这个问题上。一般来说,广义线性模型,算是目前为止各类统计技术的集大成者了,得到的认可很多,当然也不能排除其他模型。
用支持向量机进行分类,这个技术的特征,也是将低维的问题向高维映射。典型例子是一条曲线把数据点分成两部分,如果用一条直线(一维)是无法正确实现两部分数据相分离的,但是如果映射到更高的维度,二维或者更高维,用曲线或者高维空间中的超平面,则可正确分离两组数据。
(11)低维问题映射到高维,在高维空间中,往往呈现出一些有意思的特征,建议关注“the curse of dimensionality”或者“the concentration of measure”,以及:
l As the number of dimensions increases, the euclidean distance between any pair of samples becomes closer and closer. That is, in high-dimensional spaces, most points are basically at the same distance from one another.
l For a hypercube, most of the volume is at its corners, not in the middle. For a hypersphere, most of the volume is at its surface and not in the middle.
l In high dimensions, most of the mass of a multivariate Gaussian distribution is not close to the mean (or mode), but in a shell around it that moves away from the mean to the tails as the dimensionality increases. This shell receives the name of typical set.
这样一些讨论。
(12)如果仅限于“认识自然界”,那么考察、观测,取得数据,对于数据采用一致统一的方法进行分析处理,情形便是如此。人类的所有活动中,还有一大类涉及到“改造世界”,比如在大规模的工业品制造,向人们提供便利性服务的通讯或者交通这样的系统的创造、建设,等等,这些要求在掌握自然规律的基础上,进行规律的应用。
规律的应用,离不开(8)中所指的那些概念,这些概念以及概念间联系(以模型方式呈现)构成的整个科学体系,依然是辉煌的;(8)中所不赞成的,是将“力学”做无限推延,将“热学”做无限推延,将“电磁学”做无限推延,以及各细分学科做无限推延,并且认为这些推延最终到达同一个事物(所谓的大一统理论、终极理论),所不赞成的是这样想法。本文认为须放弃掉这种想法。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 04:00
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社