博文

关于科学技术的总体论

已有 1583 次阅读 2020-8-14 10:16 |系统分类:科研笔记

科学技术的总体论

（1）科学的最主要的特征，应该是数量化和量化分析吧。数量化，是考察/观测的领域的活动，量化分析，是总结归纳和分析数据的领域活动，它给出数量间关系的模型（也称“理论”）。

主要的、主流的特征，就是如上；但是并不排除占据次要地位的，比如说分类学，“非参数统计”等等，那些不是严格的数值间的关系、模型。

人类最早的“结绳记事”，是全部我们现有科学体系的一个起始点。

（2）延循前一篇博客文中“二局之论”的观点，“大统一”显然不能实现在客观世界、对于客观世界进行考察的这个领域中；客观世界本质上是多样化的，统一个鬼哟（需要多么的无知无畏）；那么是实现在模型、理论的领域中吗？几十、上百年以来，好像是这么个趋势，很多人的研究都是在这个方向上的；不过这件事恐怕很难，难以找到这样的“大统一”的模型或者理论；更为重要的是，客观世界的本质，永远不可能是模型所解释的那样的“大统一”（即便是有这种大统一的理论；把模型含义当成客观世界本身，大多数“科学家”都或多或少有这种倾向）；很多迹象表明，在数据处理的方法和技术、技巧的层面，倒是可能统一的，以下说明。

（3）假定x-y平面上有一条曲线，这条曲线表明了x-y两个量之间存在一定的函数关系，写成y=f(x)。这种“映射”（函数是映射的一种），可分成两个步骤进行，一是x向x⁰，x¹，x²等等映射，二是y等于这些x⁰，x¹，x²等等的线性组合，这实际上也就是幂级数展开。当然也可以是按指数函数、三角函数展开（得到傅里叶级数什么的）。在x⁰，x¹，x²等等张开的高维空间中（可以是无限维的），组合系数是这个高维空间中的一个点，这个点标识了函数f(▪)。

张开高维空间的这些“基函数”（指x0，x1，x2等等，或者一族指数函数，一族三角函数），一般性的要求是“正交、完备”，不过未必需要“统计独立”（或称“不相关”）。

（4）从观测领域得到的数据，如果只是一个点的话，未免少了一些，很难说含有什么有价值的信息；如果是两个点的话，那么至少程度上可以确定一条直线；如果是三个点或者以上的话，对于线性关系是足够多了；从更多的、过分多的数据点中，可以抽取出“变量之间的某种确定性关系（或称函数关系）”，还要加上噪声。在数据处理的领域，基本的、普遍性的做法，是概率的，统计的；只是因为以往生产力不够发达，技术力量不足够，所以人们的关注点，更多是放在了数据点不太多的那样一些情况下，有时还会成心地用理想化条件，排除掉一些测试考察中的复杂化的变数。

运动学关系，动力学关系（最终形成牛顿力学），几个电磁现象及相应的总结归纳（最终由麦克斯韦统一成电磁学理论），以及光谱学规律（后来导致量子力学），都是比较简单的，变量之间关系的推定，倒还比较好处理。

但是量化分析领域中，违背简化处理原则的，一个是概率与统计的思想，一个是级数展开的思想，一直都是存在的；当简单化处理，不能够分析更为复杂的事物或者现象的时候，这类复杂化的方法，就能够见效了；并且现在看来，面向级数分解（成分分解，谱分析）、面向变换到高维处理的方法，更具有普遍性、一般性，更具有“大一统”的性质。

我们目前所遇到的科学问题，还有什么是不涉及矩阵运算的吗，或者说能离开矩阵运算的吗？从早前的MATLAB（矩阵实验室）软件，到更新一些的大数据挖掘、AI人工智能，哪一种解算不依赖于矩阵呢？将自变量向基函数做映射，就得到了代表参量之间函数关系的、高维空间的矢量，对于矢量进行变换，实际也就是函数的变换。由于有了（3）中的第一步，矩阵的计算、处理，目前来看，是一统天下的数值处理的方法了。

且不论物理领域中大名鼎鼎的矩阵力学。

（5）怎么知道是展开成幂级数，三角函数级数，还是按能量本征函数做展开呢，这当然要取决于观测域所处理的具体问题。当然希望“基函数”具有某种“好”的性质，比如有限项后可以安全地截断，不影响近似的精度，在某些算符作用下“不变”，等等。不过都不重要，用平面波展开，和用球谐函数展开，本质上都是可以的，实践中或许球谐函数做自洽计算时，收敛要快速许多而已。

变量多于两个，也是依此类推，扩展这种向高维和成分分解的思路而已。

怪不得量子力学中，将矢量变换的操作称作算符；该算符在一组基下，具有矩阵表示；表示又分为可约的，不可约的，又牵引出特征标等等的概念来。

（6）以上，阐述了一种观点，即，在量化分析和处理的领域，在具体处理数据的方法上，存在着“大一统”的技术手段。

当前处理复杂事物，乃至社会现象时，人工智能中普遍性的方法为深度学习神经网络，这个东西兼具概率统计的特征，和矩阵化处理的特征。所谓的特征提取，无非是将整体输入分解为一个个特征而已（按权重叠加起来，构成整体）。

（7）以往观察领域的技术手段不足够，所以数据处理领域中，处理的多是较为简单的数量关系，比如求求均值，众数，标准差，求求两变量间的线性关系，非线性函数关系，等等，这些也都罢了。当前所面临的，已经是观察领域技术手段充分发展的时代了（还要继续发展下去），数据量越来越多，越来越丰富（从各个侧面来描述事物），而数据分析和处理的领域，同样也有了越来越强大的计算本领，越来越强大的处理数据、挖掘有价值信息的技术手段，而数据分析处理的基本方法，大的思路，已经能够“统一”，从这个整体论角度来进行考察，能看见的只有“技术”，“科学原理”已经隐去了（观测靠技术，数据处理靠技术，而且还倾向于是规范、统一化的技术）。

（8）那些为科学理论做铺垫的概念、描述，依然熠熠闪光着，不过真的无法进行无限度的推广（“破坏力”终究不是一种物理作用力吧）；在深度神经网络中，事物的特征处于隐含层，或者由分散的输入输出关系和一大堆权重来隐式地表达；如此，站在神经网络（机器人）的立场来看，它是很蔑视地看待人类所发明的那些概念的，情况不正是如此吗？

（9）放弃掉所谓的“大一统理论”吧，回归正常的理性与认知，搞清楚仅是我们处理数据的方式方法，有统一的可能；追求数据分析技术上的统一，可称作是“科技复兴”（以对应于那个 “文艺复兴”；不过所复兴的那个“文艺”，本身并没有什么确凿的信史依据）。

（10）较大的难点在于（3）中的第一步，要映射到怎样的高维空间；如果这个问题有比较统一性的解决途径的话，则第二步具体地确定线性组合的那些系数，倒是问题不大。

当前来看，“建统计模型+MCMC（马尔科夫-蒙特卡洛）抽样+贝叶斯参数推断”，至少可以算做优秀的方案之一吧。这个技术，本身是概率-统计性的，不仅对数据分辨其中的成分，还考虑噪声-残差；马尔科夫链和蒙特卡洛各有特点，蒙特卡洛仿真更是几乎在各细分的工程领域都能够见到，是带有普遍性光环的技术方法；核心的焦点，仍然是落在如何建统计模型，也就是如何映射到高维，这个问题上。一般来说，广义线性模型，算是目前为止各类统计技术的集大成者了，得到的认可很多，当然也不能排除其他模型。

用支持向量机进行分类，这个技术的特征，也是将低维的问题向高维映射。典型例子是一条曲线把数据点分成两部分，如果用一条直线（一维）是无法正确实现两部分数据相分离的，但是如果映射到更高的维度，二维或者更高维，用曲线或者高维空间中的超平面，则可正确分离两组数据。

（11）低维问题映射到高维，在高维空间中，往往呈现出一些有意思的特征，建议关注“the curse of dimensionality”或者“the concentration of measure”，以及：

l As the number of dimensions increases, the euclidean distance between any pair of samples becomes closer and closer. That is, in high-dimensional spaces, most points are basically at the same distance from one another.

l For a hypercube, most of the volume is at its corners, not in the middle. For a hypersphere, most of the volume is at its surface and not in the middle.

l In high dimensions, most of the mass of a multivariate Gaussian distribution is not close to the mean (or mode), but in a shell around it that moves away from the mean to the tails as the dimensionality increases. This shell receives the name of typical set.

这样一些讨论。

（12）如果仅限于“认识自然界”，那么考察、观测，取得数据，对于数据采用一致统一的方法进行分析处理，情形便是如此。人类的所有活动中，还有一大类涉及到“改造世界”，比如在大规模的工业品制造，向人们提供便利性服务的通讯或者交通这样的系统的创造、建设，等等，这些要求在掌握自然规律的基础上，进行规律的应用。

规律的应用，离不开（8）中所指的那些概念，这些概念以及概念间联系（以模型方式呈现）构成的整个科学体系，依然是辉煌的；（8）中所不赞成的，是将“力学”做无限推延，将“热学”做无限推延，将“电磁学”做无限推延，以及各细分学科做无限推延，并且认为这些推延最终到达同一个事物（所谓的大一统理论、终极理论），所不赞成的是这样想法。本文认为须放弃掉这种想法。

转载本文请联系原作者获取授权，同时请注明本文来自严利人科学网博客。
链接地址：https://blog.sciencenet.cn/blog-2916888-1246315.html

上一篇：科学体系与二局之论
下一篇：几个概念间的逻辑关系

收藏 IP: 59.66.112.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

严利人

扫一扫，分享此博文

yanlr的个人博客分享 http://blog.sciencenet.cn/u/yanlr

博文

关于科学技术的总体论

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

严利人

全部作者的其他最新博文

全部精选博文导读

yanlr的个人博客分享 http://blog.sciencenet.cn/u/yanlr

博文

关于科学技术的总体论

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

严利人

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)