|
10.6 抽样定理
据说有一个科学实验证明了蜘蛛的耳朵是长在脚上的。
这个实验验证比较容易,首先随便抓一只小蜘蛛,在其旁边放刺耳的声音,可以发现蜘蛛受惊吓拼命奔跑。然后把蜘蛛的脚全部截掉,这时无论在旁边如何放刺耳声音,蜘蛛都纹丝不动,可见脚全部截掉后它就不会再受刺耳声音惊扰。
结论:蜘蛛的耳朵是长在脚上。(乍一看铁证如山嘛)
这个所谓的科学实验当然是一个笑话而已。
那么为什么‘事实’也会撒谎呢? 铁板钉钉的实验会出来如此谬论呢?
这个实验的逻辑缺陷,是因为测量环节不完整(没有测量蜘蛛其它器官反应),导致测量数据不完整,因而不完备的数据引起了推论的不严谨。
我们常识都知道蜘蛛纹丝不动,既可能是因为它耳聋听不到了,也可能因为其不跑不动无法动弹了。
对于常识就可以识别的,我们容易识破逻辑的谬误。但常识以外,仅凭经验就很难判断了。所以获取更多的信息,更充分的数据犹为关键。
所谓偏信则暗、兼听则明,信息完整充分是重点。
当前,因为Internet的发展,人类文明迈入了大数据时代,也正是因为海量的大数据,人工智能才得以真正取得突破。因为只有数据充分,大数法则,才能在大量随机事件中发现内在规律性。而因为可窥探的规律性,才使得预知事物发展趋势性变成可能。这种领悟规律性的本事,即智能。
所以,数据完备性,是规律预测的关键,也是人工智能实现的基础。
那么,究竟要多少数据量对于大数据下的人工智能才是完备的呢?
N个?
N+1个?
无穷多个?
阿列夫0 ?
阿列夫1 ?
阿列夫2 ?
......
我们曾经在5.2节探讨过关于有限和无限的问题:
[ 5.2 最深刻的宇宙秘密
在傅立叶变换所有秘密中,最意味深长、最不寻常的是关于无限和有限的。
傅立叶变换能够把某些初看起来非常杂乱无章的甚至无穷无尽的东东,变换为异常简单的有限的东东。反之,对异常简单的东东通过傅立叶变换必然变成无限的广阔。
那么,有没有一种信号在空域和频域上的分布都很广泛呢?
有的,比如噪声信号。
一段噪音,其傅立叶变换也仍然是噪音,所以它在空域和频域上的分布都是广泛的。
可以这样来看,因为噪音无规律可循,所以噪声不具有“收敛性”,所以噪声不可“压缩”,所以傅立叶变换前后的数据量都很多。
这并不违反直觉,因为信号压缩的本质就是通过挖掘信息的结构和规律来对它进行更简洁的描述,而噪声,顾名思义,就是没有结构和规律的信号,自然也就无从得以压缩。
另一方面,有没有一种信号在空域和频域上的分布都很简单(有限)呢?
换句话说,存不存在一个函数,它在空间上只分布在很少的几个区域内,并且在频域上也只占用了很少的几个频率呢?
答案是不存在。这就是著名的“不确定性原理” ]
下面是“不确定性原理”的简单证明:
对于带宽受限的函数f (频谱受限p)
有:
因此:
因为sinc函数是无限长的,因此f(t)和sinc函数的卷积是无限长的,这意味着等式左边的f(t)是无限长的,延伸到无穷无尽。
即,频域受限、则时域无穷尽。。
前面说过,不完备性定理的本质是因为参照系空间维度的不完备。同理,单层线形空间的阿列夫1维度是不可能完备表达阿列夫2维度的张量的。
鉴于单层向量空间无法解决复杂系统问题,我们借助“深度学习”多层次逻辑是不是可以突破其局限性呢?
纯粹理论而言,当然是可以的。但是如果放到现实环境中,立即就会注意到,无论我们依赖的计算机多么强大(哪怕如谷歌大脑上万台服务器集合、哪怕未来量子计算机大规模并行运算),其运算的基础仍然是离散的、仍然是有限的。
问题来了,仅仅有限次的计算机运算,怎么能够揭示大自然逻辑必然存在的“无穷无尽”呢?
换句话说,有限的、离散的数据是不是能够做到数据充分?从而准确完整表达内在规律呢?
抽样定理告诉我们:有限的离散的数据能够做到数据充分从而准确完整表达内在规律!
主要有两点:
第一,离散(阿列夫0)的数字信号抽样点,可以完整表达实数连续(阿列夫1)模拟信号函数。
抽样定理的实质是足够快的抽样。
因为所有函数都可以在傅立叶变换下以简谐波为基底,所以当足够快的抽样比函数的所有子函数频率更快时,既可以精确重建连续函数的性质。
第二,有限的抽样点可以准确表达周期函数。
如果是周期函数,则样本点取N(有限多)个即可。N值由时域间隔Δt和频域间隔Δs共同决定。
对于周期函数,仅仅N个样本点,即可还原函数性质。此时,离散傅立叶变换和连续傅立叶变换结果是一致的:
多重线性关系意味着更多的链接,同时也意味着更多的约束。
所以,多重线性关系模型之中掩藏的秘密也许更容易挖掘。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 10:24
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社