|||
The Discussions of Big Data
Guolin Wu, The Center for Philosophy of Science & Technology, SCUT, P. R. China
吴国林
近来,一些学友希望要我在黑龙江大学2014年1月10日至12日召开的的“大数据时代的哲学问题学术研讨会”上,所做的《大数据的几点思考》,现将PPT转换为rtf格式,稍作一点调整。供参考!请批评指正!
大数据的几点思考
n 吴国林 博士 教授
科学技术哲学研究中心/思想政治学院华南理工大学
2014.1.11
基本内容n
1. 大数据是什么?
2. 大数据与本体论问题
3. 大数据与复杂
4. 大数据与量子信息
1、大数据是什么?
n 大数据(big data),是指无法在可容忍的时间内用传统信息技术和软硬件工具对其进行处理的数据集合。
n 大数据的特征可以概括为:4个V:
n Volume(数量巨大)
n Variety(种类繁多)
n Velocity(生成快速)
n Value(价值巨大潜力)
n 对于精确性(veracity),不太赞同。数据并不表示精确。
数据是事物某个性质的显现。
n 大数据,既包括大量结构化的数据,也包括非结构化的数据。n 数据的巨增、信息量的巨增
2、大数据与本体论问题
n 哲学的“本体论(Ontology)”
n 计算机科学的“知识本体(Ontologies或Ontology)”
人工智能研究中
n 格鲁伯(Gruber)在1993年给ontology下的定义是:
n “ontology是概念体系的明确规范”(An ontology is an explicit specification of conceptualization ) 。
n 1998年,施图德(Studer)等给出了一个更加明确的解释“ontology是对概念体系的明确的、形式化的、可共享的规范”。An ontology is a formal explicit specification of a shared conceptualization )
n 所谓“概念体系”是指所描述的客观世界的现象中有关概念的抽象模型;
n 所谓“明确”是指对于所使用的概念的类型以及概念用法的约束都明确地加以定义;
n 所谓“形式化”是指这个ontology应该是机器可读的(machine-readable);n
所谓“共享”是指ontology中所描述的知识不是个人专有的而是集体共有的。 n 可见, ontology作为一种概念体系的规范,这样的概念体系规范就可以看成这个领域的ontology,不应当翻译为“本体论”,而应当翻译为“知识本体”。或“知识表达”
哲学上的ontology
n 如何理解“本体”,还得追回到古希腊的“是”。
希腊人属于印欧语系,印欧语系的“是”的词根是es, 在希腊文es的第一人称是eimi;es的第三人称是esti。
n eimi的阴性分词是ousa ,亚里士多德将其写成ousia。eimi的中性分词是on。
n 通常说的本体论ontology就是研究on(“是”)的学问,即“是论”。
n 在英文中,没有中性、阴性与阳性名词的区别,ousa与on都只能译为being。
n “是”有三种用法:系词、存在、断真。 n 在我看来,“being”可译为“是”或“存在”。数据的本体是什么?
n 在一个大数据构成的系统中,各个数据构成该系统的最基本的要素。n 这些数据可以形成为一些结构,也可以没有明显的结构,但可能有一些潜在的结构。
n 本体或存在,应理解为事物的最基本的基础,是后来演生者的始源,它推动了后来的演生者。
n 数据为存在者。
n 这些数据构成了什么样的结构?显在的,或潜在的? n 世界来自于信息吗?
n Wheeler: n 实在与信息的统一(吴国林,2011)
数据与关联n 数据总是信息。n 信息是事物的状态和关联方式的显现。
(吴国林:《量子信息哲学》,中国社会科学出版社,2011)
n 这些数据就是关联方式的显现。
n 数据是实在[存在]的状态或关系的显现。
n 有的数据,我们知道其结构或关联方式;有的数据,我们需要发现其结构或关联方式。n 发现了关联方式,我们才可能进行预见。
3、大数据与复杂
n 大数据的实质,就是复杂。
n 量大,种类多,增长快(或指数增长)
n 计算复杂性:时间复杂与空间复杂
n 经典计算具有无法克服的复杂性
n 但是,量子算法可以克服一些复杂性。
4、大数据与量子信息
n 维纳的名言:“信息就是信息,不是物质也不是能量。”
n 量子信息就是量子状态和关联方式的显现。
大数据与因果关系
n 大数据之间有没有因果关系?
n 可能有复杂的因果关系。
n 或者没有因果关系。
n 或者是潜在的因果关系。 如:量子力学的薛定谔波动方程1926年,薛定谔(Schrödinger)波动方程 量子信息的基本涵义
n 经典信息:n 经典比特只有一个或0或1的状态。
n 从物理角度讲,例如,是或非,真或假,0或1等。
量子比特n 量子力学用量子态来描述量子系统。
n 量子信息就是量子状态表达的信息。
n 一个量子比特是一个双态系统,且是两个线性独立的态。两个独立的基本量子态常用狄拉克符号记为:|0>和|1>。量子比特是两态量子系统的任意叠加态,量子比特|0>,|1> 是二维复空间中的向量。
n 量子比特可以处于|0>, |1>之间的连续状态之中,直到它被观测。当量子比特被观测,只能得到非“0”即“1”的测量结果,每个结果有一定的概率。
n 经典比特可以看成量子比特的特例(C0=0或C1=1)。 量子信息的特点n (1)量子信息处理依据量子力学。n
n (2)量子信息具有相干性和纠缠性。
n (3)经典信息可以完全克隆,而量子信息不可克隆(No-Cloning)。 所谓量子克隆是指原来的量子态不被改变,而在另一个系统中产生一个完全相同的量子态。克隆不同于量子态的传输。 量子不可克隆定理是指两个不同的非正交量子态,不存在一个物理过程将这两个量子态完全复制。
n (4)经典信息可以完全删除,而量子信息不可以完全删除。
已有学者证明,任何未知的量子态的完全删除是不可能的。量子信息---新的资源与工具 量子计算主要具有以下特点
:n (1)量子存储器具有巨大的存储能力
n (2)量子计算具有并行性n
(3)量子计算具有全局性n (4)某些量子算法具有加速能力
肖尔(Shor)算法 格罗夫(Grove)算法谢谢!
另外:参见我的《物理学哲学》与《量子信息哲学》两本著作,以及我的相关哲学论文。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 15:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社