世间唯变化永恒...分享 http://blog.sciencenet.cn/u/zlhua 世间唯变化永恒,以开朗的心简洁地生活...

博文

喜阅君:溯源数据库技术

已有 238 次阅读 2026-6-29 22:23 |个人分类:可拓数据挖掘|系统分类:科研笔记

如果信管专业教师给统计学专业(数据科学方向)本科生上《数据库原理及应用》需要讲些什么,才能激活学生对数据科学技术的学习兴趣呢?

先温故知新,溯源一下“数据库”主题的图灵奖?

为啥要溯源图灵奖呢?

计算机先驱,图灵奖得主吉姆.格雷(Jim Gray,1944~2007)提出的第四范式(The fourth Paradigm)中预测过计算机专业的未来,那就是基于数据的科学发现,其基本思想是——把数据看成现实世界信息的记录,而这些记录自然蕴含了现实世界的运行规律。所以,以数据(特别是科学数据)为媒介,可以揭示现实物理世界现象所蕴含的科学规律。

吉姆. 格雷(Jim Gray)又称詹姆斯.格雷(James Gray),他在1998年获得了图灵奖。

这是图灵奖诞生后,继1973年图灵奖得主数据库技术先驱查尔斯.巴赫曼(Charles W. Bachman),1981年图灵奖得主关系数据库之父埃德加.科德(Edgar F.Codd)之后,第三位因在数据库技术发展领域做出重大贡献而获此殊荣的计算机学家。

先来溯源最早的数据库先驱:1973年图灵奖得主查尔斯.巴赫曼(Charles W.Bachman),他被誉为“网状数据库之父”。

要了解这位名副其实的数据库先驱,需要先简要回顾一下计算机数据处理发展的历史

为啥呢?

因为...

20世纪40年代初,电子计算机刚刚诞生时,只能用于科学与工程计算,不能用于数据处理。

为什么不能处理数据呢?

因为那时的电子计算机只能处理数字,不能处理字母和符号。此外,当时也还没有可以用来支撑数据处理的大容量存储器。

20世纪50年代,字符发生器(Character Generator)被发明出来,让计算机有了能现实、存储和处理字母和各种符号的能力。再后来,高速磁带机也被用于计算机存储器。

这意味着,将计算机应用到数据处理领域的春天来了?

并没有,直到......

1956年,IBM公司和Remington Rand公司先后推出了磁盘存储器解决方案。

这意味着,磁盘系统开始可以商用,能更好满足数据处理过程中的大容量快速存储需求?

虽然有了硬件发明的支撑,但是那时的数据处理软件还处于文件管理(file management)形式,数据处理时,需要数据文件和应用程序一一对应,所以很容易造成数据冗余、数据不一致和数据依赖等问题

什么是数据依赖?

数据依赖(data dependence)是指编写程序依赖于具体数据,想要处理数据,必须在程序中先对数据进行详细说明。不仅如此,还要用语句把文件和具体设备联系起来,与此同时,还要通过语句严格规定文件的组织方式和存取方式。最后还要通过一系列命令语句导航,系统才能完成预期的数据处理任务。也就是说,应用程序与数据管理(数据的存储、存取方式等)方式密切相关,没有相对独立,所以这个时期程序的编制、维护都很繁琐。

数据依赖给程序员带来了极大的麻烦。

那怎么办呢?

把数据单独管理起来?

是的,后来出现了文件管理系统(File Management System,FMS)。

文件管理系统作为程序和数据文件之间的接口,每个应用程序可以通过FMS和若干个数据文件打交道,这样就可以一定程度缓解数据依赖,增加数据处理的灵活性。

尽管如此,这种分散的、相互独立的数据文件依然存在数据冗余、数据不一致的问题,数据处理效率依然不高。

这时候,IBM公司与Rockwell公司合作,推出了一种全新而高效的管理技术——数据库技术。比如:当时在IBM360系列机上研制成功的基于层次模型的数据库管理系统——信息管理系统(Informaiton Management System,IMS)。

是的,你没有看错,这就是数据库技术的开端,在IBM360系统上研制的基于层次模型的数据库管理系统,又称为信息管理系统。这也是信息管理与信息系统专业人士研制成功的第一款可以商用量产的数据库管理系统。

与此同时,巴赫曼在通用电气公司主持设计并实现了网状数据库管理系统(Integrated Data System,IDS)。

那为什么IBM基于层次模型的信息管理系统没有获奖,而通用电气公司的巴赫曼研制的网状数据库管理系统获奖了呢?

嘿嘿,这里要提到一个人,那就是IBM的第一个系统设计师纳撒尼尔.罗切斯特,他获得了1984年的计算机先驱奖,IEEE-CS给出的获奖理由是,对IBM702电子数据处理机体系结构做出了创造性贡献。当时他和哈达德研制了IBM701,哈达德负责部件开发,罗切斯特负责工程设计(Engineering planning),此外,还有吉姆.阿姆达尔,他是IBM最先获得计算机先驱奖的人,作为IBM系列机的功臣,他被誉为“插接兼容式”计算机的创始人,并因此获得了1980年的计算机先驱奖。关于IBM系列的数据处理技术,后续专门进行溯源。

因为1964年,巴赫曼不仅主持设计与开发了最早的网状数据库管理系统IDS,让IDS成为市面上最受欢迎的数据库产品之一,他还积极推动与促成了数据库标准的制定,那就是美国数据系统语言委员会CODASYL下属的数据库任务组DBTG提出的网状数据库模型以及数据定义语言(DDL)和数据操纵语言(DML)的规范说明。并于1971年推出了第一个正式报告——DBTG报告,成为数据库历史上具有里程碑意义的文献。DBTG首次确定了数据库的三层体系结构,明确了数据库管理员DBA(DataBase Administratior)的概念,规定了DBA的作用与地位。

此外,巴赫曼还主持制定了著名的“开放系统互连”标准,即OSI(Open System Interconnection),OSI对计算机、终端设备、人员、进程或网络之间的数据交换提供了标准规程,实现各系统之间彼此互相开放。此外,他还是位于美国波士顿的计算机博物馆的创始人之一。



https://blog.sciencenet.cn/blog-520919-1541512.html

上一篇:喜阅君:计算机的起源可追溯到算盘?




    
收藏 IP: 117.139.191.*| 热度|

1 宁利中

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-6-30 03:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部