学到老Never too old to learn分享 http://blog.sciencenet.cn/u/tangchangjie

博文

需要多少论文才能得到图灵奖 –数据库界的四位图灵奖得主(1) 精选

已有 58648 次阅读 2015-4-13 18:30 |个人分类:人物故事|系统分类:人物纪事|关键词:图灵奖,数据库,巴赫曼| 数据库, 图灵奖, 巴赫曼

原名:数据库之梦 – 数据库界的四位图灵奖得主之一 (唐常杰

 

  今年3月25日,美国计算机协会(ACM)宣布,来自麻省理工学院的教授Michael Stonebraker获得2014年度“图灵奖”(第N年宣布N-1年得主),投石冲破水中天,一些与数据处理相关的微信群中喷发一股图灵奖议论热,有位教授在微信中赞叹“说数据库界一共四位传奇大师,太伟大了“,接着有几位教授提议在今年的教学PPT中,加上相关科普,激励年轻的数据库人。朋友们鼓励我来一篇非传记的、活泼一点的人物故事。  

  没有诺贝尔, 我们有图灵.  诺贝尔没有机会登上时间机器向前穿越,未能预见到计算机科学对人类之重,于是计算机界没有诺奖。

  没有诺奖,计算机科学也要发展,计算机人也要过日子,计算机界的Top贡献也需要Top奖,在需要一个能与诺贝尔相比较的人物作图腾的时候,天公抖擞,不拘一格,降下了图灵。

  图灵多才多艺、也多故事、多传说:小时的神童,青年时的马拉松健将(有过名次);善于长跑的图灵,在科学上一趟冲刺,跑在了计算机之前,全世界还没人见过计算机的时候 ,他构筑了“理想计算机”,阐明了通用计算机的可行性,其前瞻性和深刻性,至今影响着计算复杂性理论;有人赞他是计算机科学之父、人工智能之父….,

  在二战胜利70周年之时,人们更怀念和他的团队在破译情报方面贡献。

  看多了穿越小说的图灵迷问:他为什么有那么多超乎常人的见识?莫非他是从先进的平行宇宙中穿越而来?

  数据库界的图灵奖得主.  由图灵冠名的概念有 “图灵机”和“图灵测试”,最有名的是“图灵奖”。

  从1966年到2014年,49届,共62名得主,按国籍分,美国学者最多,欧洲学者偶见之,华人学者目仅有2000年图灵奖得主姚期智(现在清华大学)。

  62名得主分布在几十个小领域,排在前六的领域有:编译原理、程序设计语言,计算复杂性理论,人工智能,密码学,以及数据库(4名)。在某种意义上,可大致认为,前三个领域与计算机科学本身更密切一些,后三个领域与军民应用更密切一些。

  一看就知是聪明人. 下图是数据库界的四位得主。本来,以貌取人是根据不足的,但这四位得主,都有一股学者范(“范”是一种感觉,很难严格定义),几位学者,虽近髦耋,眉宇中有一股英气,目光坚定自信,相信在年轻时,叫人一看,就知是聪明人。

  


  按获奖时间排序 ,本文先介绍最早的一位。续篇再介绍后面的三位,争取在篇末都议论一下得主们给我们的启迪。

  实践出真知—网状数据库,时势造英雄-巴赫曼.

   今年90岁的查理士·巴赫曼 (Charles William Bachman),在49岁时候(1973年)获得了的图灵奖,是数据库界的第一枚图灵奖。


  生逢其时,有文无库. 上世纪60年代,计算机系统还是有文(文件系统)无库(数据库)。数据处理比较艰难,那是一个正需要英雄,就出了英雄的时代;当世界正呼唤数据处理新技术时,年富力强(30多岁)的巴赫曼来了。

  他从基层干起,曾在穿孔卡片机上开发程序,在第一线获得了丰富经验,后到通用电气公司,作程序设计部门经理,体验过文件系统处理数据的蹉跎、繁琐和低效,催生了他的数据库梦。


  曾经是爽的数据库. 他主持设计与开发了最早的网状数据库管理系统IDS (  Integrated Data  Store),在不惑之年(1964年)正式推出IDS。以今天的目光看,IDS是建立在虚拟内存系统上(实际在磁盘上),如果当时有如今的闪存盘SSD,不用改代码,就会爽的发飙 ;不过那时的人要求低,认为IDS已经很爽了。

  所以,他被称为网状数据库之父。

   网状数据库型与值,基本思想    网状数据库概念不太容易科普,当年。笔者讲网状数据库课程时,在黑板上画若干记录方块,若干指针链接,两三个学时才能讲完;   

  记忆大师们说,要想记忆好,检索快,就要设法把知识点连成网状,建立联想,这就是网状数据库的思想。想法简单,但实现和使用起来,却不简单。  

  上图左边是数据的模型, 右边是库值 ,箭头描述了 系主和系成员联系(网状)。用户需理解和记住这些箭头连线,这就是网状数据库很快被后继模型取代的原因。

   上图的模型中, 订单有两个父节点, 如果一个网状数据库中,所有节点至多只有一个父节点,就称为层次数据库,是网状数据库的特例。  

    

  格式化 VS 非格式化 , 磁盘 VS 磁带.  数据库带来的观念是革命性的。此前,计算机以文件为最小处理单位,处理非结构化的、粒度较大的数据;而数据库中是格式化的、粒度较小的数据(记录或字段)。

  有格式和无格式数据的在查、插、删、改的速度方面有天渊之别,作为科普,拟用两种比喻:

  (1)在网状数据库的特例---层次数据库中,数据是按层次组织的,就像有了师-旅-团-营-连-排的建制军队,而原来以文件形式保存的数据就像奴隶社会中揭竿而起的农奴义军,层次数据库中,数据有组织,检索有索引,层次序列码每下进一层,就把搜索空间缩小几倍几十倍,比文件中线性搜索快多了

  (2)磁盘与磁带的比喻:非格式化数据中,查询某一数据项,有如在磁带上搜寻某首歌曲,从头搜索到尾,平均每次搜索磁带长度的一半;而在磁盘或光盘上,从目录(索引)找到那首歌曲的开始扇区,磁头在三维空间中跨界运动,磁带是线性带子固定的磁头,磁盘是极坐标的平面,三维的臂,直达目标,快多了。

   对插、删、改操作,由于数据库缩小了处理粒度,提高处理效率,更是令文件系统望尘莫及。   

  报告也能占高地  IDS的成功,使巴赫曼有资格成为DBTG的核心人物之一,DBTG即数据库任务组,隶属于CODASYL(美国数据系统语言委员)。

  为了数据库之梦,巴赫曼试图占领美国国家标准这一学术和技术高地,积极推动了DBTG报告。

  由于各种原因,这个报告,最后没有成为美国国家标准,DBTG任务组坚忍不拔,相继推出一系列版本,如1971,1973、1978、1981年和1984年的修改版本。

   尽管DBTG不是国家标准,也不是具体的数据库产品,而只是一个方案,但它提出的观念深入人心,所提出的三级模式,以及把数据库语言分成数据定义语言DDL和数据操纵语言DML的思路, 影响了几代数据库人和数据库产品,如IDMS、PRIME DBMS、DMSl70、DMSⅡ和DMS 1100,甚至,如今的关系数据库中,也能隐约见到它的影子。

    这些成果确立了数据库的观念,在IT发展历程中,人们常常见到,被新技术“宠坏“了的用户,再也不愿回到旧技术的怀抱,在这个意义上,有人笼统地说,巴赫曼是(没有定语)数据库之父。

    一点思考:需要多少论文才能得到图灵奖?   下面有个清单,列出了巴赫曼的重要论文16篇,因为他是1973年的的图灵奖,只列出了1962-1983中的一部分,平均每年不到1篇。

  也许多年前 ,计算机界对论文级别,杂志级别的观念与现在不同;单从从数量上看,好像我们现在的杰青、优青、千人、百人快赶上或已经超过了巴赫曼,但是,能做出像IDS这样的货真价实、人用人爱的系统吗?能提出像《DBTG报告》这样改变观念、深入人心,能在数据库发展的几十年历程中留下影子的的“报告“吗?

    也许,这种观念的不同,是图灵奖得主心中的那份灵犀。

   (下篇:数据库界四位图灵奖得主之二)


 参考文献 巴赫曼1962-1983的部分论文.

  1. "Precedence Diagrams: The Key to Production Planning, Scheduling and Control." In: ProCo Features. Supplement No 24, August 24. 1962..

  2. "Integrated Data Store." in: DPMA Quarterly, January 1965.

  3. "Software for Random Access Processing." in: Datamation April 1965.

  4. "Data Structure Diagrams." in: DataBase: A Quarterly Newsletter of SIGBDP. vol. 1, no. 2, Summer 1969.

  5. "Architecture Definition Technique: Its Objectives, Theory, Process, Facilities, and Practice." coauthored with J. Bouvard. in: Data Description, Access and Control: Proceedings of the 1972 ACM-SIGFIDET Workshop, November 29-December 1, 1972.

  6. "The Evolution of Storage Structures." In: Communications of the ACM vol. 15, no. 7, July 1972.

  7. "Set Concept for Data Structure." In: Encyclopedia of Computer Science, 1972-1973.

  8. "The Programmer as Navigator." In: Communications of the ACM vol. 16, no. 11, November 1973.

  9. 1974."Implementation Techniques for Data Structure Sets." In: Data Base Management Systems

  10. "Why Restrict the Modeling Capability of Codasyl Data Structure Sets?" In: National Computer Conference vol. 46, 1977.

  11. "Commentary on the CODASYL Systems Committee's Interim Report on Distributed Database Technology." National Computer Conference vol. 47, 1978.

  12. "DDP Will Be Infinitely Affected, So Managers Beware!" in: DM, March 1978.

  13. "The Impact of Structured Data Throughout Computer-Based Information Systems." In: Information Processing 80, 1980.

  14. "The Role Data Model Approach to Data Structures." In; International Conference on Data Bases, March 24, 1980.

  15. "Toward a More Complete Reference Model of Computer-Based Information Systems." Co-authored with Ronald G. Ross. In: Computers and Standards 1, 1982.

  16. "The Structuring Capabilities of the Molecular Data Model." In; Entity-Relationship Approach to Software Engineering. C. G. Davis, S. Jajodia, and R. T. Yeh. eds. June 1983.

相关博文 

 需要多少论文才能得到图灵奖 – 数据库界的四位图灵奖得主(1)

 解决科学问题才是硬道理-—数据库界的的四位图灵奖得主(2)

 冲破数据共享封锁线的领头人--数据库界的四位图灵奖得主(3

 冲浪在数据潮头的实干家----数据库界的四位图灵奖得主(4) 


其他相关博文

  人物类我所认识的Adlman 系列 共6篇 他凭什么得了图灵奖,侧应钱学森之问,计算机病毒的教父,DNA计算

  科普类趣味数据挖掘系列 被打和北大,烤鸭,数据血统论,博客均击量,干预规则,分房与分类,宴会上的聚类, 灯谜、外星殖民、K-平均聚类与蛋鸡悖论, 愚公移山和进化计算,基因表达式编程GEP,数据挖掘与哲学; 

  

       其它系列博文的入口    唐常杰博客主页    科学博客主页



http://blog.sciencenet.cn/blog-287179-882071.html

上一篇:鸡叫与天亮:大数据中的关联与因果—大数据杂谈之二
下一篇:解决科学问题才是硬道理-—数据库界的四位图灵奖得主(2)

58 聂荣智 左嘉陵 段石松 马萧萧 曹元兰 元云芬 康建 王达伟 董文娜 袁君云 武夷山 许培扬 张卫 姬扬 刘洋 李伟钢 张能立 曾宇怀 戴德昌 赵美娣 杨正瓴 璩存勇 陈小斌 韦玉程 李志俊 曹须 刘建彬 李泳 王天燕 戴住波 彭真明 高建国 程少堂 张文增 曹贵瑜 俞立 黄永义 罗教明 张江敏 张昕尧 翟自洋 姚伟 钱玉忠 秦承志 曹聪 汤奔阳 赵凤光 武为治 祝贤明 尧顺雨 蒋迅 于彦伟 yzqts changtg shenlu zjzhaokeqin qzw BJX2015

该博文允许注册用户评论 请点击登录 评论 (86 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2020-1-26 02:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部