学到老Never too old to learn分享 http://blog.sciencenet.cn/u/tangchangjie

博文

大数据与小世界的聚会三道茶 精选

已有 15884 次阅读 2012-10-16 19:58 |个人分类:教学科研|系统分类:科研笔记| 大数据, 闭幕式, 小世界, NDBC, 数据库大会

大数据与小世界的聚会三道茶 - NDBC2012闭幕式发言(唐常杰)

 (说明,NDBC2012于10月12-14日在合肥召开,受数据库专委会指派,在闭幕仪式上做总结发言,大会内容既关注了大数据技术,又关注小世界理论,承办会议的东道主索取发言稿,拟发在会议网页,现将发言提纲整理,略去一些细节,去掉口语元素,改成这篇博文。)
 
  很高兴能在这里和大家交流心得, 希望明年有年轻教授来作总结发言,年轻人一定会与计算机科学日新月异的发展步伐更合拍,更精彩。
 
  
合肥与数据库之缘,合肥这一地名,来源于在此点曾经汇合了两条淝河。如果乘坐飞船,穿越时空,回到唐代,俯瞰江淮大地,可看到当时的南淝河(流向巢湖)和东淝河(流入淮河)在这里归并一源,上溯到鸡鸣山(历经千年沧桑,水系已变,现在看不到两淝归一的景观了)。
   两淝归并后,河流以及其中的生命群体,既“团结同行”,又有“交流”,立刻就联想起我们数据库专委会的二十字方针, “团结同行,交流学术,发展学科 培养人才 服务国家”,这是由何新贵院士提出的。“合肥”在千年以前就隐约暗示了我们的专委会方针前几个字;而且,NDBC的第一届学术会议,也是35年前,由中科大罗晓沛教授等前辈承办的;合肥真是与数据库有缘,与NDBC有缘。
   合肥是个园林城市,绿色城市,是读书治学、以文会友,且与数据库有缘的地方,感谢承办会议的东道主中国科技大!

  
发生在合肥的竞争 对合肥立城两千多年的历史进行挖掘,提取特征和分类,看到有三类竞争:
 (
1)无战则商争,和平时,这里是商家必争之地,在两条淝河交汇的年代,方便的水运,使这里成为徽商通南达北的重要转运站。
 
(2)有战则兵争,战争时期是兵家必争之地。三国魏吴之争,记在正史上,活在演义中,“曹操平定汉中地,张辽威震逍遥津”脍炙人口;南北朝时期有淝水之战,战场虽不在合肥,但发生在从这里流出去的东淝河下游,在合肥北面100+公里的八公山一带,有许多人们耳熟能详的故事和成语:八公山上草木皆兵,东山再起,投鞭断流,风声鹤唳等,等等;抗日战争时有合肥会战;解放战争时,指挥百万雄师渡江作战的总前委就在合肥的瑶岗,下图中,用塑像表现的五位开国元勋的伟岸身影来自当年在瑶岗的那张著名照片。


(3)人和则文争。公元2012年,中国数据库界在合肥以文会友,争出了NDBC首次评选的最佳论文。争出了萨师煊优秀论文奖和优秀系统演示(Demo)奖。在此,用热烈的掌声,祝贺几位论文获得者。
  历史上这里也有很多名人,包公、杨振宁,还有李鸿章和政治生涯中六上六下的段祺瑞,后两位评价虽较复杂,但绝对是名人。
  能和包公,杨振宁等名人一起在合肥脱颖而出,殊为难得,获奖者一定会在自己的履历上,写上在合肥得到的殊荣;今天把NDBC写进了自己的历史, 明天,不远的将来,NDBC会把你们的业绩写进NDBC的历史。看到获奖者的老师们笑得很开心,学生得到最佳论文奖。老师当然快乐着学生的快乐。

 最佳论文的评选程序 今年3月,在北京例会上,专委会主任周立柱教授提出了和国际会议进一步接轨,设评最佳论文。专委会出台了最佳论文评选试行办法:双向匿名+三级筛评+现场考察+必要的回避,其中三级筛评是:
   (a)程序委员会,通讯评审出 6-8名;
  (b)专委会和程序委员会组成的一个推荐组,推荐出4名;
  (c)由海外知名数据库专家组成的独立评审组,评选出一篇最佳论文奖,一篇提名奖。
  
  合肥有铁面无私的包公,想到包公,我们评审组就肃然起敬,想到包公旁的威严的王朝、马汉、张龙、赵虎,还有公堂上那三把维护公正的铡刀,就不敢不敬畏规则。
  有一首描写合肥风景的诗:“孝肃祠边古树森,小桥一曲倚城阴。清溪流出荷花水,犹是龙图不染心”。在参加评审的过程中,评委们的心态就是:“清溪流出荷花水,犹是龙图不染心”。

 增加了最佳论文评选,使得NDBC的结构与外在形式与国际会议几乎全面接轨,当然,还有两个内在的高度没有达到,一是论文质量的高度,这是我们希望并努力达到的,二是会议注册费用的高度,这是我们并不急于希望达到的。


   值得回味的三道茶 到过大理的朋友,品尝过三道茶,在苍山上长,用洱海水泡,茶到三巡,才品出回味甜。如果把第一天的研究生学术辅导和大数据Panel比喻为头道茶,一天半的大会和小会则是二道茶,颁奖的闭幕式就是第三道茶。现在正当其时,让我们一起,看着议程,凭着记忆,复习那些深刻的学术内容,回味NDBC12中的那些精彩片段。
  
  
研究生术辅导--授渔。新南威大学的林学民教授和人民大学的陆嘉恒教授给研究生们讲了写论文、发论文的功夫和修养,讲学术规范,也讲写作技巧;清华的李国良博士向研究生们介绍愉快科研、游戏科研的心态和方法;香港中文大学的于旭教授,通过“挖掘和查询处理的多样性”实例,把科研方法讲得的深入浅出。研究生们反馈,在学术辅导中得鱼又得渔,受益匪浅。
  
  
研讨会和特邀报告:大、 快、 高、 新,

 Panel和大会报告的靓点大致可归纳为:大大的大数据,快快的闪存库,高高的数据云,新新的小世界。
  大大的大数据 :会议浓浓地关注了大数据,关注大数据时代及其处理技术; 大会前一天晚上的Panel以大数据为中心议题。来了多位知名教授:复旦王晓阳(Panel主持)、哈工大李建中、人大孟小峰、武大刘梦赤,...,.在这个研究圈子里可以说,群贤毕至,少长咸集,不但座无虚席,还加了许多站票(准备会场时,低估了受众的热情,座位少而听众多)。
  李建中教授强调了大数据中不可忽视的部分:海量的科学数据和商务数据的特殊矛盾和特殊需求,还对大数据处理的算法,包括线性算法和亚线性算法,做了深刻的分析和展望,......
  在大会特邀报告中,新泽西州立大学的熊辉教授,对移动环境的大数据处理,特别对新的计算模型,做了深刻的解析,展示了自己的创见,......

 华师大周傲英教授在特邀报告中对大数据的解析别开生面,他检阅了数据库技术成果,批评了传统技术发展过程中偶尔的自我陶醉,反思了经典数据库技术的得失,阐明了数据库人在大数据时代的优势和当仁不让的责任, .....
  不太可能在这里复述报告的全部内容,这些报告描述、解释或评论了大数据的特征,俗而言之,即—大、二变、三快(要求处理快),四随便(无约束或较少约束,因而并非条条数据是精品);

 可能还要补充一些特征,因为上述四条主要来源于Web网页数据,作为大数据的当然成员,科学数据和商务数据不仅大,而且从采集开始,就尽可能地有了格式,有了约束,因而有特殊难点,需要特殊的技术。


  快快的闪存库:孟小峰教授报告了闪存数据库系统技术,报告了在国家自然科学基金重点项目中的累累成果,通过对数据库传统技术的扩展,老技术开出了崭新的花朵,为提高大数据处理速度提供了基础支撑。

 高高的数据云:王晓阳教授在关于大数据管理抽象层的特邀报告中,提出了“数据云”这一新概念和新的理论体系,一系列高观点,把我们带上高高的蓝天白云。


 新新的小世界:北大李晓明教授,在一片“大”声之中,漂亮转身,把听众带进了“小”世界,好像黄河大合唱冲过了激流险难,进入一段宽阔平缓的河段面,让大家都舒了一口气。他妙口演绎,轻松解释了小世界理论的研究过程和精彩结论,最后还上升到科研方法论:观察—假说—建模—实践检验,好像是一场生动的自然辩证法和科学研究方法课。

   令人耳目一新的新技术报告 来自微软亚洲研究院的谢幸研究员,报告了移动社交和与定位预测研究成果,在报告末尾,讲了一个真实的故事,用“移动社交+定位+数据挖掘”,找回了遗失的钱包和手机,听完故事后,深信知识就是力量、数据挖掘技术是力量、定位预测技术也是力量。
   华盛顿大学的陈一昕教授 报告了在医疗大数据挖掘的实时诊断报警的成果,听完之后觉得,知识发现可以救人一命,数据挖掘可以普度众生,数据挖掘也胜造七级浮图。
   来自新加坡的杨颖博士,报告了差分隐私保护技术,概念新,方法新,听后感是:隐私居然也能用差分技术,做到了用数据而不泄隐私,又要马儿跑,又要马儿少吃草,
  此外, NDBC2012 有 15 个分会和一个大会演示,分会场里洋溢着数据库人的认真和执着;4个工业界报告,充满了大数据时代的特色,既实在,又有创新。

 两个第一 NDBC是第二次由中国科大承办,请来了多位国内外的知名教授,大会报告质量高;其中还有两个第一:第一次评选最佳论文,第一次有西藏大学协助承办。

 让把我们把热烈的掌声 ,送给西藏大学,他们今天走出西藏来协助承办,下一步,在不远的将来,将把NDBC办进西藏,办到雪域高原,办一个世界上最高(至少在海拔方面)的数据库学术会议。

 焉知来者不如今也。大会期间,数据库专委会增选了13位委员,聆听他们的一分钟陈述,感觉到小小的震撼:后生可畏,焉知来者不如今也?

 他们之中,有全国百篇优秀博士论文奖获得者,有的人年纪轻轻,就在几大顶级公议、顶级杂志发表了几十篇论文,得到顶级会议最佳论文奖,他们给我们专委会带来了活力和希望,也给年龄稍大一点的委员带来了压力。
  差额选举,有人当选,也有人落选。计算机科学家是最能承受失败的科学家。想当年,我们的技术才开张,第一次学编C语言程序时,写进10行程序,编译出来的警告和错误可能就有50条,从那个时候起,我们就习惯了承受失败,习惯了从失败中站起来,那以后,在晋升职称、申请基金和论文投稿中,又不知受过多少挫折。

 就像一首歌中唱的,春去春会来,花谢花会再开,只要你愿意,让梦划向你心海。
    
   
志愿者和东道主, 曾经用拆字(或汉字结构语义分析)来说志愿者, 志=士+心,愿=原+心;两个字下面都有心,自愿要用心,用士之心、用博士、硕士和学士的心。
  这里想说广义的志愿者,NDBC2012的志愿者中,最忙、最累、做事最多的是中科大的岳丽华教授,陈恩红教授和金培权教授;为什么?首先他们也是“士”,他们为会议尽全心、出大力;其次,申办NDBC和申办奥运会一样,纯属志愿行为,不但自愿,还要软硬实力,去挣,去争。
从申办到现在开完会,共三年时间,三年岁月,终于凝聚成这一刻,等客人走完,他们才能轻松。
   这些天来,来自中科大和志愿者们,付出了辛勤和努力,为会议提供很好的服务。

 让我们用热烈的掌声, 感谢志愿者们,感谢所有的承办单位,支持单位和赞助单位。

 向他们致以最衷心的感谢!


相关博文(不说套话更精彩 系列
 

 一个任遐想驰骋的Logo --- 它包容了执着、团结与潇洒  NDBC10

为什么这些专家比较长寿 (NDBC2010闭幕式发言

科技接力与青春寄语  

牛年,NDBC在南昌刷新成绩  (NDBC2009闭幕式发言

群星正灿烂,科学有希望 第十五届中创软件基金人才奖励颁奖仪式  

三十年回回头,看看走过的路  

东西方文化在这里碰撞 (NDBC2011闭幕式发言      

大数据与小世界的聚会三道茶 - NDBC2012闭幕式发言

如今老去才华尽,犹盼春来草上笺(NDBC2015闭幕式发言



    其它系列博文的入口     唐常杰博客主页   科学博客主页



https://blog.sciencenet.cn/blog-287179-623263.html

上一篇:圈内焦点座谈:假日议选平板和手机
下一篇:实事实地有实照,从此点名不烦恼
收藏 IP: 118.113.46.*| 热度|

43 毛宁 董文娜 罗汉江 王娜娜 袁君云 元云芬 石东兴 王达伟 陆俊茜 刘艳红 李土荣 武夷山 刘洋 张玉秀 李本先 陈明亮 黄富强 于涛 杨正瓴 彭真明 李伟钢 王德华 王善勇 杨月琴 马磊 钟炳 鲍海飞 李泳 王号 李泽波 黄华军 庄世宇 曹广福 赵凤光 虞左俊 乔中东 Editage意得辑 李学宽 吕腾 李兵 强涛 zhangbenhua82 xqhuang

该博文允许注册用户评论 请点击登录 评论 (37 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 18:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部