“数据开放共享”理念和相关政策主张是伴随着“大数据”“数据科学”和“云计算”等互联网时代的新事物而产生的。就像土地、石油和资本一样,数据已经成为经济运行中的重要资源,而安全适当的数据开放共享是实现数据驱动创新、发挥大数据潜力的重要前提。
随着大数据时代的来临,数据开放已经成为一股世界性潮流。目前,很多国家和地区,都在互联网上开放了本国的公共数据,以供全世界人民使用。2013年6月18日,八国集团首脑在北爱尔兰峰会上签署《开放数据宪章》,各国表示要进一步向公众开放可机读的政府数据。据美国政府数据网站data.gov统计,截至2014年1月12日,开放数据运动已覆盖全球44个国家和地区。另据英国开放知识基金会2013年10月发布的开放政府数据普查结果,在对70个国家和地区政府的数据开放情况(包括预算、支出、选举、污染共10个领域)的普查中,英国和美国分别排名第一和第二,丹麦、挪威和新西兰则尾随其后。
在数据开放浪潮中,科研成果的开放获取运动成绩斐然,异常突出。2013年8月欧盟委员会发布的一项关于开放获取的研究表明,世界主要国家50%的研究成果实现了免费开放获取,研究成果的公开获取率创历史新高。在2011年发表的研究论文中,开放获取论文数量过半,已经成为主流。其中,在生物医学、生物技术、数学、统计等基础科技领域,开放获取率更高。此外,2004—2011年间发表的同行审议论文,有40%能够以在线阅读的方式免费获得。根据全球著名开放获取资源库OpenDOAR统计,全球开放知识库的数量已经从2004年的128个增至2013年的2408个。德、英、美、澳、日、加、欧盟等多国及组织先后都实施了开放存储和开放出版政策,开放出版期刊迅速增长,从2003年的300多种增长到2013年的9900多种。世界出版领域的大腕美国科学公共图书馆PLOS是开放获取的先行者,英国《自然》出版集团2010年就推出了自己的开放获取期刊《自然—通讯》。2014年2月12日,《科学》杂志的出版方美国科学促进会也宣布,将于2015年正式出版旗下首个开放获取在线期刊《科学进展》。不到一周之后,2月17日,世界上历史最悠久的科学学会和出版者英国皇家学会也宣布,将出版自己的首个开放获取在线期刊《皇家学会开放科学》。这两份新期刊的启航将给现在迅速发展的热闹的开放获取出版市场增添新的力量。现在几乎所有重要的出版商和学会都在积极探索和发展自己开放获取模式。
主要研究机构积极支持数据开放共享
2012年6月,英国皇家学会出版的《科学作为一项开放的事业:开放的科学呼吁开放的数据》研究报告认为:数据开放获取能够降低研究成本,加快研究进程;能够带来相当的经济利益,特别是宏观经济效益;能够产生可观的公共和社会效益,能够使得科学研究的视野更宽,社会更容易接受,科学成果更容易推广。而信息技术的进步也为数据的开放获取提供了更大的可能性。同时,出于保护商业利益、个人隐私、国家安全等原因,数据开放获取也是有边界、有限制的。
2013年4月,经合组织发布《以数据驱动的创新开发新增长源泉》研究报告,报告分析了利用数据和数据分析建立竞争优势、形成知识资本的潜在作用。报告指出,跨部门的数据链接与利用有利于推动创新,进而促进社会发展和经济增长,但由于缺乏适当的经济刺激措施,许多数据源没有实现数据共享。因此,需要讨论和制定新的数据共享框架以适应新环境。
继2011年发布《大数据:创新、竞争和生产力的下一个前沿》报告后,2013年10月,美国知名智库麦肯锡全球研究院再次发布分析报告指出:开放数据如果在教育、运输等领域加以应用,每年可释放约3万亿美元的经济潜力;要使开放数据发挥最大效益,政府、企业、个人和非营利机构等利益相关方都要发挥作用。同年11月,美国信息技术与创新基金会也发布了一份名为《支持数据驱动型创新的技术与政策》的研究报告,报告建议世界各国政府采取积极措施,鼓励公共和私营部门开展数据驱动型创新。政府应该发挥的一项重要作用是,不仅要收集和提供数据,还要制定推动数据共享的法律框架,并提高公众对数据共享的重大意义的认识。政府要首先将自身的数据及时提供给公众,同时努力让个人能够获知其个人的数据,如鼓励公用事业公司向消费者公布其家庭能源使用情况的数据。政府还应确保制定的法律和管理框架能够促进不同产业的数据共享和利用。
对数据开放共享的具体内容达成共识
主要机构关于数据开放获取内容的研究和主张不尽相同,综合起来,主要集中在三个方面。
大力促进科研数据的开放共享,提高科研效率。科研数据开放是数据开放政策的一项基本内容,这里主要指由公共资金资助产生的科研数据。早在2004年,经合组织科技政策委员会就发布了《开放获取公共资助研究数据的宣言》,提倡要建立公共资助的研究数据的开放获取机制,并于2007年发表《开放获取公共资助科学数据的原则和指南》。随后,美国、英国、欧盟等国及组织的一些重要科学资助机构也提出了数据开放政策指南,要求受资助的项目提交科研数据的管理与共享计划。2013年,科研数据的开放获取政策取得了尤为显著的进展。2013年2月,美国白宫科技政策办公室要求,由联邦资金全部资助或部分资助所产生的科研数据应该存储并为公众提供免费的最大化访问。英国研究理事会则要求从2013年4月1日开始,受其资助的科研成果要发布在符合“开放原则”的期刊或其他载体上,并通过网站等方式即时免费对读者开放。欧盟也在新一轮研究与创新计划“地平线2020”中明确规定,所有公开发表的由欧盟财政资金支持的研究成果,都必须实现开放获取。澳大利亚研究理事会也要求受其资助的研究项目产出的所有出版物,都必须在出版日期后的12个月内存储到开放获取机构知识库中。
各国政府应该大力推动政府数据的开放共享。在这场正在迅速发展的开放数据运动中,各国政府成为重要的对象。政府拥有大量与公众生产生活息息相关的数据,是社会上最大的数据保有者。开放政府数据的意义不仅在于可以推进民主、提高政府公信力、节约政府信息服务成本、提高政府工作效率,同时也能为社会和企业所用,从而创造更多社会和经济价值,提升国家竞争力。因此,各界普遍倡导政府要以身作则,首先将自身的数据以便利的形式及时提供给公众和用户,积极促进公共部门信息的开放获取和有效利用。各国政府也都已经认识到,开放其所拥有的数据和信息具有巨大的潜在效益,并纷纷行动起来。美国、英国、澳大利亚、加拿大、挪威、荷兰、印度等很多国家政府都创建了“一站式”数据开放平台“Data.gov”,以发布他们收集的数据;同时还不断出台要求政府各部门进一步加强数据开放的政策措施,除了收集数据,还包括如何将数据转化为切实可用的信息产品以及开发知识。
数据的开放并非无边界、无限制。对于那些涉及国家和公共安全、个人隐私、企业利益的数据的开放必须进行合理、有效的管制。毋庸置疑,数据开放获取必须在保障国家和公共安全、社会稳定的基础上进行,对此各方的意见是一致的,各国政府也都设有明确、严格的保密规定。个人和企业数据的开放,也必须充分尊重他们的利益和意愿,保护个人和企业的隐私权和所有权。因此,如何制定隐私和保密政策,既能最大程度地实现安全、可靠、高效的数据开放共享和利用,又不逾越合理的界限,是数据开放运动中各方研究的重点和难点。麦肯锡公司的研究报告认为,数据的开放需要采取一系列配套措施,才能实现其潜在价值,如必须制定保护知识产权、隐私和机密的全面政策,树立消费者和机构开放数据的信心等。2013年10月,英国商务、创新与技能部在其发布的《英国数据能力发展战略规划》中提出的举措之一,就是重视数据安全和隐私保护,完善法律和制度建设,合理进行数据共享和信息公开。