|||
本文为《图书与情报》专题特约稿件:王芳.关于数据要素市场化配置的十个问题.图书与情报,2020,(3).
关于数据要素市场化配置的十个问题
王芳
南开大学商学院信息资源管理系
南开大学网络社会治理研究中心
2020年3月30日,中共中央、国务院出台了《关于构建更加完善的要素市场化配置体制机制的意见》,将数据与土地、劳动力、资本、技术并列为五大生产要素,提出要加快培育数据要素市场,具体意见包括推进政府数据开放共享,提升社会数据资源价值,加强数据资源整合和安全保护等。《意见》同时提出要加速要素市场化改革,健全要素市场运行机制和组织保障。2003-2004年间本人曾随同博士导师北京大学赖茂生教授参加中共中央办公厅、国务院办公厅《关于加强信息资源开发利用工作的若干意见》(中办发[2004]34号)政策课题的研究。当时国内十几支顶尖的信息资源管理研究团队,从基础理论到应用分支,历经近一年的研究,最终于2004年出台了34号文件,提出了信息资源的公益性服务和市场化开发利用两种途径,为后续的政府信息公开与共享、政府数据开放、大数据开发利用等奠定了理论和政策基础。时隔16年,从信息资源的开发利用到数据要素的市场化配置,表明数字经济发展进入了新的阶段。加快数据要素的市场化改革需要关注哪些问题?本文拟对以下十个问题展开讨论。
一、 资源、要素与资源配置
在传统意义上,资源主要指自然资源,是指在一定的技术条件下,自然界中对人类有用的一切物质和非物质的要素,如土壤、水、草地、森林、野生动植物、矿产、阳光、空气,等等。一般认为,已被人类发现的有用的要素才成为资源,那些尚未被发现或发现了但无用的要素不是资源。由于经济条件和技术水平的限制,暂时难以利用的自然要素,被称之为潜在资源。从生命周期的角度,可将资源划分为可再生资源和不可再生资源[1]。前者指能够不断繁衍生长的生物资源和可以循环利用的自然资源,而后者则指储量有限、形成速度极其缓慢、一般需要几万年甚至上亿年时间才能形成的自然资源,如矿产资源,金属、石油、煤等。
生产要素是指社会在生产经营活动中所需要的各种资源。随着经济与技术的发展,生产要素的范畴也在不断变化。在农业社会,生产要素主要指土地和劳动力。随着资本主义的发展,资本作为生产要素的重要性不断增加。随后,科技的发展使得技术成为重要的生产要素。当信息时代到来时,信息与知识成为重要的生产要素[2]。
经济学意义上的资源与人类的有效开发利用密切相关。相对于人类的开发利用能力,资源具有稀缺性、分布不均匀、竞争性等特征[3]。对稀缺资源进行有效配置是经济学研究的主要内容。资源配置的方式主要有市场、计划两种形式。在现代社会,市场在稀缺资源的配置中发挥着基础性作用,通过价格机制对资源进行有效配置。由于生产外部性的存在可能导致市场失灵,政府计划成为有力的资源配置方式。在二者均出现低效失灵的领域,第三部门也即社会组织则发挥着弥补性作用。
二、 信息资源与数据要素的关系
随着社会分工的深化和印刷、通讯与信息技术的发展,信息的数量、可存储性与价值不断增加,日渐成为对人类有用的重要资源。通过信息的收集、整理、开发和利用,社会的劳动生产率、商品交换的范围和市场效率大大提高,交易成本不断下降[3]。在此基础上产生的信息产业,成为经济社会的主导产业。随着记载人类经济、社会、文化和科学研究活动的记录不断积累,信息逐渐成为一种类似于石油和矿产的资源。
真正意义上的信息资源的概念出现于计算机技术开始大规模应用于政府与企业管理的时期。1980年,美国联邦政府颁布了《文书削减法》(Paperwork Reduction Act),旨在运用信息技术加强信息收集和文书工作控制,提高政府效率。1985年12月,美国管理与预算局(OMB)发布了A-130号通告(Circular No.A-130),即《联邦政府信息资源管理通告》(The Management of Federal Information Resources),从政府的视角提出信息资源包括信息以及人力、设备、资金与信息技术等相关资源,将信息资源管理界定为管理信息资源以完成组织使命的过程[4]。从信息资源管理产生的历史时期来看,信息资源管理的价值主要体现在面对激增的政府与企业文书档案和记录,计算机自动化管理方式对纸质文件管理方式的替代,其增值的环节主要为资源的收集、组织与管理。
代表了数据资源的大数据概念的提出则与互联网、物联网、云计算技术的深化应用密不可分。大数据概念最早由思科、威睿、甲骨文、IBM等公司倡议,之后得到了各国政府的推进。2012年,联合国发表大数据政务白皮书《大数据促发展:挑战与机遇》;同年,美国奥巴马政府发布了《大数据研究和发展倡议》;2015年8月,我国发布了《促进大数据发展行动纲要》。与信息资源相比,数据资源更多地指向互联网活动所产生的记录,体现了海量、异构、多样、分布、快速生成、动态变化等特点。与此同时,在政府、企业组织内部,数字化的信息管理方式产生了大量结构化的数据,蕴含着重要的价值。随着大数据与人工智能技术的快速发展,数据资源价值开发的深度和广度大大增加。无论是互联网上的痕迹数据和社交媒体的用户生成内容,还是政府开放数据和企业组织内部的结构化的数据,都蕴含着巨大的可开发利用的潜力。可以说,数据资源价值增值的环节主要为资源内容的开发利用,并因此提升了自然资源、劳动力、资本、技术等资源开发利用和配置的效率。
三、 数据资源的产权界定
在法律上,产权(Property rights)的实质就是不同所有者不让除他自己以外的任何人占有、使用、控制某物的能力,是意志的专有领域,是使用或滥用的权利。《牛津法律大辞典》认为,产权“亦称财产所有权,是指存在于任何客体之中或之上的完全权利,它包括占有权、使用权、出借权、转让权、用尽权、消费权和其他与财产有关的权利。”[5]
就数据资源而言,产权主要包括所有权、拥有权、使用权、转让权、收益权、管理权、修改权、毁坏权、销毁权等,其中所有权是最根本的权利,它决定着其他权利的分配。这些权利并非是一个不可分隔的整体,而是常常处于分离或分享状态。比如在现代企业制度中,企业的所有权和经营权相分离;专利的所有权与使用权也可能通过许可使用而被分享。互联网企业收集的公民个人信息,其所有权人为公民个人,但是却在实事上由企业拥有和使用,从而造成所有权和使用权的分离。在权利分离的情况下,保障数据权利的前提是产权界定清晰、权利变动信息透明和产权制度完善。《欧盟数据保护条例》(GDPR)对于公民个人的信息权利进行了详细的分解和界定,如数据所有人的知情权、被遗忘权、修改权、收益索取权,等等,从而使得数据权利的保障更具操作性。对于数据的个体所有者而言,监控企业或其它组织对本人信息的使用情况需要具备时间、专业能力和技术装备等条件,而由此产生的收益却存在不确定性。这使得他们依靠个人力量维护数据权利的积极性和效果都不高。因此,需要出台相应的法律法规,加大对数据拥有者的规制力度,明确规定在数据收集、处理、使用、转让、销售、销毁活动中,由他们主动为数据所有权人的权利和收益提供保障,一旦违规应当接受严厉惩罚。
四、 数据资源的价值层次
价值是社会科学领域普遍使用的概念。从经济学意义上来讲,作为生产要素的数据资源的价值主要体现在以下三个层次:
(1)资源租金
作为生产要素的数据,其第一层价值是作为资源的价值。如同土地和矿山,相对于特定需求的有用数据具有稀缺性和效用,因此会产生纯租金,从而具有了资源价值。比如腾讯、阿里、百度等互联网企业所拥有的大数据,具有巨大的资源价值。即使是已经免费开放的政府数据以及卫生、教育等领域的公共数据,受数据呈现方式、用户数据搜索能力的影响,也可能在事实上呈现出稀缺性,从而具有资源价值。在某种意义上,人类历史就是一部追逐信息租的历史[3]。
(2)管理增值
对数据资源进行组织管理是使其增值的途径之一。对于数据与信息的采集、描述、编目、分类、存储等一系列管理活动使得数据与信息资源得到序化,具备可发现性、可检索性和可利用性,从而实现增值。这一过程类似于马歇尔所指的对土地进行改良(例如排水、设置篱笆等)获得的收益,被称作准地租,又称为经济租[3]。在大数据时代,对于分布、异构的数据资源而言,运用数据管理技术对其进行清洗、描述和组织整理,将会大大增加数据资源的价值。数据资源的信息租金不仅包括“对使用原始的和不可毁灭的信息力”的支付,而且还包括对数据与信息资源所做改良的支付。在对数据资源进行定价时,此两种租金可以做为基础性的理论指导。
(3)挖掘利用价值
对数据资源进行深度挖掘和分析,既可以开发出专题数据库、咨询报告、算法、应用APP、知识条目、新颖设计等各类新的信息与知识产品进行出售,从而创造新的价值,也可以将数据分析结果应用于管理决策、科学研究、公共管理、精准营销等多个领域,降低成本,提高效率,产生倍增的经济与社会价值。这使得数据资源蕴含着巨大的潜力,但是其价值的开发同时需要投入新的人类活劳动,比如想象力、创造性劳动,等等。就如同土地需要和人力相结合才能生产出粮食,石油需要进行精炼才能得到巨大的增值一样,而这更体现了数据作为资源和生产要素的本质特点。
五、 数据资源的市场定价
在微观层面,肯尼思•阿罗(K.J.Arrow)在分析决策信息时,从信息需求角度,将信息商品的效用价值定义为有信息和无信息两种情况下拥有一定资产的决策者进行优化决策时所得到的最大期望效用的差值。他还证明了在效用函数采取对数形式的条件下,信息商品的效用价值等于该信息商品所包含的信息量[3]。
在宏观层面,哈罗德·霍特林(Harold Hotelling)和罗伯特·索洛(Robert Solow)认为,对于不可再生的资源,达到资源最优耗用状态要具备两个条件。其一是随时间推移,矿区使用费须以与利率相同的速率增长,亦即资源任何时点上的时间机会成本应为零,此为最佳存量条件,被称为霍特林定律;第二个条件是资源品价格等于资源品边际生产成本与资源影子价格之和,此为资源最佳流量或最佳开采条件。资源估价是资源有偿利用和资源市场运作的基础,大致有5种方法,收益资本化法(Revenue Capitalization)、市场比较法(Market Comparison)、市场趋势法(Market Trend)、影子价格法(Shadow Pricing,反映资源最优使用效果的价值)和竞价法(Bidding)[3]。
数据资源与自然资源最大的不同在于其具有可再生性(在某一时点上可以多次复制),这使得其边际生产成本接近于零。但是由于产权的限制,大规模数据资源生产的边际成本仍然能够保持在一个较高的水平上。此外,与自然资源的价值稳定性不同,随着时间的推移,数据资源的价值可能会快速下降。因此,对于数据资源的定价除了考虑其边际生产成本和影子价格之外,还需要培养消费主体对数据资源适时开发利用的意识和能力。
六、 数据资源的生产与供给
Web2.0技术的广泛应用使得互联网上的内容生产能力呈指数增长,数据资源的生产迅猛增加。与此同时,世界各国出台一系列政府信息公开与政府数据开放政策,加之科学数据的管理能力和开放力度也在不断提高,大大增加了数据资源免费供给的力度。我国上海更是将政府数据开放扩展至公共领域,出台了《上海市公共数据开放暂行办法》(沪府令21号),要求除市各级行政机关之外,履行公共管理和服务职能的事业单位也须将在依法履职过程中采集和产生的各类数据资源,面向社会提供具备原始性、可机器读取、可供社会化再利用的数据集的公共服务,鼓励数据利用主体利用公共数据开展科技研究、咨询服务、产品开发、数据加工等活动。
与此同时,随着大数据产业的发展,我国数据类企业增长迅速,分布在电子商务、在线银行、社交媒体、搜索引擎、视频娱乐、物流与供应链、医疗、基因检测等行业,呈现出增速快、行业覆盖面广等特点。到2018年全国约有4800家大数据企业,而涉数类企业在“互联网+”环境下要远远多于这个数字。与此同时,涉数企业规模也呈扩大趋势,2018年8月顺丰联合8家企业注册1亿资金成立超级大数据公司[6]。不断增加的数据企业逐渐形成竞争态势,促进了数据资源品质量和数据消费者剩余福利的提升。
七、 数据资源的需求开发
不同于物质资源,数据资源满足消费者某种特定需求的功能更加隐蔽,需要消费者具备较高的数据素养和数据利用能力方能实现。也就是说,只有当消费者了解数据资源开发利用的技术和方法,才能够真正实现其价值。为此,数据资源的拥有者有责任培养消费者的消费需求和消费能力。这项任务既可以由资源拥有者承担,也可以委托第三方专业机构来完成。比如,在政府开放数据网站上,呈现数据的应用场景和应用示例,可以帮助用户更好地理解并利用数据。近年来政府、图书馆、企业、高校等不断组织数据开发利用大赛,其实质在于寻求数据资源价值开发的最优方案,并通过新闻示范效应培养潜在的数据资源消费者。
随着互联网数据资源的不断积累和公共数据开放力度的不断加大,数据要素市场将在一定程度上转化为买方市场。在这种情况下,对于潜在用户的消费意识和消费能力的培养就更加重要。随着5G时代的来临和视频媒体的快速发展,以直播等方式表现的消费者培养模式已经渐趋成熟,但是尚未广泛应用于数据资源开发利用领域。除了数据资源开发利用的成功案例和直观展示所带来的消费刺激外,数据资源的可发现性和良好的搜索引擎关系也将大大有利于数据交易的发生和其价值的实现。
八、 数据资源交易市场的治理
随着数据资源供给和需求的增加,数据交易日益活跃。目前国内的大数据交易平台主要由政府主导和企业主导两类。由政府或国企主导的大数据交易中心有贵阳数据交易所、上海数据交易中心、中关村数海大数据交易平台、长江大数据交易平台等;另一类则由大型互联网企业如阿里、京东、百度、浪潮、顺丰等主导。目前贵阳大数据交易所已发展2000多家会员,可交易数据产品超4000个,明确规定交易的不是底层数据,而是数据清洗、建模分析的数据结果,要求数据买卖双方保证数据所有权、合法、可信、不被滥用[7]。但是,由于法规、技术标准与交易规则尚不完善,我国公开的数据交易在数量和种类上都还比较有限。
与物质商品交易市场不同,数据交易技术更加复杂性,加之相关的监管技术尚未成熟,致使近年来暗网上底层数据交易活跃。据报道,2018年8月28日,一位暗网用户发帖出售1.3亿名华住旗下酒店入住用户数据包,数据总数达5亿条[8]。同月,大约3亿条疑似顺丰用户数据在暗网售卖,包括寄件人、收件人的姓名、地址、电话等个人信息[9]。可见,高频接触个人信息的行业已成高度敏感行业。根据2017年测算,中国网络黑产从业人员已超过150万,市场规模达千亿级别。数据泄露规模由2016年的14亿条跃升至2017年的50亿条。2017年3月,公安部开展打击整治黑客和侵犯公民个人信息犯罪专项行动,仅4个月时间就侦破案件1800余起,抓获犯罪嫌疑人4800余名,查获各类公民个人信息500余亿条[10]。
为了对数据资源交易市场进行有效治理,需要参照传统资源开发型企业的监督管理办法,采用先进的信息安全技术,协同公安、工商税务等政府部门以及第三方审计机构对涉数企业的数据采集、存储、传输、共享、使用、归档及销毁各环节进行审查,确保企业合规经营;对互联网企业内控机制开展专项检查和整治行动,严厉规制企业无资质采集、违规出售、滥用国家及公民个人数据的违法行为;加大惩罚力度,打击数据黑市交易;维护国家、公民与涉数企业的正当利益,促进数据产业的繁荣发展。
九、 数据资源企业的规制
当前,数据泄露、篡改、丢失、不可持续等问题成为数据企业管理中的风险因素。2017年,美国一家数据公司泄露了近2亿登记选民的个人信息,约占美国人口的61%。2018年3月,美国社交网站Facebook数据泄露,被用于操纵总统选举[11]。2015年瑞典交通管理局将资料库及信息服务外包给美国IBM公司,而IBM再将部分服务外包给美国NCR公司。两家公司在转存资料时出现疏漏,让没有得到安全许可的员工接触到敏感信息,致使大量涉及国家安全和个人隐私的数据遭到泄露。而瑞典政府在2017年1月才发现漏洞。这一事件极大冲击了瑞典执政党的执政地位,反对党因此发起“不信任投票”,要求首相引咎辞职[12]。此外,根据DCCI互联网数据中心发布的报告,2017年手机App获取个人信息呈常态化趋势,高达96.6%的Android应用会获取用户隐私,而iOS也达到69.3%[13]。
目前,我国已经出台了一系列数据管理政策和法规,比如《网络安全法》(2016)、《儿童个人信息网络保护规定》(国家互联网信息办公室,2019)、《网络数据安全标准体系建设指南》(工信部,2020)、《互联网个人信息安全保护指南》(公安部2019)、《数据安全管理办法(征求意见稿)》(国家互联网信息办公室,2019)等。这些法规和标准在防控数据风险中发挥了重要作用,但是在数据权利的细分保护上仍然存在不足。建议参照欧盟《通用数据保护条例》,尽快制定出台我国的数据保护法规或条例,保护数据主体的知情权、访问权、修改权、删除权和被遗忘权;明确数据企业应当承担的责任和义务;加大对违法违规企业的经济惩罚力度,运用多种手段监督涉数企业合法运营。
十、 促进数据产业健康发展
目前,我国数据产业发展势头较好,但是也面临较多困难。一些数据保护法规在细化程度与操作性方面尚存在不足,致使监管执法的力度不够,在一定程度上影响了数据产业的健康发展。比如,《网络安全法》鼓励通过技术监测与管控促进网络安全健康运行,但却较少涉及直接约束技术权力的滥用,对于涉数企业在数据保护方面的责任与义务规定不够详细具体。为了促进数据产业的健康发展,建议对涉数企业的数据采集、管理与使用进行信用等级评估,并记入企业信用记录,运用诚信机制促使涉数企业合规经营。与此同时,营造公平公正的市场竞争环境,充分利用市场竞争机制促使涉数企业自觉提高数据安全意识,加大数据安全投入,提高数据资源质量,合法合规经营。
参考文献
[1] 王芳著.阳光下的政府:政府信息行为的路径与激励.南开大学出版社,2006,8.
[2] 王芳.知识经济与劳动价值论.宁夏党校学报,1999,(5):29-33.
[3] 赖茂生,王芳编著.信息经济学.北京大学出版社,2006.
[4] Office of Management and Budget. CIRCULAR NO. A-130 (Revised).February 8, 1996. https://www.whitehouse.gov/sites/whitehouse.gov/files/omb/assets/OMB/circulars/a130/a130.html.
[5] 王芳.政府信息资源的经济学特征及其产权界定. 图书情报工作, 2005,(5):50-54.
[6] 东莞日报.注册资本1亿元!顺丰等9家企业在松山湖组建“超级大数据公司”! 新浪网,2018-9-23. http://k.sina.com.cn/article_2145932164_7fe8538401900coin.html.
[7] 王芳著.网络社会治理.商务印书馆,2020.
[8] 赵婷婷.华住5亿条用户信息疑遭泄露. 北京青年报. 2018-08-29. http://www.xinhuanet.com/yuqing/2018-08/29/c_129942361.htm
[9] 王潇燕.3亿条疑似顺丰用户数据泄露 暗网交易售价两个比特币.中国企业报, 2018-08-31. http://finance.sina.com.cn/chanjing/gsnews/2018-08-31/doc-ihiixzkm2994318.shtml
[10] 中国“网络黑产”规模达到千亿级别 网络安全亟待多维度防御体系. 中国网络安全等级保护网,2018-5-10.
[11] Akan.全美最大选民数据泄露:共和党所属数据公司意外泄漏近2亿美国选民个人资料. https://www.freebuf.com/news/137819.html.
[12] 李峥,牛帅.数据泄露会让政府倒台吗?澎湃新闻网,2017-08-03. https://pit.ifeng.com/a/20170803/51555005_0.shtml.
程春雨.25.3%安卓应用越界获取用户隐私,成网络诈骗主要源头. 中新网, 2017-07-19.
https://www.thepaper.cn/newsDetail_forward_1737124.本文已发表在《图书与情报》期刊上:王芳.关于数据要素市场化配置的十个问题.图书与情报,2020,(3).
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 06:40
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社