||
(博主按:这篇文章的写法是,以李伟钢博主(http://blog.sciencenet.cn/u/Liweigang)在本所做的一次报告的PPT和几篇博文为基础,加上对他推荐的若干文献和我们检索到的若干文献之阅读梳理,由第一作者高晓培起草出初稿,由李伟钢博主和我分别多次提出修改意见,高晓培执笔数易其稿,最终由我定稿。我们殷切希望,巴西在科研管理信息化方面的先进思路和实践能对我国相关管理部门提供实实在在的启示和示范。
点击以下链接可看到文章中的图 20140913巴西人才库+Lattes+平台在优化科研和教育管理中的作用及其借鉴意义 (2).docx
巴西人才库Lattes平台在优化科研、教育管理中的作用及借鉴意义
高晓培1 武夷山1 李伟钢2
(1. 中国科学技术信息研究所,北京 100038;2. 巴西利亚大学TransLab实验室,巴西利亚 70910-900)
(发表于《全球科技经济瞭望》2014年第7期)
第一作者简介:高晓培(1986-),女,硕士,主要研究方向为科学计量学。
通讯作者简介: 李伟钢(1958-),男,博士,副教授,主要研究方向为航空交通模型与人工智能。
基金项目:国家自然科学基金:论文零被引的时间演化规律、影响因素及其应用研究(No. 71373252);
巴西科学技术发展委员会CNPq基金:Collaborative Decision Making in Air Traffic Management by Game Theory (PQ No. 304903/2013-2)。
摘 要:信息化时代,如何开发利用科技信息资源以辅助科研决策是科技管理人员和科研人员共同关心的问题。本文详细介绍了巴西科技人才履历表数据库Lattes平台的基本情况、在巴西科研和教育发展中的应用、平台建设成功的关键因素等。Lattes开发的初衷在于为国家科研管理机构提供信息支持,以便协助科研管理。Lattes平台由履历表、机构名录、团队分类和展示分析四大部分构成,具有辅助决策、大数据资源和双向开发等特点。截止2013年底,Lattes平台已拥有各类人才电子履历276.5万份,成为巴西最重要的人力资源管理系统。对巴西经验的借鉴将有助于我国开发统一的科技、教育人力资源系统工作的进行。
关键词:巴西,Lattes平台,科技人才履历表数据库,科研管理
The role of Brazilian Lattes Platform in improving research and education management and its implications
Gao Xiaopei1 Wu Yishan1 Li Weigang2
(1. Institute of Scientific and Technical Information of China, Beijing 100038; 2. University of Brasilia TransLab, Brasilia 70910-900)
Abstract:In information era, S&T managers and researchers are very concerned about how to develop and utilize S&T information resources to aid research decision-making. The Lattes platform is a national database which files all CVs of S&T researchers working in Brazil. This paper gives detailed description on the growth process of Lattes platform, its application to Brazilian education and research development, and the key elements for its success. The Lattes platform is designed to provide information support to research management agencies. There are four parts in Lattes platform: curriculum vitae, directory of institutions, directory of research groups, and panel of analysis and demonstration. It is characterized by decision support, pooling of big data resources and the combination of top-down with bottom-up approaches. The Lattes platform has become the most important human resource management system of Brazil with 2.765 million CVs of S&T researchers. The experiences and lessons in its building may bring light to developing China’s uniformed database system on human resource in S&T and education.
Keywords:Brazil, Lattes platform, Database of S&T researchers’ CVs, research management
科研和教育领域的管理活动涉及人力、资源和成果三方面的内容[1]。信息化的时代,在拥有关于人力、资源和成果的大量信息的背景下,如何有效地将之运用于科研管理的实践中,如何利用现有信息有效地辅助决策,是科研管理人员和科研人员都关心的问题。20世纪90年代,巴西在全国范围内推动电子产业发展,特别是各级政府实现电子政务。同一时期,在科研管理领域,巴西面临着一个科研管理信息来源多、缺乏统一标准、科研基金浪费的局面[2]。虽然意识到国家电子文档在机构资金运作中的作用并拥有一定量的信息,但是如何将这些信息有效地运用于科技决策,这是一个让巴西科技管理界困扰已久的问题。经过一系列调研后,巴西有关部门将这一困境归因于缺乏一个全国视野下的信息系统[2]。并在此判断的基础上,着手建立全国性的科技人才履历系统。经过15年的建设和发展,巴西的科技人才履历系统取得了一定的成功,并以其辅助决策、大数据资源和双向动态开发等特征在巴西的科研和教育管理活动中发挥了重要的作用。
2014年3月我国《国务院关于改进加强中央财政科研项目和资金管理的若干意见》(后文简称《意见》)中指出,《国家中长期科学和技术发展规划纲要(2006-2020年)》实施以来,我国科研项目和资金管理不断改善,但是也存在项目安排分散重复、管理不够科学透明、资金使用效益待提高等突出问题[3]。《意见》强调了“建设国家科技管理信息系统”在解决当前问题中的必要性,并建议完善科研信用管理、建立健全信息公开制度、改进专家遴选制度。在科技信用体系建设中,科研履历建设是解决科技信用信息共享的基数数据瓶颈之一[4]。在国家科研管理信息系统建设方面,巴西已经取得一些成绩,如全国性的科技人才履历表数据库平台和科研项目在线申报和管理系统,对巴西经验的了解和借鉴将有助于我国科研、教育管理信息系统建设工作的进行。
1 巴西Lattes平台基本情况
巴西人才库Lattes(拉特斯)(http://lattes.cnpq.br/),是一个为科技人员、教育人员、学生、研究团队和学术机构提供服务的科技人才履历表数据库。该平台以巴西物理学家拉特斯(Lattes)命名[5],以表彰其在π介子发现中做出的贡献。Lattes平台由巴西科学技术发展委员会(Conselho Nacional de Desenvolvimento Científico e Tecnológico, CNPq)主管。九十年代末期,CNPq组织桑塔卡塔琳娜联邦大学和伯南布哥联邦大学的两个项目组、Multisoft信息公司和CNPq的IT团队开始研发Lattes数据库。1999年8月,CNPq首次推出Lattes履历表,正式作为联邦科技部和下属单位的人力资源信息管理系统。截至2012年12月该平台上拥有的资源包括:200万份个人履历、2.3万个R&D小组、2.0万个项目和4千多个机构信息[6]。
1.1 平台构成与主要模块
Lattes平台由4部分构成:履历表(Currículo Lattes)、机构名录(Diretório de Instituições)、研究团队名录(Diretorio dos Grupos de Pesquisa)和展示分析板块(Painel Lattes)。
原则上任何人都可以凭借巴西税号(CPF)或护照号在Lattes平台上建立自己的履历表。对于已在巴西的用户,CNPq的维护团队会对注册者的税号进行核实。经批准后,注册者可随时登陆、更新个人履历表。为方便用户,可以通过Facebook、Twitter等社交网站界面直接注册。
目前,Lattes平台已经与Google Scholar、Scopus、Web of Science等文献数据商家合作,提供论文相关计量指标。此外,通过与ScienceDirect等全文数据提供商的合作,可以链接到履历表中一些论文的全文访问地址。
Lattes平台上的履历表多数是葡萄牙语的,其中相当数量已按葡英双语履历发布,也有不少外国学者的英文履历。履历表分前端展示和后端操作两部分。前端展示部分在Web页面上列出某专业人员的履历表。该履历表采用同一格式,依次列出人员的简单介绍、工作单位、研究方向、教学内容、科研项目、期刊(会议)文章、出版书籍(章节)、参加会议、指导学生(博士、硕士和本科生)、参加校内外答辩、社会工作等等,详见表1。所有内容由简历持有者自行填写。Lattes平台要求注册用户填写真实的履历信息,并在提交或更新履历表时承诺已经充分了解该平台数据库的有关规定、所提交的各项资料不违反巴西刑事法第297-299条款[7]。
针对专业人员的后端操作提供三种功能:检索、注册和登陆。在检索界面(http://buscatextual.cnpq.br/buscatextual/busca.do?metodo=apresentar)提供葡、英双语的检索入口,用户可以在履历表全文或限定在姓名、专业领域、国别字段等进行检索。检索结果以列表形式列出履历持有者的姓名和简单的供职机构等信息,进一步点击检索结果可以查看完整的履历表。
表1 Lattes平台履历的结构与主要内容[8]
一级类目 | 二级类目 | 具体内容 |
基本信息(General Information) | 个人信息 | 姓名、姓名异写(如英文名、英文名的简写等)、通信地址 |
教育背景/学位 | 按照起始时间倒序顺序列出:起始-终止年限、学位、学校、专业、毕业论文题目和导师等。 | |
语言 | 顺次列出持履历者使用的语言,分理解、口语、阅读、写作四方面给出评价(差、好、非常好),该评价是作者注册时自行填写。 | |
工作经历 | 分“Contract”和“Activities”两类以起始时间倒序顺序列出:起始-终止年限、工作性质(合同的签署类型,如政府员工、项目参与者)、机构名称、参与项目名称等信息。 | |
编辑委员会成员 | 以时间倒序顺序列出:起始-终止年限、期刊名称。 | |
期刊审稿 | 以时间倒序顺序列出:起始-终止年限、期刊名称。 | |
奖励 | 以时间倒序顺序列出:年、获奖项目、机构名称等。 | |
其它相关信息 | 以时间倒序顺序列出:用户认为有益的资料。 | |
项目(Projects) | 科研、工程项目 | 以时间倒序顺序列出:起始-终止年限、基金项目简述、状态(在研、结束)、参与者(非学生和非学生两种)、基金或资金来源方。 |
领域(Areas) | 研究领域 | 列出用户的主要研究领域、方向等,分过去和现行两种。 |
科学/技术/艺术/文化作品(STA&C Production) | 科研产品 | 首先给出作者在WOS、Google Scholar、Scopus数据库中的总被引论文数、总被引频次、数据更新时间等。 其次逐篇列出在科技期刊中发表的论文、图书、图书的章节、杂志/报纸中的文章、会议论文、会议摘要、待出版论文等。 |
技术产品 | 非专利或注册软件、技术产品、其它。 | |
艺术/文化产品 | 包括电影、戏剧、艺术作品等。 | |
其它工作 | 列出用户认为有意义的科技、艺术、文化相关成果。 | |
学术报告(Academic Advisory) | 学术报告 | 以时间倒序顺序列出应邀参加的科技、艺术、文化等活动的报告信息。 |
学术活动(Events) | 参与活动 | 以时间倒序顺序列出:时间、活动类型(学术会议等) |
组织活动 | 以时间倒序顺序列出:时间、活动类型(学术会议等) | |
指导学生 (Advise) | 完成的指导工作 | 以时间倒序顺序列出:本科、硕士和博士论文和学生姓名。 |
进行的指导工作 | 以时间倒序顺序列出:本科、硕士和博士论文和学生姓名。 |
1.2 数据量与使用情况
在建立国家级科学、技术与创新(ST&I)信息系统思想的指引下,巴西从1999年起建立Lattes平台,起初从其它信息系统导入履历3.5万份[9]。据Roberto C.S. Pacheco(2006)统计,Lattes平台自建立起至2002年8月履历数量突破20万份,此后基本上保持了每年10万份以上的增长趋势,截止2006年2月履历数量超过60万份[9]。2012年7月Lattes 2.0版问世,该版本融合Web2.0的信息发展优势。迄至2013年底履历数量已经增至276.5万份,其中学生履历112.0万份[10]。
Lattes平台之所以信息价值巨大,是因为该数据库是一个实时更新的、与科研人员实际活动高度同步的、基于网络界面的大型数据库,每天吸引着来自世界各地的大量用户查看。如图1所示[6],在2011年,平均每天Lattes平台上的履历有10.0万份会有更新,有1.2万份履历会因为各种不同的原因被查看。自建立之日起,Lattes平台受到了越来越多的使用和关注。如图1所示,在2007-2011年间Lattes平台上履历的每日点击均值和每日更新均值均保持了稳步上升的趋势。
图1 2007-2011年每日点击和更新履历数量[6]
Lattes平台上绝大部分履历数据可开放获取,用户只要联网即可访问感兴趣的科研人员的履历信息。此外,科研管理或科学研究人员与CNPq建立合作协议后,通过一些分析工具的使用可以批量采集和分析Lattes平台上的数据,以用于科研管理或学术研究活动。这些工具包括:
l scriptLattes(http://scriptlattes.sourceforge.net/)。该软件由巴西圣保罗大学的Roberto M. Cesar Jr和ABC联邦大学(Universidade Federal do ABC)的Jesús Pascual Mena Chalco共同开发[11]。该软件主要用于团队相关分析[12],在给出Lattes平台上的团队信息后,scriptLattes可以自动下载团队相关人员履历,并生成该团队学术成果报告和合作关系图等。
l LattesMiner。LattesMiner 是巴西高等人才培养基金委员会(Coordination for the Improvement of Higher Education Personnel, CAPES)支持下的“课程和计划的统一系统:学术网络的鉴别”(Unified System of Curricula and Programs: Identification of Academic Networks,SUCUPIRA)项目的一部分。SUCUPIRA项目旨在为构建学术社会网络建立一个Lattes平台的信息抽取系统[12]。LattesMiner是java平台下的一种领域专用语言(Domain Specific Language, DSL),可用通过姓名和ID号抽取Lattes平台上的履历信息[13]。
l Lattes Extrator(http://lattesextrator.cnpq.br/lattesextrator/)。该软件由CNPq自行研发[13],主要用于内部或合约机构对Lattes数据的分析和使用。Lattes Extrator可以以三种形式完成对Lattes平台履历信息的抽取:抽取已知列表的履历的XML格式文件;按照过滤器进行履历信息抽取;抽取事先保存的履历信息等[14]。
1.3 网络结构、国际合作及推广
在Lattes系统的建设与推广应用过程中,由三位来自不同大学的老师和CNPq的IT 团队代表组成专家小组,他们定期指导和评价该平台的使用和更新情况,积累了丰富的经验。Lattes平台网页界面目前已经被翻译成英语和西班牙语,并于2002年开始以ScienTI网络项目的形式得到推广。ScienTI网络项目是在伊比利亚-拉丁美洲(Iberian-Latin-American)范围内设立的,该网络项目致力于推动西班牙语、葡萄牙语相关地区科技、教育和创新活动的信息管理工作[15]。目前已有12个国家参与其中,包括:阿根廷、巴西、智利、哥伦比亚、古巴、厄瓜多尔、墨西哥、巴拿马、巴拉圭、秘鲁、葡萄牙和委内瑞拉等国。
ScienTI网络项目在推广过程中,不同国家采用了相似的网络结构构建其信息系统,ScienTI的网络结构主要由四层构成,包括[2]:
(1)关于科学、技术与创新的知识系统(Knowledge Systems on S&T&I)。该层主要包括三部分内容:数据挖掘、链接分析和信息检索。
(2)网络服务目录(Web Services Directory)。该层主要包括四部分内容:浏览者、检索、数据仓库和指标。
(3)信息系统(Information Systems)。该层的信息内容包括个人履历(CvLAC)和团队履历(GrupLAC)。
(4)XML标准(XML Standards)。该层提供分析的基本单元,包括履历、研究团队、机构、基金(工程)项目、期刊等。
巴西建立Lattes平台的经验也引起了美国有关部门和专家的关注。2009年,美国政府科学和技术政策办公室(Office of Science and Technology Policy,OSTP)召集国家卫生研究院(The National Institutes of Health,NIH)和国家科学基金会(National Science Foundation,NSF)启动Star Metrics项目,旨在完成科研投资效果的循证测度并奠定与之配合的开放式数据基础[16]。该项目首先要完成的即是对联邦资助的研究机构的科学家及支撑人员的人数进行统计和分析[16]。在2011年1月和4月分别于巴西利亚市和华盛顿召开的联合会议上,巴西桑塔卡塔琳娜联邦大学的Roberto C. S. Pacheco教授(Lattes创始人)和Star Metrics项目成员分享了Lattes平台建设的经验[2]。同年12月在华盛顿召开的Star Metrics咨询会议上,巴西专家再次受邀介绍其在Lattes开发和建设中的经验。
其它国家的科研管理机构也通过不同方式连接Lattes平台,分享其信息资源和管理模式,例如英国、法国、加拿大、西班牙、意大利、西班牙、芬兰、比利时、日本、韩国、印度和南非等国。来自全球的46个国家、地区或机构与巴西科学技术发展委员会签订了使用Lattes平台的合作协议[17]。
2 Lattes平台在巴西科研和教育发展中的应用
20世纪90年代,为了提高巴西技术能力和工业竞争能力,进一步促进高科技发展,巴西政府对科技体制和政策进行了重大的改革和调整。其重大举措之一是:新建国际科技局并直属总统府领导,确立了国家科学技术发展委员会在总统直接领导下跨部门协调全国科技活动的地位[18]。现今巴西联邦政府的科学基金管理机构主要包括:科技部下属的科学技术发展委员会(CNPq)和技术创新与发展局(FINEP)、教育部下属高等教育基金委员会(CAPES)。虽然巴西联邦政府卫生和能源等部委每年都有大量科研经费,但他们一般都把计划和预算转到联邦科技部下属的基金管理委员会,如CNPq或FINEP等,由业务部门组织协调全国相关专业科研人员来实施这些具体项目。
2.1 基于Lattes平台的科研产出基金计划
CNPq每年一般有40余个大型招标项目,如面上基金、行业基金项目以及国际合作项目等。其中影响力最大、与Lattes联系最紧密的项目是科研产出基金(PQ - Bolsas de Produtividade em Pesquisa)计划,简称PQ基金。这是一项以科研津贴的形式支持科学技术人员的全国性科研资助计划。在该计划的支持下,通过Lattes平台上的履历信息,CNPq每年都会组织一次资助研究员的遴选活动。达标的研究员可以享受联邦政府的专项科研经费补助。科研成果津贴共分为三级六档:二级研究员、一级研究员(ABCD四档)和高级研究员。享受科研成果津贴的期限为3-5年不等,到期后需要参加新一轮的申报[19]。Lattes平台丰富的资源不仅为研究员的评选提供了数据基础,更为其评选结果的合理性、公平性提供了可供监督的平台。
2.2 Lattes平台在基金项目申报和管理环节中的运用
除Lattes平台外,巴西科学技术发展委员会同时开发和维护卡洛斯▪查加斯平台(Carlos Chagas Platform,http://carloschagas.cnpq.br/),该系统是基金项目在线申报和管理系统。CNPq的一切基金项目有关的活动都通过此系统得以开展和进行[20]。目前Lattes平台和Carlos Chagas平台已经实现了兼容整合,在项目评审过程中,从评审人的选择、申报者资格的确认到申报团队成员履历信息的查询都可以实现同一界面下的自由切换。Lattes平台的存在为项目申报和评审环节提供了真实、便利的基础数据支持。
2.3 Lattes平台在教育评价活动中的运用
巴西教育部下属高教基金委员会(CAPES)每年都针对全国高校和研究机构收集研究生教育情况相关数据(Coleta CAPES),形成教育部研究生教育数据库。巴西每三年对各个专业的博士和硕士研究生教育情况进行一次综合评价,评价的具体内容包括师资力量、基础设施、科研成果、教学计划、毕业生人数和社会活动等项[20]。根据评价结果将研究生课程分为1-7类,其中3级以上可以招收硕士研究生,4级以上可以招收博士生等。在各研究生计划进行本单位数据采集过程中,需要引入导师和学生的科研产出情况。鉴于此况,Lattes平台在发展过程中十分注重与CNPq 内部和教育部的CAPES等基金委的各类数据库平台的链接与整合。Lattes平台初步建成之后,逐步为研究生课程主任提供了从履历中提取研究生课程信息,并导入CAPES评估系统的功能[2]。在教育部组织的各种评审活动中,在哪个学科范围内选择评审专家、选择哪位评审专家,以及各课程的科研教学产出情况等都离不开Lattes系统提供的信息支持。
2.4 Lattes平台在其它机构科技评价与学术研究中的运用
Lattes平台除了对联邦科技部和教育部提供数据服务接口外,为其他部门的项目管理也提供了必要的支撑。例如,环境部在SIBEA(http://sibea.mma.gov.br:8080/dcsibea/)项目中,利用Lattes平台数据建立了一个环境教育相关人员的国家目录。全国卫生监督局在DCVISA(http://dcvisa.anvisa.gov.br/#/home)项目中,利用Lattes平台数据建立了健康监测领域人员和机构国家目录[2]。
此外,Lattes平台数据还成为学术研究的数据来源。例如,Denis Arruda等[21]以2006年11月Lattes平台上登记的886份计算机科学领域研究人员履历为信息来源,对这些研究人员的性别和地域进行了研究;Ana Carolina等则对Lattes平台上25个机构的144名研究人员的信息进行了抽取分析[22],以便了解其情况。
Lattes等一系列科研管理信息系统的开发和使用,体现了巴西科研管理中的一个重要理念:科研管理部门是服务机构,科研管理主要应该由研究人员自主进行。
在这些科研管理信息系统的开发和使用过程中,联邦、州、市政府科研管理部门始终把自己定位于一个服务机构的角色,为科研人员开发出界面友好的信息产品供其使用。在管理活动中也坚持研究人员自主管理的理念,通过Lattes平台的履历信息在同行业内选择专家小组,由专家小组开展具体的科研评估和管理工作。这样以来,不仅有利于相互的监督、协调,更实现了研究人员的自主管理,同时也节约了政府部门在科研管理活动中的经费、人力和时间投入。
此外,Lattes平台的开发设计一方面契合了巴西电子政务的建设进程,反映了国家信息化程度;同时也契合了大数据意义凸显的时代背景,形成丰富的科技教育发展资源。
3 Lattes平台特点与建设成功的关键因素分析
一个成功的数据库应具有以下特点:输入方便、界面友好、搜索快捷、自动标签、知识递增、资源丰富和应用广泛等。此外,巴西人才库Lattes平台还具有辅助决策、大数据资源和双向动态开发这三个重要特征:
(1)Lattes人才库是跨地区、跨部门、跨平台的国家级科技信息(ST&I)系统,是联邦、地方各级政府科技教育部门、基金管理机构、大专院校和研究院所等制定科技、教育政策和发展计划的辅助决策工具,也是广大科研人员个人和团队的履历和项目管理的信息平台。
(2)Lattes人才库基于Web2.0 网络大数据资源,与全球46个国家、地区和机构的人力资源信息系统连接,与巴西其它基金管理机构系统整合,具备大数据资源整合和面向社会应用等功能。Lattes平台把用户提交的随时更新的、碎片化的信息进行整理,形成结构化和具有分类标签的有效信息。这种自动化的数据结构化机制,在大数据时代,是一种十分成功的社会实践。
(3)Lattes人才库具有管理方和用户方双向动态开发的功能。CNPq的技术团队根据技术发展和用户需求不断补充和完善系统功能,在技术上保持了Lattes平台的先进性。同时,Lattes平台是一个大众生产系统,用户是信息的使用者、创造者和监督者,充分体现了web 2.0环境下信息构建活动中内容由用户生成的特征[23]。用户自行填写和随时更新自己的履历,使得Lattes平台上的数据内容成滚雪球般增加。
巴西人才库Lattes平台除了这三个重要特征外,其开发应用成功与以下因素密切相关:
3.1 Lattes经历信息技术演变的各个阶段,保存着全国科技发展的珍贵历史资料
几十年来,在巴西科技、教育行业工作的各类人员是伴随着Lattes人才库的开发应用进程而成长的。他们在Lattes平台上记录着自己科研生涯,亲身体验、见证着这个信息系统的成长。早在20世纪80年代,巴西科研管理部门已告别纸质档案时代,建立了拥有3万余名科技人员的数据库。进入90年代,联邦政府积极推动信息化,特别是建设电子政务和电子银行,在此背景下,CNPq建立了DOS操作系统下的电子履历表格,进入磁盘数据时代。这些前期工作为后来在网络时代开发Lattes平台提供了丰富的经验和教训,也保存了珍贵的全国科技、教育发展的历史资料。
3.2 Lattes实现了从强制推行到粘合吸引
早在1999年推出Lattes平台时,科技部等部门的下属基金委采取了一定的强制性措施,要求科技人员填写这个履历表。科技人员要申报CNPq的基金项目,必须先在Lattes平台上完成个人信息的注册才能参与招标活动。这种强制力在Lattes平台功能并不十分完备且影响力不大的发展阶段,对平台的宣传和普及起到了决定性的作用。但随着系统发展的成熟与完备,大大增加了粘合力,广大科技人员愿意使用Lattes来管理个人和团队履历,而技术创新与发展局和高等教育基金委员会等其它机构也要求使用Lattes 履历表,使其进一步走向社会。
3.3 Lattes的自我反馈与动态发展
巴西科技发展高层决策者对发展Lattes有清晰的定位,为其推广应用施加了一定的强制力,但真正保证Lattes平台成功的主要原因在于其自我反馈和动态发展的生命力。Lattes平台的建设始于解决政府科技决策中的信息资源问题,但在实际建设过程中,开展了广泛的用户信息需求的调研,充分论证了Lattes平台建设的必要性,更为其功能设计提供了思路。在此基础上,大部分用户都是科技教育人员,具有较强的自我反馈能力,Lattes系统也具备接受这些反馈的功能,使其不断纠错,动态发展。
3.4 Lattes拥有获取网络信息资源的整合力
科技部属下的Lattes平台不是孤立单一的信息系统,而是与Carlos Chagas项目管理平台、教育部CAPES研究生评估系统和科学文献分区系统等结合在一起构成了巴西整个科技教育管理信息技术支持体系,参见图2。除与全国性的信息系统保持良好的数据交换外,Lattes平台与46个国家与地区科研管理机构和互联网上的公共信息资源或数据库商提供的信息资源进行了有效的链接。一站式、同界面的科研履历信息服务为Lattes平台争取了更多的用户。
图2 巴西科技部、教育部的几个信息系统整合应用示意图
3.5 Lattes的数据质量有保证
数据质量体现在两个主要的方面:一是数据的时效性,二是数据的可靠性。活跃在科研一线的人员会在第一时间补充自己的履历信息,有效保证了Lattes平台数据更新的及时性。由于人人可以访问其他人员的信息,形成了一种有效的监督机制,使得数据可靠可信。此外巴西的《信息法》、《信息获取法》、《互联网法》、《新反腐败法》等的制定,为Lattes平台信息的可靠性提供了法律基础。表面上看来Lattes仅是一个Web履历表,但后端操作已实现了个人和机构用户的电子认证等网络安全措施,也具备先进数据挖掘技术来识别和过滤不实信息功能。
3.6 Lattes具有开放注册、开放获取以及开放合作等新型理念
开放注册为Lattes平台吸引了来自科技、教育领域的全球注册用户,用户甚至可以通过各种社交网络进行注册和数据更新。开放获取则使Lattes平台的作用不仅仅局限于国家科学技术发展委员会对其开发使用,此外任何一个单独的科研人员、科研单位、高等院校、政府部门、企业社团等在人力资源的战略规划、招聘、晋级、业绩评价等诸多活动中都有可能成为其使用者。在开放合作方面,CNPq委托巴西国家科学与技术信息研究所(IBICT)开拓Lattes2.0 的若干新功能。例如,巴西科技大事记和科学家光荣榜系列等(http://www.canalciencia.ibict.br/menu/listaNotaveis.html),从精神上激励国家科学技术发展。 该类合作优化了CNPq的核心业务,以便CNPq专注于科研管理。另外,CNPq与巴西联邦税务局合作,与该局的网上报税系统连接,实现了新注册用户通过税号认证的简单有效程序,提高了Lattes平台数据质量,同时增强了两大电子政务系统的数据挖掘深度和能力,形成共赢局面。
3.7 Lattes的IT团队具有创新性和持续稳定性
尽管巴西联邦政府是政党轮值,执政当选的党派都会任命新的科技部长、CNPq主席和一级主管等,但Lattes的信息技术团队成员基本不变,他们始终都能以持续发展的理念维护和更新平台,使其从DOS版发展到今天的Web2.0 版。在这一过程中,Lattes的团队受到的批评最多,但其系统更新最有效。例如,在用户输入新近发表文章时,以往都是需要手工打字,费时费力,而目前的系统只需输入DOI号,文章引用的相关资料都会从网络自动导入该用户的履历表。这种整合的智能程度是相当高的,是综合网络技术的体现。同时,Lattes维护团队若干技术人员在巴西利亚大学计算机系读研究生,学习数据挖掘等课程,及时更新大数据处理知识。
3.8 Lattes的信息系统和存储资源均有自主产权
Lattes平台是在先进理念和技术指导下,由CNPq组织,由巴西高校、信息企业和自身IT团队共同开发的信息系统。其操作系统采用开放源码,用户界面基于Web网页,无论是信息管理系统和存储资源拥有自主产权。同时,CNPq设置0800电话求助中心,耐心为广大用户提供相关咨询。这些使得Lattes平台的更新换代成为可能,同时使Lattes始终保持便捷、有效地为广大科技人员服务。
当然,由于葡萄牙语言和区域等原因,Lattes人才库和系统在全球范围内的推广受到一定限制,这应该是Lattes平台的一个重要不足。
4 Lattes对我国开发统一的科技、教育人力资源平台的借鉴意义
在2013年的十二届全国人大常委第五次会议上[24],到会常务委员温孚江曾提问:大数据时代,如何在国家层面上利用大数据研究来改善我们的科技管理以及整个科技运行、绩效评价等。巴西的Lattes平台与时俱进,为我国进行以人为本的科技、教育管理和服务提供了一种新的思路和先进模式。
4.1 我国科技教育人力资源平台建设现状
目前,我国并没有一种规范的科技、教育人员电子履历表,更没有一个全国范围内的人力资源信息系统。科技部、教育部和其它部委本身和下属机构,甚至各省市科研管理部门根据基金项目研究或科研管理工作的需要,都开发自己的一套信息系统。历史上形成了一些科研人员信息的积累,但是这些记录往往缺乏系统性、结构性,没有更新机制,不能成为完整有效的信息资源和辅助决策工具等。例如,“中国高层次科技人才信息数据库”虽然数据量有1.1万人次左右的记录[25],但是该人才数据库主要收录高层次人才,范围有限,且更新的及时性远不及Lattes平台。虽然我国目前并不存在一个类似Lattes的大型人才数据库,但有关部门已经意识到科技、教育信息管理系统在国家科技计划信用管理[26]、科研项目和资金管理[4]中的作用,提出了要建设国家科技计划信用信息共享平台系统[26]和国家科技管理信息系统[4]。
4.2 缺乏科技、教育人力资源统一平台造成的问题
缺乏统一的、全国范围内的科研人员履历信息系统阻碍或减缓了许多科研管理工作的进行,特别是科研人员和成果信息的不透明、不共享以及不能及时更新,也是学术不端和腐败频发的一个主要成因。具体到日常工作层面,其主要问题表现在以下几个方面:
(1)科技、教育人员在申请不同部委、基金委的项目时往往需要重复填写履历包括科研成果信息,加重了科研人员的负担。例如,自然科学基金、社会科学基金、科技部基金、教育部基金的申报渠道、标书格式和履历表格都不尽相同。
(2)上述问题的另一方面,即各部委、省市厅局在要求大专院校和科研单位统计收集有关科技、教育人员和成果的数据资料时,也需要大家填写各类表格,几乎年年重复,各上级单位要求格式不一,科技人员苦不堪言。
(3)科技、教育人员和团队的履历表信息需要长期积累才能完善,收集过程很费时,全部资料的展示与保存又需要很大的容量,所以。只有一个高效的信息平台才能完成任务。目前的状况,申报基金项目和资料统计时,个人和团队的资料很难收集齐全。
(4)缺乏履历表(含科研、教学成果)的统一格式和Web展示模式,使得评审方难以对基金申请人员的信息进行核实,难以确定同行间的可比性与相似性,从而难以找出合适的评审者,也就不易保证评审的透明性和公平性。
(5)当与科技、教育人员相关的科研管理活动需要跨部委、跨地区和跨学科开展时,由于缺乏足够的信息系统支撑和Web展示,会给协调工作带来不便甚至影响正常科研活动进行。
(6)由于信息管理和网络安全立法不完备,电子认证等技术难以实现,我国几乎所有基金项目申请书仍然需要个人签字和单位盖章,最后提交纸质标书,使得工作程序复杂,技术手段落后,未能实现本可以实现的异地无纸化现代科研管理。
(7)国际文献资料信息技术发展迅速,国内的人力资源管理特别是个人和机构的文献累积和使用涉及到这些技术,故急需开发使用有效的、基于Web2.0的人力资源信息系统,跟上国际网络信息技术发展的潮流。
(8)还有一个习惯问题,部分研究人员并不乐意把自己的履历表公开于众,有科研不端行为者更是不敢公开。一些政府科技管理部门也不愿意与别人共享人力资源相关信息。这种习惯是妨碍国家人力资源管理信息化的主要因素之一。
4.3 建立我国统一科技教育人力资源平台的若干想法
无论是从大数据时代国家科研信息系统建设的角度着眼,还是从实际的科研管理实务的需求来看,建立一个全国范围内的科技、教育人力资源信息系统,其中包括统一格式的电子履历表等,都显得十分必要和迫切。尽管巴西的科技、教育体系和管理方式与我国存在差异,但Lattes平台的基本理念和模式,值得我们借鉴。这里提出一些初步意见,仅供有关部门和人员参考。
(1)建议由国家科技部牵头,在教育部和国家自然科学基金委员会等机构配合下,组织建立一支科技教育人力资源信息平台开发团队,专门处理该项工作。上面提到有关部门着手建设国家科技计划信用信息共享平台系统[26]和国家科技管理信息系统[4],愿望是好的,但对于科技、教育方面实际上只需要基于Web2.0的三个大系统:一是人力资源数据库和平台,二是基金项目管理信息系统,三是科研和教育成果评价体系和平台。其它专项需要的子系统,例如信用信息共享,都可以通过上述三个系统的分功能实现。
(2)分析国家自然科学基金委员会、科技部863计划和973计划、以及教育部等机构现有的人才数据库,尽快决定使用一个基础库,然后建立合并规范,实现现有各大单位的一些数据库的资源合并整合。
(3)研究制定符合国情的Web个人履历表格式和导入方式,通过技术手段将现有的国家自然科学基金委员会、863计划和973计划、以及教育部一些计划资料库中的相关履历信息转换成新的Web履历表。在北京、上海等地一些高校试行申报基金项目时,使用新的履历表。在积累一定经验的基础上,逐渐向全国推广。
(4)在研究科技、教育人力资源信息平台的同时,注重研究政府各部门现有的管理信息系统的整合和协调。坚决不能再走过去国内电子政务的老路:开发一个系统,花上一大堆钱,最后变成一个孤岛系统。开发新系统时要有全局观念、战略意识和前瞻眼光。无论哪个部门牵头开发这样一个面向全国的信息系统,都不应仅仅是为本部门服务,而应该与相关部委精诚合作,共同开发,为全国人民服务,为促进科技教育发展服务,成为服务于国家长治久安的大数据资源。
(5)我们真诚希望,任何部门在开发全国性科技、教育信息系统之前,要仔细研究巴西的Lattes平台,把该系统研究透,借鉴透。同时,在组建开发团队时,一定要有工作在科研、教学一线的专业人员参与,他们应既是系统的开发者,又是系统功能的测试者。这样开发出的系统才会实用、适用、世人都用、时时可用。
5 结语
信息技术演变过程表明,能否融合Web2.0理念形成大数据资源,是电子政务发展的分水岭。巴西人才库Lattes和基金项目管理Carlos Chagas等一系列科研、教学信息管理平台,以其数据的丰富、公开、可靠等特征,在巴西科研项目申报与管理、教育绩效评价等科研、教学活动中发挥了重要作用,甚至成为国家科技、教育发展的战略基础和资源。向前看二十年,Lattes从无到有,形成今天广泛应用的大好局面;再向后看二十年,全国每一届大学生都在这一系统注册,他们将是巴西发展的中坚力量,Lattes作为社会资源的前景,难以估量!
从我国情况来看,由于缺乏先进的全国性人力资源信息系统,落后于其他国家十几年,我国科技和教育发展的效率难以提高,效果难以显现。因此,开发面向社会、公开透明、超越部门的科技人才履历表,形成人力资源大数据,势在必行,时不我待。
参考文献:
[1] 李伟钢,刘桂秋. 科研经费使用与管理体制中角色错位的纠偏[J]. 千人.2014(3): 22-25.
[2] Roberto Pacheco. José Salm Jr. Marcio de Miranda Santos. ST&I Information systems: Brazilian initiatives frequently asked questions – FAQ [EB/OL]. (2011-4)[2014-6-4]. http://www.slidesharenet.org/rpacheco/sti-information-systems-brazilian-initiatives-frequently-asked-questions
[3] 国务院. 国务院关于改进加强中央财政科研项目和资金管理的若干意见国发(2014)11号[Z]. 2014-3-3
[4] 郭德政. 科技信用信息共享面临的问题及对策[J].科技管理研究. 2014,34(10):166-168,181
[5] Jesús Pascual Mena-Chalco, Roberto Marcondes Cesar Junior, ScriptLattes: an open-source knowledge extraction system from the Lattes platform[J]. Journal of the Brazilian Computer Scociety,2009,15(4):31-39
[6] Roberto C. S. Pacheco . The role of Lattes Platform in the Brazilian Innovation System[EB/OL]. [2014-6-4]. http://www.nsf.gov/attachments/123272/public/Agenda03-12web.pdf
[7] Register on Lattes database [EB/OL].[2014-6-4] .https://wwws.cnpq.br/cvlattesweb/pkg_cv_estr.inicio
[8] Buscar Currículo Lattes.[2014-5-15]. http://buscatextual.cnpq.br/buscatextual/busca.do?metodo=apresentar
[9] Roberto C.S. Pacheco, Vinicius Medina Kern, Jose Francisco Salm Jr, ect. Toward CERIF-ScienTI cooperation and interoperability[C]. 8th International Conference on Current Research Information Systems, Enabling Interaction and Quality: Beyond the Hanseatic League, Leuven: Leuven University Press , 2006
[10] Estatisticas da Base de Curriculos da Plataforma Lattes[EB/OL].[2013-12-31)[2014-6-4]. http://estatico.cnpq.br/painelLattes/
[11] scriptLattes: Uma ferramenta para extração e visualização de conhecimento a partir de Currículos[EB/OL].[2014.5-15]. http://scriptlattes.sourceforge.net/
[12] Alexandre Donizeti Alves, Horacia Hideki Yanasse , Nei Yoshihiro Soma. SUCUPIRA: a System for Information Extraction of the Lattes Platform to Identify Academic Social Networks[C]. 6th Iberian Conference on Information Systems and Technologies (CISTI). IEEE, 2011
[13] Alexandre D. Alves, Horacio H. Yanasse, Nei Y. Soma. LattesMiner: a multilingual DSL for information extraction from lattes platform[C]. In Proceedings of SPLASH'11, SPLASH'11 Workshops, New York,2011
[14] Lattes Extrator --- Documentação[EB/OL].[2014-6-4]. http://lattesextrator.cnpq.br/lattesextrator/index.jsp?go=DOCUMENTA
[15] About the ScienTI Network.[2014-6-4] http://www.scienti.net/php/level.php?lang=en&component=19&item=1
[16] 杨国梁, 肖小溪, 李晓轩. 美国STAR METRICS项目及其对我国科技评价的启示[J].科学学与科学技术管理. 2011,32(12):12-17
[17] MATRIZ DE ESCOPO DAS áREAS DE PARCERIAS[EB/OL].[2014-6-16].http://www.cnpq.br/web/guest/parcerias-internacionais
[18] 李明德. 巴西科技体制的发展和研发体系[J]. 拉丁美洲研究. 2004(3):27-32
[19] 李伟钢. 巴西“万人精英”和“科学无疆土”人才计划[OL].(2013-1-21)[2014-6-2]. http://blog.sciencenet.cn/blog-652078-655073.html
[20] 李伟钢. 巴西人才计划与科研管理的技术支持[EB/OL].(2013-1-22)[2014-6-4]. http://blog.sciencenet.cn/blog-652078-655383.html
[21] Denis Arruda, Fábio Bezerra, Vania Almeida Neris, Patricia Rocha De Toro, Jacques Wainera . Brazilian computer science research: Gender and regional distributions[J]. Scientometrics. 2009,79(3): 651-665
[22] Ana Carolina Scarpelli. Fernanda Sardenberg. Daniela Goursand. Saul Martins Paiva. Isabela Almeida Pordeus. Academic Trajectories of Dental Researchers Receiving CNPq’s Productivity Grants[J] Brazilian Dental Journal, 2008,19(3): 252-256
[23] 马费成,刘记. Web2.0环境下的信息构建——对信息构建基本原理的再认识[J].情报学报,2008,27(5):683-690
[24] 专题询问:如何以大数据改善科技管理[EB/OL]. (2013-10-25)[2014-6-16].http://www.npc.gov.cn/npc/xinwen/jdgz/gzjd/2013-10/25/content_1811631.htm
[25] 中国高层次科技人才数据库[EB/OL].[2014-6-16].http://www.istic.ac.cn/Portals/_default/Skins/NewStyle/ServiceList.htm
[26] 关于在国家科技计划管理中建立信用管理制度的决定. 国科发计字〔2004〕225号http://www.most.gov.cn/fggw/zfwj/zfwj2004/200512/t20051214_54891.htm
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 05:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社