||
数据驱动决策 科研管理进入大数据时代
贺飞 北京大学
数据驱动决策,科研管理的大数据时代已经来临。利用数据挖掘技术和分析技术,构建科研管理领域的相关指标体系和模型,为宏观科技决策提供强有力的支持,一直以来是美国宏观科研管理的一个重要理念,美国科学基金会发布的1950年代以来的关于美国和全球科研管理的数据是科研管理研究人员的宝库,值得好好挖掘和借鉴。
近日,美国科学基金会国家科学与工程统计中心(NSF, NCSES)发布了“联邦科学与工程支持高校和非营利机构经费调查”的调查结果。本报告公布的数据是每年通过国会强制美国科学基金会国家科学与工程统计中心的“联邦科学与工程支持高校和非营利机构调查” (简称Federal S&E Support Survey)所收集的。这项调查开始于1963年(最久远的数据是1963财年的),其时联邦科技理事会下属的学术科学与工程委员会(CASE)建立了CASE数据收集系统,并每年报告有关联邦科学与工程(S&E)合同预算支持学术机构连同其联邦资助研发中心(FFRDCs)的情况。自1968年开始,CASE数据和非营利机构相关数据成为每年提交总统和国会年度报告的基础。这一调查设计从联邦部门收集如下信息:(1)总S&E计划支持学术机构,(2) 支持非营利机构的研发和研发设施经费。所有在NSF每年“联邦研发经费调查” (Federal Funds Survey)中报告有高校和非营利机构执行的研发经费的联邦部门都在本调查涵盖中。所公布的数据包括所有高校S&E的合同预算,合同预算包括研发,研发设施,S&E教学设施,S&E奖学金和实习实训,S&E一般资助以及其他S&E活动。这里简要列出期目录以供国内研究者参考,详细目录如下。
表1.高校获得的联邦科学与工程合同预算,按活动类型:FYs 1963–2013
表2.高校获得的联邦科学与工程合同预算,按活动类型和部门: FYs 1963–2013
表3.高校获得的联邦科学与工程合同预算, 按各州和边远地区: FYs 2005–13
表4.获得联邦科学与工程合同预算前100位高校名单,按2013财年获得经费总计排序: FYs 2005–13
表5.国防部资助高校的科学与工程研发合同预算,按活动类型: FYs 1990–2013
表6.高校获得的联邦科学与工程研发合同预算,按各州和边远地区: FYs 2005–13
表7.获得联邦科学与工程研发合同预算前100位高校名单,按2013财年获得总计: FYs 2005–13
表8.高校获得的联邦科学与工程合同预算,按来源部门和活动类型:FY 2013
表9.高校获得的联邦科学与工程合同预算以及机构数量,按各州,边远地区以及活动类型:FY 2013
表10.高校获得的联邦科学与工程合同预算, 按各州,边远地区和来源部门: FY 2013
表11.高校获得联邦奖学金和实习实训合同预算, 按各州,边远地区和来源部门: FY 2013
表12.高校获得的联邦科学与工程合同预算, 按各州,边远地区,机构和活动类型: FY 2013
表13.高校获得的联邦科学与工程合同预算, 按各州,边远地区,机构和来源部门: FY 2013
表14.高校获得联邦科学与工程研发合同预算, 按各州,边远地区,机构和来源部门(AID–DOL): FY 2013
表15.高校获得的联邦科学与工程研发合同预算, 按各州,边远地区,机构和来源部门(DOT–USDA): FY 2013
表16.高校获得联邦研发设施合同预算, 按各州,边远地区,机构和来源部门: FY 2013
表17.获得联邦科学与工程合同预算总量前100位高校名单,按获得经费总量排序,按活动类型: FY 2013
表18.获得联邦科学与工程合同预算总量前100位高校名单,按获得经费总量排序,按来源部门: FY 2013
表19.获得联邦科学与工程研发合同预算前100位高校名单,按获得经费总量排序,按来源部门: FY 2013
表20.获得联邦科学与工程奖学金和实习实训合同预算前100位高校名单,按获得经费总量排序,按来源部门: FY 2013
表21.历史上黑人高校(HBCUs)获得联邦科学与工程合同预算,按2013财年获得经费总量排序: FYs 2005–13
表22.历史上黑人高校(HBCUs)获得联邦科学与工程合同预算,按2013财年获得经费总量排序,按活动类型: FY 2013
表23.历史上黑人高校(HBCUs)获得联邦科学与工程合同预算,按2013财年获得经费总量排序,按来源部门: FY 2013
表24.历史上黑人高校(HBCUs)获得联邦科学与工程研发合同预算,按2013财年获得经费总量排序: FYs 2005–13
表25.历史上黑人高校(HBCUs)获得联邦科学与工程研发合同预算,按获得经费总量排序,按来源部门: FY 2013
表26.高西班牙裔注册高校(HHEIs)获得联邦科学与工程合同预算,按获得经费总量排序,按来源部门: FY 2013
表27.部落高校获得联邦科学与工程合同预算,按获得经费总量排序,按来源部门: FY 2013
表28.高美国印第安人注册高校获得联邦科学与工程合同预算,按获得经费总量排序,按来源部门: FY 2013
表29.少数民族高校获得联邦科学与工程合同预算,按获得经费总量排序,按来源部门: FY 2013
表30.大学系统获得的联邦科学与工程合同预算,按获得经费总量排名,按来源部门:FY 2013
表31.大学系统获得联邦科学与工程研发合同预算,按获得经费总量排名,按来源部门: FY 2013
表32.非营利机构获得联邦科学与工程研发和研发设施合同预算, 按各州,边远地区,机构和来源部门: FY 2013
表33.获得联邦科学与工程研发和研发设施合同预算排名前100位的非营利机构,按2013财年获得经费总量排名: FYs 2005–13
表34.非营利机构获得联邦科学与工程研发和研发设施合同预算, 按获得经费总量排名, 按来源部门: FY 2013
表35.机构联盟获得的联邦科学与工程合同预算: FYs 2005–13
表36.机构联盟获得的联邦科学与工程合同预算, 按活动类型: FY 2013
表37.机构联盟获得的联邦科学与工程合同预算, 按来源部门: FY 2013
美国的宏观科研管理决策越来越多地运用数据挖掘提供决策支持。美国科学基金会下属的国家科学与工程统计中心(以下简称NCSES)十分注重将数据转型为决策支持,为国会和总统、各级政府部门、高校和非营利机构提供决策数据支持。NCSES的前身是美国科学基金会下属的科学资源统计部,是美国科学基金会根据《美国竞争再授权法案2010》(America COMPETES Reauthorization Act of 2010)的Section 505成立的。国会强制要求其为从业人员、研究人员、决策者和公众提供有用的信息。从NCSES的名字就可以看出其主要负责收集、解读、分析和发布有关科学与工程的客观统计数据。
1950年《科学基金会法案》(修订)要求科学基金会(NSF)启动并维持用于科学与工程研究总经费的统计计划,包括用于科研设施建设的经费,范围包括全美每一个教育机构和适当的非营利组织根据项目合同或其他安排从联邦政府机构所获取的经费,并且每年向总统和国会报告。为完成这一任务科学基金会的国家科学与工程统计中心(NCSES)使用由联邦科技理事会下属的学术科学与工程委员会最初设计的数据收集系统。通过其“联邦科学与工程支持高校和非营利机构调查”,NCSES每年收集来自19个联邦机构的统计数据,几乎涵盖了所有支持高校科学与工程研发的经费。此外,还收集了这些机构用于非营利机构的合同预算(obligations)。一个基于网页的数据收集系统被用来收集“联邦S&E支持调查”数据。这一基于网页的数据收集系统是NCSES加强调查报告的工作的一部分,大大降低数据收集和处理成本,为被调查对象提供直接的在线报告和编辑。由于“联邦S&E支持调查”的数据是用电子格式收集的,没有纸质工具。每一单位的调查对象提交数据都是类似的数据输入界面。界面根据提交高校还是非营利机构数据略有变化。支持类别的界面也随着国防和非国防部门略有变化。建立Mock调查工具来显示需要调查对象提交什么信息。自启动以来,这项调查成为联邦经费支持各个机构科学与工程活动的唯一数据来源,因此其结果引起了广泛关注。这些数据可以为用户提供随时间变化的各机构所获支持模式的动态信息,并可同其他机构进行比较。NCSES每年发布超过30个的详细调查结果的报告,其中著名的有定期提交美国国家科学理事会(National Science Board)的有关美国和国际科学与工程发展态势的《科学与工程指标》(每两年一次)、关注弱势群体教育和就业的《妇女、少数民族和弱势群体从事科学与工程状况》等。
NCSES的核心使命是收集有关美国国家竞争力和STEM教育的数据,其主要统计业务涵盖了研发、科学与工程劳动力、美国在科学、工程、技术与研发的竞争力以及美国STEM教育的现状和进展等方面的数据统计。作为美国13家官方统计机构之一,NCSES设计、支持和指导了许多定期的国家级统计调查,并承担了许多其他数据收集和研究的任务。其核心工作任务包括:收集、获取、分析、报告和发布美国和其他国家的统计数据;对其数据利用的研究支持;相关统计工作的方法研究;以及对使用这些大尺度国家级代表数据集的研究人员进行培训等。NCSES利用其开发的数据工具和其他数据资源向公众公开其各类统计数据。这里简要介绍一下其数据工具:
SESTAT(科学与工程统计数据系统)是一个有关美国受过高等教育的科学与工程劳动力的教育和就业统计数据的报表生成工具。这一系统中的数据整合了NSF的以下三大调查自1993年以来的调查结果:“高校毕业生国家调查”、“近期高校毕业生国家调查”以及“博士学位获得者调查”等。
WebCASPAR (整合科学与工程资源数据系统)是一个关于美国学术机构学术科学与工程资源数据的报表生成工具。数据来自科学基金会(NSF)的6大调查和美国国家教育统计中心(NCES)4大调查1966年至今的统计数据。NSF的6大调查包括:“获得博士学位调查”、“联邦研发经费调查”、“联邦科学与工程支持高校和非营利机构经费调查”、“高校研发调查”、“科学与工程研究设施调查”以及“从事科学与工程的研究生和博士后调查”等。NCES的4大调查是:“整合高等教育数据系统普查”(Integrated Postsecondary Education Data System (IPEDS) Completions Survey)、“IPEDS在校生调查”、“IPEDS院校特征调查学费数据、“IPEDS 薪酬、Tenure和附加福利调查”等。
SED表格引擎是一个关于获得博士学位调查的选择变量和WebCASPAR 的补充数据的表格生成工具。表格引擎包括一个防止涉密敏感数据发布的披露控制机制,以保护在利用性别、国籍和族裔等变量时识别出调查对象。涵盖了2006年以来的数据。
公共数据文件是一种提供给公众利用的微观数据文件,不含任何个人识别信息。公共数据文件在以下调查中存在:联邦资助研发中心(FFRDC)研发调查、高校研发调查(HERD)、高校毕业生国家调查、博士学位获得者调查以及从事科学与工程的研究生和博士后调查等,所有这些文件均已SAS格式提供。GSS的数据文件还提供Excel格式的。SESTAT调查的数据涵盖1993年至今。
美国的宏观科研管理实践给我们的一个有益的启示就是,数据是构建科学决策体系的基石,数据驱动决策能有效地提高决策效率和效能。一个单位乃至一个国家的公共数据收集与提供在其科研管理中十分重要,要维护科研的领导地位,不仅需要杰出的教师,也需要杰出的行政人员,更需要高质量的数据和科学的决策。杰出的行政人员通过定期收集、分析、综合和发布数据,将数据转化为决策,为各级决策者的科学决策提供支持,发挥着不可替代的重要作用。
参考文献:National Science Foundation, National Center for Science and Engineering Statistics. 2015. Federal Science and Engineering Support to Universities, Colleges, and Nonprofit Institutions: FY 2013. Detailed Statistical Tables NSF 15-327. Arlington, VA. Available at http://www.nsf.gov/statistics/2015/nsf15327/.
( 转载请注明出处)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 19:05
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社