|
写在前面:
现把这个研究计划公开,就像我之前所挂在这里的文章一样,希望碰到有缘人,抓紧实施。着急也没用。以前,我是真的着急,现在就好多了,因为我突然意识到了一点:到一定时候,总会有人去做相应的事儿,只是针对不同的可能实施的人、地点等有不同的发生概率。但我自己也得努力,因为努力了才能使一些事发生的概率更大一些。
1. 笔者充分尊重历史,并基本认同现行的评价方法。
2. 笔者认为有必要改进现行评价方法。
3. 笔者充分认识到提出方法和将其付诸实施的距离,所以这里仅做分析与研究,以期提供科研评价改进方法的备选方案之一。
4. 本研究仅针对工程类科学研究,故正文中所提及“科研”一词,不做特殊说明时仅针对工程类科学研究。
5. 该研究为高度交叉学科研究,笔者请求关注的人组织相关学科队伍共同攻关。
6. 当前内容为核心内容版,主要包括:问题识别与分析、研究内容与规划、研究方法与目标。
建立新的工程类科研评价方法
——基于知识链的评价方法研究
(核心内容版)
目 录
一、 研究背景与问题陈述
1.1 科研实力的重要性
1.2 资源分配决定科研产出
1.3 现行科研评价方法简述及其问题
1.3.1科研评价方法研究现状
1.3.2现行科研评价方法——以某一典型评价过程为例
1.3.3问题及其弊端
二、研究内容(核心内容)
2.1 总体思路与原则
2.2 具体研究内容
2.2.1 学术文本的自然语言处理方法研究
2.2.2 全网络知识点识别方法研究
2.2.3 特定研究领域知识链建立方法研究
2.2.4 区块链在知识链建立中的方法研究
2.2.5 知识链大数据构建与使用方法研究
2.2.6 基于知识链数据库的科研成果与科研人的评价方法研究
三、项目目标与实施方案(核心内容)
3.1目标
3.2 实施方案
3.2.1项目可行性总体论证
3.2.2项目实施总体步骤
摘要: 2020年以来,教育部、科技部、基金委、中科院等重要部委与科研机构均出台相关指导政策,指出现行科研评价方法的相关弊端,相继提出“破四唯”、“破五唯”等理念,并积极倡导针对科研成果与科研人的新的评价方法研究。为此,基于申请人十余年的科研经验及多年的相关反思,提出基于知识链的科研评价方法,提出运用自然语言处理、大数据挖掘以及区块链的方法,配合各学科一线科研人员的参与,以期逐步梳理出相关领域的知识点链条,以此确立评价学术成果及科研工作者的基准。本研究成果有望减少科研评审中的信息不对称,并逐步改变由此所引发的“人情关系化信息对称”的现象;将成为科研评审中重要的客观信息支撑,为创造更加客观公正,服众的科研评价提供有力保障,进而更加优化科研资源分配,提高国家科研产出。不仅如此,本研究也将促进国家级知识库的建立,具有很深远的战略意义。
2020年以来,教育部、科技部等相关部委针对科研成果与科研人评价方面,相继提出了“去四唯”(唯论文、唯职称、唯学历、唯奖项),去五唯(唯学历、唯资历、唯“帽子”、唯论文、唯项目)等指导性的政策,并在各大重点高校针对建立新的科研评价方法广泛征求意见。与此同时,就在最近,为贯彻落实中共中央办公厅、国务院办公厅《关于进一步弘扬科学家精神加强作风和学风建设的意见》,严肃处理科技活动评审工作中的请托行为,近日,科技部印发实施了《科学技术活动评审工作中请托行为处理规定(试行)》,明确指出走人情关系评审的弊病,一经发现,立即追究相关责任人。
此外,科技部在发布的国科提案监〔2020〕第50号文件里针对黄力委员所做的“关于确立目标导向的科研项目评价体系的提案”的答复里有如下陈述:“在项目评审方面,通过完善评审指标、推广“小同行”评议、增加评审准备时间等方面,优化立项评审工作。避免在评审中,特别是评审时间紧的情况下,“大同行”专家或者外行专家简单通过数论文、论影响因子高低来评判项目好坏的情况。”这些国家层面的近期举措一方面说明现行科研评价方法需要进行较大的优化调整,另一方面也说明新的科研评价方法依然有待研究提出。
在提出针对科研评价方法的研究计划之前,这里先仔细分析一下科研评价方法的重要性,以及现行科研评价方法现状与所面临的挑战。
二、研究背景与问题陈述
1.1 科研实力决定国家实力
一个国家的制造工具的能力基本决定了其基础实力,制造工具需要研究自然界的基本运行规律以及在生产过程中的人类行为的规律,这些基于客观规律研究的知识点需要相应的科学研究来给出,所以科研,作为知识点的输出行为,是国家实力的基础性支撑。这一论点有众多事实支撑,宏观上看,在历史上首先创立现代科研方法并付诸实践的欧洲各国是最早工业化的国家,制造业也是最强的,现今世界的格局也依然取决于当年的几次工业革命;而且直到现在,综合国力强的国家人均R&D投入都很高;微观上看,芯片的加工制造当下是炙手可热的话题,小小的芯片是高端制造的典型代表,它的加工需要前期大量的技术积累与研发,科研在其中的作用不言而喻。
1.2 资源分配决定科研产出
科研产出即人们通过科学研究活动所发现或创造的新的知识点,它的发生需要如下几个条件:a,有资格完成相应项目的人;b,供从事研究的场所;c,研究所用的资金。相对于科研执行人,后两部分统称为科研所用的资源。从中可以看出,对于工程类科研——所需硬件与耗材比较高的领域,没有科研资源的独立的科研人们是很难有所产出的。所以,科研资源如何分配,能否及时地分配到真正有能力的人手中,决定了国家的整体科研产出。
1.3 现行科研评价方法简述及其问题
1.3.1科研评价方法研究现状
如前所述,科研行为在我国历史上(可以说20世纪之前)是几乎没有的,所以我国对其研究极少。改革开放四十年来,科研行为大量发生,对其评价方法的研究也多了起来,但主要是从纯管理的视角来看的,而且很少有真正一线的工程类科研人员参与。单就管理方法或许不需要一线科研人员参与,但是对于评价方法则必定需要一线科研人员的参与,因为评价是切实针对研究内容的,不懂研究内容的人很难进行有针对性的设计。
早年的科研评价研究主要由科学学与情报学的学者完成,如国内的《科学管理研究》杂志,其最早收录于知网的文章起于1981年,主要报道科研管理方法、科研评价体制、科学研究内涵等研究文章。早在1980年代,就有定量化考核科研人员的方法的提出,但对于评价方法则很少有提及。当时,一个叫何博传的学者介绍了一种由苏联人提出的针对自然科学研究成果评价的一种方法,并指出日本科技厅把“开发评价有关新技术的定量方法”列为“软科学”,并预测希望到1990年代解决这个问题。
80年代中后期,南京大学物理学龚昌德提出了SCI论文作为考核教师水平的重要指标之一,随后中国科技信息研究所每年年底公布上一年的相关统计数据,并编制《中国科技论文统计》,SCI论文指标迅速成为全国科研院所的重要评价标准。直到今年,教育部与科技部两部联合发文要破除“SCI至上”,接着提出破四维、破五维等。从SCI论文在科研评价中的地位变化便可以看出我国在科研成果评价方法的不断探索,同时说明了相关体系与方法的不成熟。
今年,两部联合发文之后,对其评价呈现两极分化,称快的表示终于不受论文束缚,不满的表示要继续与国际接轨,但在这两级之间更多的是疑惑的人,疑惑者则纷纷问道,破除了旧的,请问新的评价方法呢?知名公众号“知识分子”发表了一篇题为“重塑科研评价体系,能纠正中国的论文造假乱象吗?”,里面略微阐述了目前的形势以及所面临的问题,但也没有给出新评价方案的任何端倪,但在这篇文章下面的评论中却可以看到科研人的部分心声,现列举典型评论如下:
“请问这么多年过去了,虽然中国高被引论文增加了,但真正有价值的又有多少?国外那些真正有用的论文又有多少是在高影响因子期刊上发表的?说到底还是之前的导向问题,指向虚的、没啥真正价值的指标体系。”
“不唯SCI是对的,但是打倒SCI并且不给出新的评价体系。导致的结果就是领导说了算。 其实高水平文章是国际通行的评价方法,不能一杆子打死。”
“先要有新的指导方案,想到这个打这个,想到那个打那个,“纠错”了半天却没想清楚什么是“对”,那这“纠错”最终会成为应对舆论压力的一种“交代”。”
“不唯论文论?那就是唯关系论呗”
“明显不能!人情社会,相关评审,还包括帽子和重点项目只会恶化这个趋势”
这些评论虽然只是路人之语,但着实道出了大部分科研人的心声,破除了旧的,新的呢?或者说到底该如何更加客观公正的来评价科研成果与科研人?能不能提出一种方案和方法可以服众,让评上去的人私下被人称道,让评下去的人心服口服,回去再努力提高。这到底是一厢情愿的理想化的,不切实际的幻想,还是可以拿出付诸实际的行动方案?是与不是,能与不能,这,不正是需要切实研究的地方么?
当然,除了SCI论文的方法,国内学者也有提出了其他可能的方案,如北京理工大学的冯长根提出了“一种自然而然的科技成果评价方法”,其实质是依靠学者在文章中自觉地给出的评论句来梳理“知识链”。“知识链”的概念是很好的,但其所提出的行成这一链条的方法是要靠相关学科学者自己在一些文章中主动给出的陈述句,该方法强烈依赖学者自身,不是就学术文章内容本身给出的,难以建立真正的知识链条。
1.3.2现行科研评价方法——以某一典型评价过程为例
现以一个典型的科研评价实例来更加具体地描述现行科研评价方法。评价具体的科研成果与某个科研人员虽然有一定差别,但归根结底都是对科研内容的评价,现举典型评价科研人员的案例如下:
被评审人需要首先写好文本并提交,文本一般被送到同行(小同行或大同行)进行赛选,之后去面试答辩。面试时一般是大同行,面试总时间一般不超过四十分钟,陈述内容一般二十分钟左右,剩余十五分钟左右回答提问,然后由现场专家投票给出最终结果。
这就是目前典型的评价过程,目前多采取专家文本评审与面试答辩相结合的方法。有两个事实需要提前交代如下:a,现如今的学科分支研究点非常细致,真正的小同行不多,一般出于竞争等原因,不优先出现于整个评价过程中;b,随着知识点的爆炸式扩张,想要完全理解同一学科内的研究内容尚且不易,更别提由学科外的大同行去执行评价了。
1.3.3问题及其弊端
评价,归根结底在于打破评委与被评审人信息不对称。试想,如果信息完全对称,那评价排名还不是自然而然的事儿,之所以采用所谓“专家”评审的方式,正是为了帮助资助方(出资源的一方往往不懂被评审人的研究内容,形成了巨大的信息不对称)打破这种信息不对称,因为背后的假设是:专家应该懂得更多,起码在某个领域非常精通,应该不会形成信息不对称。这个假设是没有问题的,但在实际执行时面临如下难以克服的挑战:
(1) 基于文本评价的破除信息不对称的成本很高
文字本来就是所有信息传递形式中(声音、图片等)效率较低的一种,因为它在信息处理上,相对图片和视频等,需要接收者投入更大的精力去理解,不仅如此,评价一个本子,尤其是一个跟自己不在一个研究领域的本子,实际上需要非常仔细的阅读,并做大量的相关文献调研才能真正理解;当然,同在一个小的分支研究领域能一眼看出优劣,但如上所述,真正的小同行很难选到,而且由于竞争关系,很多还需要避嫌。然而,当下的科研生活人人都不轻松,去花费几天时间来评价一个不那么熟悉的领域,阅读大量文献再来评价手上的本子,这是很难办到的事。另一方面,一个本子往往涉及方方面面的知识,如果不在同一个研究领域,很难短时间补充相关知识,比如做导线的要去补充电容,电感的知识,虽然相关,但也要花费相当长的时间去温习旧知识,补足文献中的最新知识,而这分明都需要评审人投入大量精力,即付出比较高的成本。此时,可以理想化的假设专家们都非常负责,都能在近乎完美人格的假设下做事,但历史的经验以及管理学的知识告诉我们的是,凡是执行成本很高的行为,其发生的概率就会大幅降低。管理学和组织行为学上很明确的知识点是,不可能用所谓道德标准去要求活生生的人的切实行为。
(2) 学科分支越来越细,依赖某个或某几个个体的专家难以打破信息不对称
在当下的时代,工程应用类科研占了非常高的比例,基础物理与数学的研究也在前进,但相比20世纪上半页要逊色很多。从人类科技史的经验上看,一些重要理论的发现和提出之后都伴随着较长时段的工程技术类研究去消化,去应用,然后随着技术的提升,利用新工具发现探索了更多新物理现象,再提出新理论,如17世纪经典力学的发现和提出到20世纪量子物理的发现,这是一种循环上升的路径,我们目前处于相对论与量子物理等新理论之后的技术提升期,所以工程应用类研究比例很高,研究分支也越来越细;此外,现在也是信息传递的极速时代,物质传递的高速时代,这些都极大的推动了科研的发展,可以用科研爆炸式增长来形容当下的进展。近二十年,全世界科研论文总数以指数的形式在增长。研究分支变细,研究成果越来越多,客观上都导致个别几个专业人员很难真正懂得被评审人的研究内容以及在科研界所处的研究位置。
(3) 面试时间普遍非常短,大同行无法充分考察被评审人;即便时间延长,大同行也难以短时间内评判被评审人的研究内容的国际地位。
阅读文本尚且存在如上所述的困难,面试的评判就更不用提了。面试为了避嫌,基本采用大同行评审制,而且按照目前的惯例,答辩时间都很短(一般情况下,真正问答时间不会超过半小时),而且鉴于避免信息泄露的关系,在大多数省市地方级的评审中,评审人在面试答辩之前无法获得被评审研究内容的任何资料,所以具体面试答辩时就是这样的情况,几个大同行,新鲜拿到被评审人的资料,对其具体研究内容基本不可能在短短二十分钟左右弄懂,听听被评审人的报告,顺便翻翻被评审人所提交的资料;由于不懂被评审人的具体研究内容,问答环节也无法提出实质性问题,草草问几个问题,就基本答辩结束了。
(4) 人情关系等的诱惑
以上分析给出了现在的评审方法很难就科研内容上打破评审人与被评审人的信息不对称,但是需要强调的是,一个评审过程的发生就是伴随着打破信息不对称这一过程发生的,也就是说,任何一个评审的发生都伴随着信息不对称的打破,这种“打破”可以是针对科研内容的,也可以是针对其他内容的。很明显的是,一个客观公正,服众的评审,最好是基于前者的,然而,如上所述,目前这一点比较难办到,所以评审人不得不基于“其他内容”或多或少地打破信息不对称。这一“其他内容”可以是被评审人与评审人的熟悉程度,可以是被评审人提交的资料里的某某奖项、某某论文所发表的知名期刊不能,甚至可以是其他任何能辅助被评审人理解的其他内容。总之,信息不对称一定要在评审中被“打破”,但针对什么打破,那就依具体实施方法和路径,以及评审人而异了。既然针对客观的科研内容不容易打破,那此时中国特色的“人情关系”便非常自然而然地介入了。这里我们需要花一些篇幅来简要阐述中国的人情关系。
人情关系的研究在中国社会学里已经有很多年的历史了,国际上甚至专门发明了一个专有名词,“guanxi”来应对中国的这一社会现象。针对这一特色行为的分析,社会学界,从费孝通到杨国枢,再到翟学伟均做出了一定程度的理论分析,这里不详述他们的研究结论。结合他们的研究,首先应指出的是,人情关系是根植于我国古代宗亲文化、土地文化体系的,它是一件基于历史的自然而然的事情,任何中国人都具备发动这一行为或现象的潜质(只要他/她是出生并在幼年生长于中国);某种意义上可以这样比喻,人情关系行为就像一段计算机程序预先考录到计算机芯片里一样。它本身没有好与坏的分别,这只是一个行为特点而已,而且懂得尊重历史的人,都会懂得尊重这一现象。它有一系列的衍生行为现象,包括酒文化,熟人文化等等。它深深埋在中国人的行为系统里,是不可或缺的一部分,它的深刻改变仅发生于改革开放这中国经济行为大变迁的四十年里。
以上阐述了“人情关系”的客观性,如上所述,既然针对科研内容很难打破信息不对称,那“人情关系”自然而然地就出现了并能起到很好的打破信息不对称的作用,因为似乎再没有比跟被评审人“熟”这一存在,能更好的实现信息对称了,他/她跟我“熟”,那么他/她的研究内容岂不是也“熟”了。
当然,如上所述,除了“人情关系”,其他能打破信息不对称的内容也算数的,如是否发表于顶级期刊(因为顶级期刊辅助评审人打破信息不对称),是否高影响因子,是否高被引,是否获奖等等,不一而足。相对于“人情关系”,这些多多少少还可以被算作是辅助评判,尽管是间接性的。然而,很显然,这也是不能针对科研内容本身进行评价之后的选项。
以上分析了在实际执行当下评价方法时,所造成的评审人难以针对被评审人科研内容进行评判的主要挑战,下面分析其所带来的主要弊端或者危害:
(1) 次要标签或标准替代专业内容打破信息不对称
这些次要标签包括,与被评审人的熟悉程度,被评审人发表的文章,期刊,影响因子,奖项等等,需要声明的是,这些不是全然无用,但相对科研内容本身来说,没那么重要。然而,如果长期不以科研实质内容作为评价标准,就会导致这些次要因素变为主导因素。所带起来的导向便是,科研人不必十分在意科研内容的精进,要与所有可能的评审人处理人情关系,琢磨如何跟踪热点赶紧发高影响因子的文章,罗列组织资料拿到各种奖项。如若不然,拿到科研资源的概率就会大大降低。需要指出的是,这样也并非完全不好,在改革开放初期,整个国家处于全方位追赶,学习西方的时候,这样其实也是足够完成任务的,然而,如果是要求科研人真正创新,要在西方封堵下切实解决前沿问题,那么这样则相当不利。因为这样就对一个科研人要求很高,他/她既要精进于本领域的科研工作(实际上这个需要占用科研人大部分精力),还要处理与维护各种关系(而且这个更重要)等等。当然,如果周旋于人情关系的技巧能够切实辅助科研工作,那岂不是很好,这种要求反而增进了科研人的全方位能力,然而,众所周知,人类的能力似乎并不是这样,存在大量的不苟言笑,“不会”说话,“不懂”送礼的老实科研人,这些人往往很有想法和科研实践能力。即便是没有科研的中国古代,大多数知名学者也都是这样的。所以,这种要求几乎是不切实际的。或者说,科研人应该还是以科研能力为绝对主要的,其他能力应该是次要的。绝大多数科研人也不会领导上百人的团队,不需要所谓那么高的“情商”去处理问题。他只要能带领十几个人切实做好本领域的科研即可。
(2) 评审结果的随机化
既然很难针对科研内容进行评价,那即便评审人非常客观公正,他也很难处理这种评审,在这种评审人客观公正的假设下,依然会出现评审结果随机化的现象,也就是说跟抽签差不多。
(3) 评审难以服众
以上种种困难以及相关导致的后果最终会逐渐导致一个严重的现象:评审难以服众。评上的人根本起不到带头作用,甚至起反作用。论语里说“举直错诸枉,能使枉者直”,实际上,举枉错诸直,也能起到把直带到枉的作用,因为追逐资源是人的本能,什么方法奏效,便用什么方法,这是自然而然的事情。难以服众,则很难聚集人心,很难长期聚揽人才。
(4) 科研资源不能更加合理地分配
最终导致的结果便是科研资源不能很合理的分配到真正做事的人手上,这一后果短期内看不出所导致的危害,要很长期才会看得出来,具有很强的隐蔽性。资源错配在各行各业都是比较严重的问题,在科研界也是一样。
此外,不仅针对科研成果和科研人的评价方法很重要,针对科研项目的过程与研究成果的评价与管理也很重要,因为科研资源最终是以科研项目的形式分配,过程管理与事后评价将进一步优化科研资源分配,但由于要保持研究领域的集中度,本研究仅针对科研成果与科研人的评价方法,针对科研项目过程管理与事后评价的方法研究将在后续提出。
综上,由于缺乏一套针对科研内容本身进行评价的切实可执行的行为办法,在科研评价与科研资源分配方面已经引起了一些问题。科研评价体制就像是一把筛子,评价执行方法就是那筛子里的横竖杠杠,它非常关键,能够筛出相对应的人。那么到底我们需要怎样设计这把筛子呢?
二、研究内容
2.1 总体思路与原则
我们要回答一个问题,到底能不能提出一种方法来主要针对科研内容本身进行评判?这个在非电子信息时代是几乎不可能的事,因为根本无法有效整理搜集所有信息,但是在电子信息时代,在5G信息极速传输时代,在全世界互通互联,基本相互信息开放的时代,这是非常有可能的。虽然科研分支越来越细,但只要有数据库,愿意花时间整理,在科研内容上打破信息不对称是可行的。在假设数据库可得的情况下,这里面的核心挑战是时间成本,和一定量的专业理解的投入。信息传输与处理很快,但由于信息量也变大,所以必须借助新的计算机辅助工具与算法来克服相应的问题。
总体研究设计如下:(1)利用自然语言处理(NLP)或者文本挖掘(Text Mining)的有力工具,研究自动化提取工程类科研知识点的方法,该提取过程既面向期刊数据库,也面向整体网络。(2)随后研究知识点链接的方法,考虑到科研都是前后继承的,应该存在一种建立知识链的方法。(3)再用区块链技术锁定保存相关知识链,保证不会被轻易改动。(4)与此同时研究存储工程类知识的数据库构建方法,这不仅包括知识点,也包括相对应的科研人员信息存储。(5)最后基于知识链数据库研究评价特定科研成果与科研人的方法。
该研究不仅可以促进评价方法的客观公正化,更可以作为国家重要情报统计信息,对于技术信息的大数据统计对于国家掌握技术发展的真实情况至关重要。未来,国家可以出具相应的数据统计库,任何人都可以查询,这样就可以很方便的打破各种信息不对称,如在技术融资中投资人与技术方的信息不对称,促进社会整体的良性竞争。
2.2 具体研究内容
2.2.1 学术文本的自然语言处理方法研究
自然语言处理是人工智能领域处理文字符号的重要分支,近些年取得了实质性的进展,能够自动识别与挖掘相应的文本内容。在学术文本处理方面,之前多见于用于处理生物信息学领域所发表的文章,因为要自动获取其中大量的生物学研究数据及相关信息。在处理工程应用类学术文章的研究还不多见,但其处理文本的能力已经得到了验证。另外,鉴于所有学术文章的写作格式基本固定,而且所采用的语言风格都比较一致,工程类学术文章的文本挖掘应该在目前自然语言处理技术的承受范围之内。
需要研究采用自然语言处理技术如何高效地从工程应用类学术文章中提取每篇文章的核心贡献点,比如某篇学术工作的核心知识点是在某一特定领域某项功能的提升,提出新的制备方法,还是其他等等。这将是一项交叉学科研究,需要相应分支领域的一线工程科研人员与计算机专业人员共同完成。
2.2.2 全网络知识点识别方法研究
在某些情况下,如某个公司或其他单位已经提出或发布了某项技术,但并没有将其发表于学术性文章中,虽然其具体构成未知,但这个信息点依然在评判中是有用的,这样的隐藏于网络中的相关信息也要被捕捉到,并进行汇总。也需要自然语言处理以及网络搜索技术给与支撑。
2.2.3 特定研究领域知识链建立方法研究
在完成上述两项研究之后,我们不仅要搜集知识点,还要将独立的知识点串起来,需要研究如何将知识点形成知识链的方法。该知识链可以是单线的,也可以是多线分支的,要根据具体的研究领域而定。同样的,该研究的执行也要相应的一线工程应用科研人员与计算机专业人士共同完成。
2.2.4 区块链在知识链建立中的方法研究
区块链是一种去中心化分布式记录技术,有着保证信息不被随意更改的属性。知识链建立完毕后,在使用时依然要人为的参与,为了保证知识链的公正性,知识链不能被随意在不知情的情况下被改动。此时需要研究如何采用区块链的方法来处理与保存上述的知识链信息。
2.2.5 知识链大数据构建与使用方法研究
当下属于知识点大爆炸的年代,每年仅我国发表的SCI论文就有超过50万篇之多,各个学科领域也越来越多,所以可以预见,如果上述的方法可行,将获得大量的知识链数据,如何有效保存,调用,管理这些知识链数据;应该采用什么样的数据结构等等都要进行仔细的研究。最终建成知识点大数据库。
2.2.6 基于知识链数据库的科研成果与科研人的评价方法研究
在针对某个研究领域建立了知识链数据库之后,还要研究如何使用这些数据去评判某个科研成果及科研人。尽管在该数据库的基础之上,针对科研成果的信息不对称客观上基本被打破了,但依然需要研究如何确定其与过往知识链的关系,如何判定其学术新颖性与重要性,或应用新颖性与重要性,只有这样才能基本评定不同科研成果的高下。针对不同科研人,单就其科研成果,结合已有的数据库可以给出其个人的科研路径和不同成果的新颖性,重要性,以及成果间的关系。以此作为评判某个科研人的数据基石。
三、项目目标与实施方案
3.1目标
(1)提出基于信息处理技术的提取工程类科研知识链的方法,并构建相关领域知识链。
(2)提出构建知识链数据库的方法,并建立相关领域知识链数据库。
(3)提出基于知识链数据库的针对某项科研成果与某个科研人的评价办法。
3.2 实施方案(梗概)
3.2.1项目可行性总体论证
该项目理论上可行,具体执行上要基于现有的自然语言处理技术以及一线科研人员一起配合论证其可行性,需要召开相关领域专业人士的项目论证会。工程类科研领域繁多,可以先从几个研究领域入手验证其实际操作中的可行性。技术上一旦可行,剩下就要从一个一个研究领域入手,逐步建立相应的知识链体系以及相关数据库。
3.2.2 项目实施总体步骤
项目实施时分三大阶段,一是预研阶段,主要研究如何通过自然语言处理的方法处理工程类学术文本,以及在若干个小的工程分支领域研究整合知识点的方法;二是主体攻关阶段,更详尽的在多个工程分支研究领域建立知识链,并基于此开展针对某个科研内容与科研人的评价方法研究;三是数据库建立与评价方法的完善阶段,针对众多知识链建立数据库并研究存储与检索方法,同时应用这个知识库进行科研成果评价并根据实际应用中所反馈的问题优化前期建立的评价方法。具体执行流程上,请参考研究内容2.2部分,逐步实施。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 03:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社