学:学生,教:教师,李:李晓榕。
教:我有个困惑,涉及您说的第四要素——评价。哪个方法好,解的评估没有一个统一的标准或规则。有时自己搞出一个方法,心里没底,到底这个方法好不好。
李:评估主要看重要性、价值、新颖程度等。 谈选题时说过,重要性取决于影响程度 ,所以,评价一个研究成果的重要性关键在于看它的影响会有多大 。价值与重要性大同小异,但它更着眼于需求而非影响,因而有“ 需求度量价值 ”(demand is the measure of value)之说,它也更重视结果带来的益处。所以,重要性更客观,价值更主观。 对于你的问题,我想分两种情况说。一种情况是评估的目的明确,也就是被评估对象的用途比较明确,那么,正如早先所强调的,目标是迷雾中的灯塔 。评估应着眼于被评估对象对达到目标的作用有多大,对用途价值有多高。另一种情况是被评估对象适用面广,评估时其用途不明确。换言之,评估并不针对某种特殊的用途,而是考虑众多可能的用途。这时,更能判断好坏的是定性的东西。每一个定性结果实际上都是大量定量结果的浓缩 。定性比定量更本质,从道理上感觉好,更能说服人。一般有三方面:直观说服力有多大,多么简单,以及应用有多重要和广泛。不过,定性研究很不容易。 这使我想起东西方的主要差别之一:近代西方强调与结果一致,而中国传统看重与心相合 。所以在传统中国,情高于理:“近情”比“合理”要紧。一个人心里认定的东西是大量信息、经验、知识等等的汇总、凝聚和浓缩。借用递推滤波的术语,看重与心相合类似于看重与预报吻合,而看重与结果一致好比看重与当前的数据一致。所以,东西方所用的滤波增益(即权重)不同,它们分别更看重以往的经验(预报)和当前的数据。
性能评估依赖于性能尺码。其研究的主要任务之一是研究这些尺码,评价它们的好坏。这主要靠定性评判,也涉及你说的这个问题,而且更头疼。我在做这方面研究时,也曾为此苦恼过,后来想通了:正是因为世界五花八门、千奇百怪,天差地别,生活才丰富而有意义。科学追求简易,所以科研人员总希望世界是简单的,能够完全被简单的科学规律所刻画,从而便于发现这些规律。事与愿违,人类在追求科学真理中的重重困难,也反映了科学的种种局限性。其实,假如世界真的完全满足简单的科学规律,那才是宇宙的堕落,人类的悲哀 。
我有个学生做性能评估方面的研究,得出一个结论,非常片面。我点破说:这相当于选美只看身高,不考虑其他。对美的评估,是一佳例。美难以度量,它有方方面面。尽管如此,我们还是有相当一致的看法。这只能定性说明。再如,如何评价一个人的生命价值?这很难定量,但往往可以大致地、定性地说。
教:要是真的进行生命价值比较,你自认为你的生命很有意义,别人觉得没有意义的话,那还是没意义。做科研也一样,大家普遍认为你这个东西不行,那么它就没有意义。
李:假设必须二选一,一种情况是我觉得很有意义,别人不以为然,另一种正好相反。如果说的是我的生命,我肯定选第一种,对于科研过程,我还是会选第一种,但对于科研成果,我选第二种。区别很清楚:科研成果的意义和价值取决于它的影响,而我的生命和科研过程,如果我不享受,那意义何在?它们还是我的吗?难道要为别人活着,为别人做科研?话说回来,你的想法是典型的中国传统观念,它把有无价值、有无意义完全放在与他人的关系中。西方比较强调独立个体,价值不太取决于与他人的关系。中国关注人与人的关系,西方重视人与物的关系,印度看重人与神的关系。这三种文化是分别建立在对人、对物、对神的思考上的。所以中国伦理发达,西方科学昌盛,印度宗教繁荣。有人说,人生的目的在于追求幸福。真正的幸福应该是一种满足心态,不该与他人有多大关系。但人们总喜欢攀比,自寻烦恼,所以孔子说,人不患贫,患不均。
学:一个人善于舞刀,另一个善于弄棒,如何评价他们谁的武艺更高强?我想只能让他们对打。
李:再说一遍,
评估时要牢记目的、用途。抓住这个“纲”,才能“纲举目张”。
如果习武的目的是健身,那么对打明显不好,如果是为了取胜,那不错。对于科研成果的评估,确实也不妨采用对打的形式。比如,在统计学,估计性能的评估就有所谓“皮氏接近度”(Pitman’s closeness measure),它就是基于统计两个估计器多次“匹尅”(PK) 的胜败结果,我们的研究对此有所发展。我还有不少这方面的性能评估思想,值得研究探讨。
教:把PK翻译成“匹尅”,我是第一次见到。“匹”含有“配对、成对”之义,而“尅”的意思是“战胜、制服”。既是音译,又是意译,真是音义俱佳。这是您的首创吗?
李:谢谢。这是我独自想到的译名,不知是否首创。当前有些人喜欢在汉语中夹带英语,长此以往,对汉语的发展大为不利。我们既该吸收其他语言的鲜活表达方式,丰富和发展汉语,又要尽可能捍卫汉语的纯洁。身为炎黄子孙,我们都有责任。语言是文化的载体,如果载体变成不三不四,文化也要出问题。所以,应尽可能译成雅正的汉语。比如,不少人在汉语中直接用vs,例如说“东方vs西方”。其实,不妨说“东方对西方”或“东方比对西方”。用不了多久,大家就会清楚这儿的“对”或“比对”的含义。
教:这种人往往是要卖弄、炫耀自己懂英语。其实,半瓶子醋晃荡响,真正英语好的人是不会炫耀英语的。
李:你说的有道理,但也不能排除有时候他们真的不知道该如何用汉语来准确表达。还有,英文的缩写词就很难有简洁的中文对照物。比如,我们的“信息工程科学研究中心”(Center for Information Engineering Science Research) 就有个自然缩写CIESR,而它的中文简称“信研中心”就不理想,有争议。
学:估计器一般都是单独地用,而不是“匹尅”着用,为什么用“匹尅”的方法来评估呢?您不是刚说要牢记目的和用途吗?
李:好厉害的问题!幸亏我想过这个问题。是的,估计器一般都是单独地用,而不是匹尅着用。所以,最好让各个估计器都尽情独自表现。在各种资源,包括时间资源都十分丰富时,的确应该如此。然而,匹尅是一种速效法,它快捷草率 (quick and dirty),在资源紧张时间有限时,十分有用。就像要在这种情况下选一个代表,不妨让名列前茅的候选者匹尅决胜。
学:评估和被评估对象是不是有可能脱节?它们之间的关系怎样?
李:评估方法和度量最好不依赖于被评估对象,包括描述和解法,而充分体现所需解决的原始问题的目的、用途等。评估作为科研的第四要素 ,其地位被普遍轻视了。其实,它的重要性显而易见,因为它是指挥棒。
转载本文请联系原作者获取授权,同时请注明本文来自李晓榕科学网博客。 链接地址: https://blog.sciencenet.cn/blog-687793-657797.html
上一篇:
与师生谈研究策略15:类比、联想、猜测、推证 下一篇:
与师生谈学习门径10:阅读策略1