||
关于这个话题,笔者已经发表了2篇学术论文,对该如何看待和理解主成分分析法的物理意义进行了深入分析,指出了现有应用中的诸多错误应用并进行了有理有据的论证,详细细节可参见附件中的两篇已发表论文。
错误运用主成分分析法进行事物评价的论文,可能没有上万,但上千篇是有的,各个领域都有。枪毙上千篇文章,还是有些胆战心惊的,所以我反复思考过很多次。
以下文字是多年前发表在水木博客中的文字。清华大学BBS不知何故被关闭已久,水木社区的博客功能也同样不知何故无法再打开。
************************************************************************************************
最近2年才接触到这个方法,刚开始乍一看觉得似乎是个很不错的方法,但接触过几次以后,我现在对这个方法在环境评价中的应用价值持基本否定的态度。下面谈谈我对该方法的2点评述:
1.主成份分析法用于评价(不仅是环境评价)时,必须进行的一个操作是:正向化。不做正向化就是错误的应用方法。为何不做正向化就是错误的应用方法?根本原因在于主成份分析的评价结果与各指标的数值之间应保持同样的趋势关系,即要么各指标与最终评价结果的关系是各指标数值越大,评价结果越好,要么是各指标数值越小,评价结果越好。而不能是有些指标越大越好,有些却越小越好,这样的话就乱套了。要避免这一点,就必须事先进行各指标的正向化。遗憾的是有不少论文在应用该方法时根本没提正向化的问题,而且从上下文看来,有不少论文的作者并没有意识到正向化到底有何物理意义、有何必要性,以至于连正向化这个如此重要的步骤都可以不提。具体文献就不列了,感兴趣的读者可以随机下载30篇左右用主成份分析法做评价的研究论文,看看我说的对不对。
2.为何对这个方法在评价(至少是环境评价)中的应用价值持基本否定的态度?这要从物理意义来进行剖析。主成份分析法本质上是在做差异分析,仅此而已。但这种差异本身并不构成对一个事物的价值判断。对于评价来说,其核心在于通过各种方法来定量化地衡量不同方案或不同个体的‘价值’高低差异,而不是纯粹的数学上的数值差异性。而这种‘价值’判断,以笔者目前的经验来看,无外乎这么两大类方法:或是通过经济价值、产量等等方式来直接度量,或是通过专家经验、问卷调查、头脑风暴等方式来进行度量,从而得到具有物理意义的‘价值’量用以评价和对比。而主成份分析法在用于评价时,是将方差贡献率作为各主成份的综合权重,这种做法有两个致命的疑点:1、各个主成份本身并无‘价值’大小这一物理属性,只代表的是数据的数值差异;2、方差贡献率同样类似,方差贡献率并非是一个具有‘价值’高低的物理意义的量(当然,方差贡献率本身还是有物理意义的,但没有‘价值’高低的物理含义),如何能作为‘价值’评价的权重系数?
注:本文转载自bbs.tsinghua.edu.cn的同名博客
发表时间:
2009-09-09 19:36:54
更新时间:
2009-09-09 19:36:54
浏览:2915次
2016.5.13的补充:关于这个话题,最近几年我已经指导了2名研究生深入研究这个问题,基本厘清了里面的核心问题所在,主要成果已经发表在期刊论文上了。
************************************************************************************************
主成分与层次分析法在区域可持续发展能力评价中的应用对比.pdf
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 19:03
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社