|
社会现象纷繁复杂,人们对这些现象的解读更是多样。有时,研究方法或统计技术能够帮助人们考察或澄清有关事实。例如,很多求职失利的人都容易认为招聘单位存在某种或某些歧视,实际情况会是怎样的呢?
假设研究者接触到了一个商业组织的人事档案,很想知道哪些因素在招聘新员工时更有影响。预感这个组织执行的是一项年龄歧视的用人政策,即,不管求职者的资格与经验如何,他们就是喜欢招收年轻、貌美的女性,不喜欢招收年龄稍大、没有魅力的女性。
在这个预感的基础上,研究者可以提出各种假设。为了简化问题,并进行判断函数分析,可以把研究缩减为一个自变量,有两个水平:接收或被拒。研究者收集那些打算作为因变量的指标。例如,得到年龄指标、代表资格的一些指标(各种考核分数、各种资格证书等)和关于经验的某一指标(例如,见习、实习时间),以及一个魅力指标,可以让独立的评判者评定求职者的照片。
这里采用一个20名被试的样本(见表1)进行分析。当然,如果要发表相应的研究,这样的样本是不行的。
研究者对表1的数据进行判别函数分析,得到BW矩阵(被试间与被试内方差),其特征根(λ)代入下面方程得到Wilks’ Λ(r =可能的特征根的最大数目):
Λ=1/(1+ λr)
在判别函数分析中,把Λ转换成一个卡方统计量,称为Bartlett(或Rao)V,在表中查df = p(k-1)的值,确定是否显著。BW矩阵的特征根数目取决于组别数和预测变量数。
由于例子中仅有两组,只能确定一个判别函数,它的特征根是2.87,转换成χ2 =21.65,在p<0.001水平显著。
如果χ2检验是不显著的,那么,就没必要继续做了,因为已经清楚没有函数可以充分地解释组间差异了。本例不是这样的。
有两组数值可供用来解释函数。第一组数值是标准化判别函数系数(见表2),有时称为“典型系数”。它们是每个因变量与相应函数之间关系的原始度量,其特性是排除了其他因变量的效应。对于小样本而言,可以不管系数低于±0.4的情况。高的或重要的系数应当大于0.7或0.8,当然,这还取决于样本量。
从表2可注意到,年龄有一个非常高的负的系数(-1.08),这意味着年龄在区分两个组中具有重要作用。相反,魅力只有适中的系数(0.365),这样的数字在大样本中可能是重要的,然而,在仅有20名被试的样本中,它就显得不重要了,可以把魅力当成分析中的冗余变量。
可以用来解释函数的另一组数据是变量与函数之间的相关系数(见表3)。当因变量是彼此相关的时,这类度量更有用。通过描述每个因变量在每个函数上的负荷,用这些数值来确定哪些因变量与哪个函数相关。
在表3中,年龄在这个函数上的负荷(相关)是-0.52,这可以解释为较高的负的负荷,因此,它可能告诉研究者这个函数的某种性质。然而,经验只有一个小的负荷(0.18),说明它与函数的关系不甚密切。
由此,对函数的解释是,它代表的内容与年龄有关,但与经验无关。另外两个负荷也是比较小的(需要注意的是,计算机如何根据负荷大小来调整变量的等级顺序的)。特别地,前面视之为冗余变量的魅力,现在成为负荷居于第二高的了(虽然数字不大,为0.29)。
如何理解这种情况呢?这说明,魅力的小的系数(代表其他变量排除之后,魅力的重要性)是因为它与另一个变量的高的相关。从因变量的相关矩阵可以看出,另一个变量可能是年龄。对这个单一函数的解释是,它代表了这个商业组织在招聘时看重年龄,同时也稍微看重魅力。
有了这样的分析结果,研究者可以指出相应的组织在用人制度上的确存在年龄歧视,而对经验不甚关注。由此,可以体会到研究方法或统计技术的作用与威力。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 14:56
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社