数据标准化
进行数据汇总后,就要对数据进行标准化处理,这是因为有的数据大一点,有的数据小一点,要分析不同数据的关系,就要对数据进行统一处理。
数据标准化的处理中,使用最广泛的一种标准化方法是z-score标准化,z-score标准化是基于原始数据的均值μ和标准差σ进行的,转换后就可以将原始值转换为统一的均值为0,标准差为1的数据。新得到的标准化数据的意义是“给定数据距离均值相对来说有多少个标准差”,在均值之上的数据会得到一个正的标准化分数,在均值之下的则得到一个负的标准化分数。标准化之后数据就会全部统一起来。
因子分析探索定量数据可以浓缩为几个方面(因子),每个方面(因子)和题项对应关系;
第一:分析KMO值;如果此值高于0.8,则说明非常适合进行因子分析;如果此值介于0.7~0.8之间,则说明比较适合进行因子分析;如果此值介于0.6~0.7,则说明可以进行因子分析;如果此值小于0.6,说明不适合进行因子分析;
第二:如果Bartlett检验对应p值小于0.05也说明适合进行因子分析;
第三:如果仅两个分析项,则KMO无论如何均为0.5。
上表格针对因子提取情况,以及因子提取信息量情况进行分析,从上表可知:因子分析一共提取出3个因子,特征根值均大于1,此3个因子旋转后的方差解释率分别是26.700%,24.096%,18.968%,旋转后累积方差解释率为69.764%。(提示:如果因子提取个数与预期不符,可在分析时主动设置因子个数)。
使用因子分析目的在于信息浓缩,则忽略“成份得分系数矩阵”表格。如果使用因子分析法进行权重计算,则需要使用“成份得分系数矩阵”建立因子和研究项之间的关系等式(基于标准化后数据建立关系表达式),如下:
因子得分1=0.413*S_获奖年龄+0.264*S_工作年限+0.424*S_最高学历+0.254*S_其他奖项获得情况-0.111*S_知名建筑协会会员数量-0.171*S_任教数量+0.004*S_世界建筑报道次数+0.018*S_书籍和文献数量
因子得分2=0.054*S_获奖年龄+0.494*S_工作年限+0.009*S_最高学历+0.171*S_其他奖项获得情况+0.073*S_知名建筑协会会员数量+0.084*S_任教数量+0.406*S_世界建筑报道次数+0.363*S_书籍和文献数量
因子得分3=0.097*S_获奖年龄-0.061*S_工作年限+0.013*S_最高学历-0.100*S_其他奖项获得情况-0.577*S_知名建筑协会会员数量+0.520*S_任教数量-0.104*S_世界建筑报道次数+0.153*S_书籍和文献数量
因子分析可利用载荷系数信息等进行权重计算,其计算分为三步,分别如下:
第一:计算线性组合系数,公式为:loading矩阵/Sqrt(eigen),即载荷系数除以对应特征根的平方根;
第二:计算综合得分系数,公式为:累积(线性组合系数*方差解释率)/累积方差解释率,即线性组合系数分别与方差解释率相乘后累加,然后除以累积方差解释率;
第三:计算权重,将综合得分系数进行归一化处理即得到各指标权重值;
第四:上述loading矩阵,特征根eigen,方差解释率或累积方差解释率均为旋转后对应值。