论文导读:针对传统主成分分析方法的缺点和应用当中可能出现的误区,总结几种常用的主成分分析改进方法。是一种化繁为简,将指标数尽可能压缩的降维(即空间压缩)技术,也是一种综合评价方法。
关键词:主成分改进,综合评价
0. 引言
主成分分析是一种常用的多元统计分析(即多指标的统计方法)方法。是一种化繁为简,将指标数尽可能压缩的降维(即空间压缩)技术,也是一种综合评价方法。免费论文。目前已广泛应用于许多领域,如:城市生态系统可持续发展的分析,工业企业经济效益的分析,公司财务评价,学习成绩的比较评价等等。但是,传统的主成分分析法在综合评价当中已暴露出很多缺陷,很多学者也提出了不同的改进方法,这些改进方法是与一定的现实条件相关联的,因此也不乏出现误用。本文将对常用的改进方法作进一步探讨。
1.传统PCA评价模型的算法:
1.1 输入样本观测值:
1.2 计算各指标的样本均值和样本标准差:

1.3 对 标准化,计算样本相关阵:

1.4 求 的 特征值 及对应的特征向量
.
1.5 建立主成分。
按累积方差贡献率

1.6 计算前个主成分的样本值

2.运用传统主成分分析方法易出现的误区及改进方法
在实际应用中,为了消除变量量纲的影响,往往对原始数据标准化,但是标准化在消除量纲或数量级影响的同时,也抹杀了各指标变异程度的差异信息,在此种情况下,我们通常可采用对原始数据进行均值化处理 [2],该方法已得到广泛采用。另外,主成分分析对于处理线性结构有很好的效果,然而对于许多实际问题,其观测数据阵并非线性结构而呈非线性结构。这时,若采用线性方法,效果往往很差。这就需要进一步的改进。本文将介绍几种简单的对原始数据进行处理的方法以及“对数—线性比”[1]主成分方法。
改进方法操作如下:
2.1 对原始数据的处理
2.1.1 数据的均值化

2.1.2 对数变换法
描绘原始数据 的散点图,若散点图呈现对数曲线特征时,令

2.1.3 平方根变换法
若散点图呈现抛物线特征时,令
然后以 作为新的数据代替原始数据进行分析即可。
当上述三种变换仍然不能很好的解决问题,而原始数据又明显呈现非线性特征时,还可以采用下述方法。免费论文。
2.2“对数—线性比”主成分方法
原香港大学统计系主任Aitchison教授(1981年)提出用对数—比(logratio)变换

亦即 其中 为成分向量 的任一恒正函数。为简便起见,一般可取

相应的

可以证明 为奇异阵,至多有 个非零特征值。免费论文。对其作谱分解:

便可以求得其广义主成分


3.其它改进方法
除了上述改进方法之外,近来不少学者又提出了新的改进方法,如主成分聚类法。主成分聚类即先做主成分分析,再取若干主成分对样品进行聚类分析,结合第一主成分得分排序对样品进行分类排名。由此得到一种新的综合评价方法,具体操作方法详见文献[2]。另外还有分组主成分分析方法 [5] 等。在实际应用当中,如果不考虑具体问题条件,一味采取同一个模式,难免有失偏颇,甚至与现实大相径庭。因此,根据不同的问题采用不同的改进方法,对解决具体问题是很有必要的。
参考文献:
[1]余锦华,杨维权.多元统计分析与应用[M],广州;中山大学出版社,2005.
[2]徐雅静,汪远征.主成分分析应用方法的改进[J],数学的实践与认识,2006年6月.
[3]候文.应用主成分分析进行综合评价的一种改进方法[J],辽宁师范大学学报(自然科学版),2004年12月.
[4]么彩莲,魏宁. 关于主成分分析的改进方法探讨[J], 中国现场统计研究会第12届学术年会论文集,2005年7月.
[5]侯文.对应用主成分法进行综合评价的探讨[J],数理统计与管理,2006年3月.
|