给定的一组相关变量通过线性变换转换成另一组不相关的变量,这些新的变量按照方差递减的顺序排列。在数学变换中保持变量的总方差不变,使第一个变量具有最大的方差,称为第一主成分;第二个变量的方差次大,并且和第一变量不相关,称为第二主成分;依次类推,k个变量有k个主成分,最后一个主成分具有的方差最小,并且和前面的主成分都不相关。
求解主成份的方法是:通过求解观测变量相关矩阵的特征方程,得到k 个特征值和k
个单位特征向量,把k 个特征值按从小到大的顺序排列,它们分别代表k 个主成份所解释的观测变量的方程,主成份是观测变量的线性组合,线性组合的权数就是相应的单位特征向量中的元素。
因子个数的确定:有k个变量就有k个主成分,因子分析的目的是为了简化数据,所以并不想用k个主成分,而是提取前几个主成分。目前确定因子(主成分)个数的准则有两个:
一是特征值准则:即取特征值大于等于1的主成分作为初始因子,放弃特征值小于1的主成分。
二是碎石检验准则:按照因子提取的顺序画出因子的特征值随因子个数变化的散点图,根据图的特点来判断因子的个数。
(3)第三步是进行因子旋转。目的是通过坐标转换使因子解的实际意义更容易解释。
建立了因子分析目的不仅仅要找出公共因子以及对变量进行分组,更重要的要知道每个公共因子的意义,以便进行进一步的分析,如果每个公共因子的含义不清,则不便于进行实际背景的解释。由于因子载荷阵是不惟一的,所以应该对因子载荷阵进行旋转。旋转的目的是通过改变坐标轴的位置,重新分配各个因子所解释的方差比例,使载荷矩阵每列或行的元素平方值向0和1两极分化,使因子结果更简单,更易于理解。有三种主要的正交旋转法,四次方最大法、方差最大法和等量最大法。本文选择正交旋转中的方差最大法。
方差最大法[VARIMAX]:是从简化以因子负载矩阵的每一列出发,使和每个因
子有关得负载平方的方差最大。当只有少数几个变量在某个因子上有较高的负载时,对因子的解释是最简单的,和某个因子有关的负载平方的方差最大时,因子具有最大的可解释性。
方差最大法通过使下式达到最大求得因子解。发表论文。 
(4)计算因子值。因子值是各个因子在每个观测变量上的得分值,可以在其他分析中使用这些因子。
前面我们解决的是用因子来线性地表示一组变量的有关问题。如果我们要用这些因子做其他研究,比如把得到地因子作为自变量来做回归分析、对样本进行分类或评价,这都需要对因子进行测度,给出因子对应每个样本案例上的值,这些值称为因子值。
求因子值涉及到用观测变量来描述因子,第p个因子在第i个个案上的值可表示为:
,
其中 是第j个变量在第i个个案上的值, 是第p个因子和第j个变量正交的因子值的系数。
因子值的系数 ,对于主成分分析法得到的因子解,可以直接得到因子值的系数。
这样,就能计算出每个因子在所有案例上的得分,可以将这几个因子分别命名,根据得到的因子值在进行回归分析哦、分类或评价等。
三、山东省农民消费结构实证分析
1、指标选取
本文所选取的数据来自《2005年山东省统计年鉴》。从消费结构中选取以下8个主要指标。食品消费支出(X1)、衣着消费支出(X2)、居住消费支出(X3)、家庭设备用品消费支出(X4)、交通和通讯消费支出(X5)、文化教育娱乐消费支出、(X6)医疗保健消费支出(X7、)其他商品和服务消费支出(X8)。利用该数据对山东省农民的消费结构进行因子分析。
2、实证分析
参数 |
值 |
卡方值 |
121.9850 |
自由度 |
28 |
显著性 |
0.0000 |
(1)、巴特莱特球度检验
Bartlett检验的卡方值为121.9850,表明相关系数矩阵不是单位矩阵,所以可考虑用因子分析法;KMO的值为0.766,可能由因子分析得出的结果一般。
(2)特征根的碎石图:可以看出,前三个特征根的累积方差贡献率已达到90%,因此可提出前三个因子。
(3)旋转后的因子载荷矩阵
旋转方法:方差最大旋转
|
因子1 |
因子2 |
因子3 |
食品消费支出(X1) |
0.7740 |
0.4051 |
0.3918 |
衣着消费支出(X2) |
0.7221 |
0.3596 |
0.4978 |
居住消费支出(X3) |
0.2031 |
0.9281 |
0.2324 |
家庭设备用品消费支出(X4) |
0.5105 |
0.5314 |
0.4872 |
交通和通讯消费支出(X5) |
0.5516 |
0.6937 |
0.3538 |
文化教育娱乐消费支出(X6) |
0.8669 |
0.4209 |
0.0430 |
医疗保健消费支出(X7) |
0.8696 |
0.0899 |
0.3240 |
其他商品和服务消费支出(X8) |
0.2463 |
0.2734 |
0.9015 |
(4)因子载荷
X1=0.7740F1+0.4051F2+0.3918F3 X2=0.7221F1+0.3596F2+0.4978F3
X3=0.2031F1+0.9281F2+0.2324F3 X4=0.5105F1+0.5314F2+0.4872F3
X5=0.5516F1+0.6937F2+0.3538F3 X6=0.8669F1+0.4209F2+0.0430F3
X7=0.8696F1+0.0899F2+0.3240F3 X8=0.2463F1+0.2734F2+0.9015F3
由此看出,食品消费支出、衣着消费支出、文化教育娱乐消费支出、医疗保健消费支出在因子1(F1)上具有较大的载荷,可命名为生活必需品因子; 居住消费支出、家庭设备用品消费支出、交通和通讯消费支出在因子2(F2)上具有较大的在载荷,可命名为人际交往因子;其他商品和服务消费支出在因子3(F3)上具有较大的载荷,可命名为其他因子。
(6)因子得分:
F1=0.9447X1+0.9329X2+0.7490X3+0.8710X4+0.9252X5+0.8569X6+ 0.8115X7+ 0.7384X8
F2=-0.1556X1-0.1165X2+0.5326X3+0.1391X4+0.1750X5-0.3168X6-0.4475X7+0.2823X8
F3=0.0015X1+0.1213X2-0.3346X3+0.0489X4-0.1552X5-0.3096X6+ 0.1019X7+0.5684X8
综合得分: 
经计算可得各地市的因子得分及排名为:
地区 |
因子1 |
排名 |
因子2 |
排名 |
因子3 |
排名 |
综合因子 |
排名 |
济南市 |
0.72 |
4 |
-0.26 |
9 |
0.04 |
7 |
0.571 |
5 |
青岛市 |
0.29 |
7 |
1.32 |
3 |
2.16 |
1 |
0.552 |
6 |
淄博市 |
0.60 |
5 |
-0.06 |
7 |
1.92 |
2 |
0.644 |
4 |
枣庄市 |
-0.77 |
14 |
-0.01 |
6 |
0.87 |
3 |
-0.57 |
13 |
东营市 |
-0.35 |
10 |
2.32 |
1 |
-0.76 |
13 |
-0.11 |
8 |
烟台市 |
1.61 |
2 |
-0.98 |
16 |
0.82 |
5 |
1.294 |
2 |
潍坊市 |
0.73 |
3 |
1.59 |
2 |
-0.83 |
14 |
0.702 |
3 |
济宁市 |
-0.42 |
11 |
0.44 |
5 |
-0.24 |
8 |
-0.32 |
10 |
泰安市 |
-0.31 |
9 |
-0.40 |
11 |
-1.09 |
16 |
-0.39 |
11 |
威海市 |
2.42 |
1 |
-0.57 |
14 |
-1.16 |
17 |
1.846 |
1 |
日照市 |
-0.81 |
15 |
-0.47 |
13 |
0.82 |
4 |
-0.65 |
14 |
莱芜市 |
0.32 |
6 |
-0.44 |
12 |
-0.35 |
10 |
0.19 |
7 |
临沂市 |
-0.56 |
12 |
-0.12 |
8 |
-0.67 |
12 |
-0.53 |
12 |
德州市 |
-1.23 |
16 |
-0.62 |
15 |
-0.36 |
11 |
-1.11 |
16 |
聊城市 |
-1.47 |
17 |
-0.39 |
10 |
0.11 |
6 |
-1.25 |
17 |
滨州市 |
-0.24 |
8 |
0.49 |
4 |
-0.94 |
145 |
-0.22 |
9 |
菏泽市 |
-0.53 |
12 |
-1.85 |
17 |
-0.33 |
9 |
-0.66 |
15 |
四、结果分析:
综合得分为正的地市有济南、青岛、淄博、烟台、潍坊、威海、莱芜,表示其消费水平居全省平均水平之上,第一因子的得分也较大,说明在生活必需品(食品消费支出、衣着消费支出、文化教育娱乐消费支出、医疗保健消费支出)上的消费投入较大,也表明了这些地市的农村经济发展水平较高。其他10个地市的综合得分为负,表示其消费水平居全省平均水平之下,其第一因子的得分也较大,说明在生活必需品(食品消费支出、衣着消费支出、文化教育娱乐消费支出、医疗保健消费支出)上的消费投入较低,表明了这些地市的农村经济发展水平较弱。
2/3 首页 上一页 1 2 3 下一页 尾页 |