论文导读::聚类分析。主成分分析。运用恰当的方法进行定量分析、综合评价。科学发展与和谐社会评价研究现状。在构建和谐社会评价指标体系的基础上。
论文关键词:聚类分析,主成分分析,综合评价,科学发展,和谐社会
一、研究背景
党的十六大以来,以胡锦涛为总书记的党中央继承和发展邓小平理论和“三个代表”重要思想,深刻总结人类历史和社会主义发展史上的经验教训,深入分析时代潮流和我国社会发展的特征,提出科学发展观、构建社会注意和谐社会等重大战略思想和战略任务,形成中国特色社会主义理论体系。然而,对于科学发展与和谐社会的要求是多角度、全方位的。它包括民主法治、公平正义、诚信友爱、充满活力、安定有序、人与自然和谐相处,以解决人民群众最关心、最直接、最现实的利益问题为重点,着力发展社会事业、促进社会公平正义、建设和谐文化、完善社会管理、增强社会创造活力,走共同富裕道路,推动社会建设与经济建设、政治建设、文化建设协调发展。因此小论文,选择一系列合适的指标,运用恰当的方法进行定量分析、综合评价,显得尤为重要。
二、科学发展与和谐社会评价研究现状
联合国于1996年建立了一套可持续发展指标用于帮助各国制定可持续发展政策,应用“驱动力-状态-响应”概念模型来设计指标体系,该指标体系包括142个指标,含社会、环境、经济、制度4个方面,其中社会指标涉及平等、健康、教育、住房、安全、人口,环境指标涉及大气、土地、海洋、海岸、淡水、生物多样性,经济指标涉及经济结构、消耗和生产模式,制度指标涉及制度框架、制度能力。
2005年,国家统计局完成了一项重点课题研究——《“和谐社会统计监测体系研究”之“和谐社会统计监测指标体系研究报告”》。2008年,佟金萍、马剑锋采用层次分析法和模糊综合评判的方法,在构建和谐社会评价指标体系的基础上,计算苏锡常和谐社会的综合指数。2009年,福建设区市经济社会发展评价课题组建立了一套评价指标体系。该体系由经济发展、人民生活、社会公平、社会保障、社会安全、社会生态等6大类指标和33小项指标组成。同年,胡皓、韩兆洲根据胡锦涛书记对和谐社会的阐述,同时考虑到能够从统计年鉴获得数据,从民主法治、公平正义、诚信友爱、充满活力、安定有序和人与自然和谐相处第六个维度设计了18项指标,采用主成分法对和谐指标赋权,并对广东和谐社会建设进行了实证综合评价。
三、科学发展与和谐社会评价指标的选取
对科学发展与和谐社会进行综合的评价,选取的指标不仅要有城市的,还要有农村的,不仅要考虑经济的发展,还要考虑能源的消耗,同时要涵盖经济、政治、科技、教育、文化、卫生等各个领域。本文正是按着这一思路选取,并考虑数据的可获得性小论文,选取如下20个指标(均为2007年数据):人均国内生产总值(X1);城镇居民可支配收入(X2);农村居民家庭人均纯收入(X3);居民人均消费水平(X4);5、农村城镇消费比(X5);6、固定资产投资(X6);单位煤耗量的GDP贡献(X7);单位煤耗量的GDP贡献(X8);三种专利申请受理数(X9);城镇单位技术人员(X10);高等学校数(X11);高等学校在校学生数(X12);各地区教育经费(X13);卫生机构数(X14);每万人医疗机构床位拥有数(X15);每万人公共交通拥有数(X16);每万人参加基本养老保险人数(X17);各地区农村居民住房面积(X18);就业率(X19);城区绿化覆盖率(X20)。
四、科学发展与和谐社会评价方法的运用
由于缺少个别数据,故用SPSS软件进行了缺省值处理。以下分析结果都是基于处理后的数据进行的。
聚类分析
聚类分析(Cluster Analysis)是根据事务本身的特性来定量研究分类问题的一种多元统计分析方法。其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是根据一批样品的多个观测指标,找出能够度量样品(或度量)之间相似度的统计量,并以此为依据,采用某种聚类法(Method),将所有的样品(或变量)分别聚合到不同的类中。
本文研究的是2007年全国31省、直辖市、自治区(不含港、澳、台)科学发展与和谐社会的综合评价,采用快速聚类(K-means Cluster,表4-1)对31个CASE进行分类。
表4-1:聚类分析结果表
分类
|
地区
|
第一类:C类(经济比较发达,交通便利,其他指标基本位于全国偏上水平)
|
北京、天津、山西、内蒙古、吉林、上海、福建、广西、重庆、云南、甘肃
|
第二类:B类(各类指标名列前茅,城乡和谐,唯独教育投入有所欠缺)
|
浙江
|
第三类:D类(各类指标趋于中等)
|
河南、湖北、广东
|
第四类:E类 (各类指标趋于中等偏下)
|
河北、辽宁、黑龙江、安徽、江西、湖南、四川、陕西
|
第五类:F类(经济发展落后,科技、文化环境都有待改进)
|
海南、贵州、西藏、青海、宁夏、新疆
|
第六类:A类(各类指标领先全国水平,尤其重视科技、教育、绿化)
|
江苏、山东
|
主成分分析
主成分析法(Principal ComponentAnalysis)是考察多个定量(数值)变量间相关性的一种多元统计方法。它是研究如何通过少数几个主分量(即原始变量的线性组合)来解释多变量的方差——协方差结构。具体地说,是导出少数几个主分量,使它们尽可能多地保留原始变量的信息,且彼此间不相关。主成分分析常被用来寻找判断某种事物或现象的综合指标,并综合指标所蕴藏的信息以恰当解释,以便更深刻地解释事物内在的规律。
按照特征根从大到小排列,大于1的的特征根有5个小论文,分别是10.228,4.556,1.174,1.127,1.059。他们分别解释了总变异的51.140%,22.780%,5.869%,5.633%,5.293%,共解释了总变异的90.716%。因此,这20个变量中只需提取5个主成分即可。
根据因子载荷矩阵,可以得出用各原始变量写出的因子表达式,方法为用因子载荷矩阵表中的第i列向量除以第i个特征根的算术平方根后,得出第i个主成分的变量系数向量,进而通过计算,得到31省、直辖市、自治区的各主成分的得分与排序,并根据各主成分解释的总差异率得到综合得分与总排序,如表4-2。从表中可以看出江苏科学发展与和谐社会得分排名第一。
表4-2:主成分分析结果表
地区
|
北京
|
天津
|
河北
|
山西
|
内蒙古
|
辽宁
|
吉林
|
黑龙江
|
上海
|
江苏
|
浙江
|
得分
|
1.03
|
-0.02
|
0.31
|
-0.24
|
-0.45
|
0.33
|
-0.17
|
-0.1
|
0.52
|
1.33
|
0.77
|
排序
|
4
|
15
|
9
|
20
|
24
|
8
|
19
|
18
|
6
|
1
|
5
|
地区
|
安徽
|
福建
|
江西
|
山东
|
河南
|
湖北
|
湖南
|
广东
|
广西
|
海南
|
重庆
|
得分
|
-0.02
|
-0.01
|
0.01
|
1.04
|
0.38
|
0.21
|
0.16
|
1.2
|
-0.28
|
-0.51
|
-0.4
|
排序
|
16
|
14
|
13
|
3
|
7
|
11
|
12
|
2
|
21
|
26
|
22
|
地区
|
四川
|
贵州
|
云南
|
西藏
|
陕西
|
甘肃
|
青海
|
宁夏
|
新疆
|
|
|
得分
|
0.23
|
-0.78
|
-0.47
|
-0.97
|
-0.07
|
-0.65
|
-0.98
|
-0.97
|
-0.45
|
|
|
排序
|
10
|
28
|
25
|
29
|
17
|
27
|
31
|
30
|
23
|
|
|
五、结论与改进
聚类分析与主成分分析结果比较,如表5-1。
表5-1:聚类分析与主成分分析结果比较表
聚类A类
|
江苏
|
山东
|
|
|
|
|
|
|
|
|
|
主成分排名
|
1
|
3
|
|
|
|
|
|
|
|
|
|
聚类B类
|
浙江
|
|
|
|
|
|
|
|
|
|
|
主成分排名
|
5
|
|
|
|
|
|
|
|
|
|
|
聚类C类
|
北京
|
天津
|
山西
|
内蒙古
|
吉林
|
上海
|
福建
|
广西
|
重庆
|
云南
|
甘肃
|
主成分排名
|
4
|
15
|
20
|
24
|
19
|
6
|
14
|
21
|
22
|
25
|
27
|
聚类D类
|
河南
|
湖北
|
广东
|
|
|
|
|
|
|
|
|
主成分排名
|
7
|
11
|
2
|
|
|
|
|
|
|
|
|
聚类E类
|
河北
|
辽宁
|
安徽
|
江西
|
黑龙江
|
湖南
|
四川
|
陕西
|
|
|
|
主成分排名
|
9
|
8
|
16
|
13
|
18
|
12
|
10
|
17
|
|
|
|
聚类F类
|
海南
|
贵州
|
西藏
|
青海
|
宁夏
|
新疆
|
|
|
|
|
|
主成分排名
|
26
|
28
|
29
|
31
|
30
|
23
|
|
|
|
|
|
通过比较可以得到如下结论:第一,聚类分析与主成分分析得到的科学发展与和谐社会情况基本一致。第二,两者的侧重点各有不同。聚类分析主要是对各地区进行划分、归类,可以把我各地区各个方面的特点;主成分分析法可以根据这20个指标得到综合评分。因此小论文,只有把聚类分析与主成分分析结合使用,才能对各省、直辖市、自治区科学发展与和谐社会整体把握的情况上,关注其特点。这为政府部门针对性地提高科学发展水平,完善和谐社会构建提供了有价值的信息。政府部门可以在普遍性中寻找特殊性,认真贯彻中央“以科学发展观为指导,构建社会主义和谐社会”前提下,根据各地特点,结合需要,制定相应的战略规划,出台相关的政策,综合提高科学发展水平,改善和谐社会状况。
然而,本文也存在着一定的不足。如指标选取的局限性,由于各省市、自治区治安情况、政治民主、文化状况等数据的难采集性,导致统计结果的偏差。
|