对于具体的数值,收入算术平均值可由《中国统计年鉴》的“按收入等级分城镇居民家庭基本情况”(换算得表2)计算,算得2008年我国城镇居民平均收入为 =2837.68.而城镇基尼系数,本文采用郝亦朗(2010)计算的结果,2008年城镇居民收入基尼系数 =0.3681 .
把 =2837.68,=0.3681代入式(5)、(6),得到收入分布曲线的参数值为:
=7.7212 =0.4590
代入式(1),可得工薪阶层收入分布密度函数为:
(7)
3拟合方法的效果分析
根据得到的收入分布密度函数式(3)(4)(7),利用MATLAB画出相应的收入分布曲线
(图1),并算出特定收入阶层的人口份额(表3).

表3 各收入阶层人口份额的比较
收入
|
0-
2000
|
2000-
4000
|
4000-
6000
|
6000-
8000
|
8000-
10000
|
10000-12000
|
12000-20000
|
数据一人口份额
|
0.3124
|
0.5209
|
0.1323
|
0.0268
|
0.0058
|
0.0014
|
0.0005
|
数据二人口份额
|
0.3600
|
0.5840
|
0.0528
|
0.0030
|
0.0002
|
0.0000
|
0.0000
|
反估计人口份额
|
0.4295
|
0.3716
|
0.1245
|
0.0435
|
0.0169
|
0.0072
|
0.0062
|
最大似然估计计算简单,通过较完善的样本数据可以估计出较准确的收入分布,但其拟合效果极大地依赖样本数据.从数据一、数据二的拟合情况(图1和表3)可以看到,由现有数据拟合到的收入分布对高收入群体的预测能力较差.数据一反映了工薪阶层的收入结构,但是数据少,参数估计值偏差大.并且该数据都是平均收入,不能反映低收入和高收入两个极端的情况.数据二数据较多,得出的参数估计值较可靠.但行业平均工资无法体现收入差距反估计,导致收入两端偏差较大.注意到我们算出的 =0.1266仅是组间方差,完全忽略了组内方差.而组内(行业内)方差往往要比组间(行业间)方差大.所以应该加上组间方差才更符合实际.而每个组的组内方差的估计并不是一件容易的事.因此,对于最大似然估计法,目前中国官方公布的数据不能拟合出较符合实际情况的收入分布.
基于基尼系数的反估计法计算也非常简便,解方程组(5)(6)便可得出分布的参数值 和 .此方法最大的好处在于摆脱了样本数据的局限.平均收入 和基尼系数 的计算研究较多,容易获得较合理的数值,从而拟合出较准确的收入分布曲线.如图1和表3,反估计法的收入分布对高收入群体的反映能力强,并且各阶层的比例也更合理.相对前两种拟合,反估计法具有更好的拟合效果.
最大似然法和反估计法都是拟合收入分布较为简便的方法.但最大似然法对样本数据的要求较高,在没有详细的样本数据的情况下,反估计法也能拟合出较好的收入分布,不失为一种好的拟合方法.而拟合到的收入分布曲线,可为宏观经济问题的量化研究(如调整工薪所得免征额等)提供参考.
参考文献:
[1]徐建国.收入分布和耐用消费品的增长方式[R].北京大学中国经济研究中心学术刊物,2000(3).
[2]郭剑川、刘黎明.个人所得税免征额调整的财政影响估算[J].统计教育,2009(8):18―19.
[3]Aitchison& Brown.The Lognormal Distribution [M].Cambidge: Cambridge Univ.Press.1957.
[4]郝亦朗.我国城镇居民收入差距与消费倾向关系的实证研究[J].金融经济,2010(20):70―72.
2/2 首页 上一页 1 2 |