论文导读::工薪阶层收入分布模型,是对免征额进行量化研究的基本模型.最大似然估计法和基于基尼系数的反估计法,是拟合工薪阶层收入分布的简易方法.最大似然估计依赖样本数据的程度较大;而反估计法只需知道平均收入和基尼系数就能拟合出对数正态收入分布曲线,且有较好的拟合效果.
论文关键词:工薪阶层,收入分布拟合,最大似然估计,反估计
1引言
近年来,在收入不平等越来越明显的形式下,个人所得税工薪所得免征额的调整一直是个社会热点问题.社会的主流呼声是主张提高工薪所得税的免征额,而调整的方案也众说纷纭,有3000元、5000元甚至10000元等,但量化的研究比较少.要对免征额的调整进行量化的研究,首先要知道我国工薪阶层的收入分布,了解工薪收入的结构.为此,下面介绍两种拟合工薪阶层收入分布的简便方法,为免征额的量化研究提供一个收入分布模型.
2收入分布的拟合方法
对于我国的居民收入分布,一些研究表明正态对数分布曲线能较好地拟合实际情况.如徐建国(2000)以中国4800户为分析对象,验证了人均收入分布在5%的显著水平下服从正态对数分布 ;郭剑川、刘黎明(2009)对《中国统计年鉴》上的数据进行统计检验反估计,证实了我国城镇居民收入大体上服从对数正态分布;而工薪阶层收入主要是城镇居民收入,可用城镇就业者收入分布近似工薪阶层收入分布 .因此,本文也利用城镇就业者收入来近似工薪阶层的收入,并假设中国工薪阶层收入服从对数正态分布,则其概率密度函数为:
, (1)
2.1 最大似然估计
在已知分布类型的情况下,我们采用最大似然估计法来估计参数 和 ,并利用《中国统计年鉴》的数据求得估计值,从而得到工薪阶层的收入分布.
2.1.1估计公式推导
构造似然函数:

取对数,得:

那么似然方程组为:

解得:
 

对于分组数据, 和 的最大似然估计值应为:
(2)
其中 表示样本总人数, 表示所分的组数, 表示各组的频数.
2.1.2数据代入
目前中国官方公布有关收入分布的数据,应该是《中国统计年鉴》的“按收入等级分城镇居民家庭基本情况”和“按细行业分职工平均工资”这两种类型的数据.下面将分布利用这两类数据拟合出我国工薪阶层的收入分布.
数据一
《中国统计年鉴》的“按收入等级分城镇居民家庭基本情况” 提供了对我国城镇居民收入进行分层次抽样调查的数据,能体现城镇居民的收入结构.下面我们以《2009年中国统计年鉴》的调查数据(表1)为例,计算 和 的估计值.
表1 2008年城镇居民家庭人均收入
收入分组
|
调查户数
|
比重%
|
平均每户
家庭人口
|
就业人口
|
人均全部年收入(元)
|
最低收入
|
6353
|
9.82
|
3.33
|
1.27
|
5203.83
|
低收入
|
6485
|
10.03
|
3.22
|
1.44
|
7619.53
|
中偏下
|
12983
|
20.07
|
3.06
|
1.52
|
10974.63
|
中等收入
|
12993
|
20.09
|
2.89
|
1.50
|
15054.73
|
中偏上
|
12998
|
20.10
|
2.74
|
1.49
|
20784.19
|
高收入
|
6445
|
9.96
|
2.62
|
1.51
|
28518.85
|
最高收入
|
6418
|
9.92
|
2.51
|
1.57
|
47422.40
|
资料来源:《2009年中国统计年鉴》
表1把城镇居民家庭人均收入分为7个阶层:最低收入(10%),低收入(10%),中偏下(20%),中等收入(20%),中偏上(20%),高收入(10%)和最高收入(10%).根据下面公式,可以估算出 2008城镇居民就业者人均月收入以及就业人数(表2).
表2 2008年城镇就业者人均收入
收入分组
|
就业者人均月收入
|
月收入对数值
|
就业人数
|
最低收入
|
1137.06
|
7.04
|
8068
|
低收入
|
1475.19
|
7.30
|
9338
|
中偏下
|
1841.14
|
7.52
|
19734
|
中等收入
|
2417.12
|
7.79
|
19490
|
中偏上
|
3185.05
|
8.07
|
19368
|
高收入
|
4123.59
|
8.32
|
9732
|
最高收入
|
6317.95
|
8.75
|
10075
|
根据表2的数据,利用公式(2),得到 和 的最大似然估计值为:
代入式(1),收入分布密度函数为:
(3)
数据二
《中国统计年鉴》的“按等级注册类型和细行业分职工平均工资”是目前中国公开的有关职工收入的最详细的数据.同时反估计,年鉴中“按登记注册类型和细行业分城镇单位就业人员数”提供了各行业相应的就业人数.去掉缺失值,最后得到有效数据280组,每一组包括行业平均工资及对应的人数.
利用公式(2)和MATLAB软件算得均值 和方差 的估计值为:
=7.7284 =0.1266
代入(1)得收入分布密度函数为:
(4)
2.2 基于基尼系数的反估计
最大似然估计法对样本数据的要求较高,但我们往往很难获得详细的收入样本数据.为了克服数据不足的问题,我们可以利用官方公布或权威的基尼系数来反估计收入分布的参数.
注意到对数正态分布有两个重要的性质 :
收入的算术平均值 (5)
基尼系数 (6)
要估计收入分布曲线的参数和 ,只需知道收入算术平均值 和基尼系数 即可.而收入算术平均值 和基尼系数 都是常见的数据,容易获得较合理的数值.这样,通过以上两个简单的式子就可得出收入分布参数值 和 ,大大简化了参数估计的工作.
1/2 1 2 下一页 尾页 |