论文导读::通过对我国31个省市自治区的出口贸易额进行不等概率抽样,抽取了13个对象作为研究样本,预测了2008年我国出口贸易总额及抽样方差,同时与简单随机抽样的效果进行了对比,结果发现PPS抽样方法在总体单元之间差异比较大的情况下,能够取得很好的估计效果。
论文关键词:PPS抽样,简单随机抽样,出口
一、引言
自2001年中国加入WTO以来,我国的对外贸易得到了飞速的发展,从2000年,我国的进出口总额4743亿美元,到2008年则高达25632亿美元,比2000年增长了5倍多,进出口贸易总额以年均16.3%的速度增长,大大超过了同期国民经济的年均约11%的增长速度。其中,出口贸易作为拉动我国经济增长的三驾马车之一,对促进我国综合国力的提高和保持整个国民经济健康稳定发展的作用日趋显著。正因为目前的中国经济对国际市场的依赖程度越来越深,为保证宏观经济的持续稳定增长。出口贸易的增长问题正受到前所未有的关注。本文通过对我国31个省市自治区的货物进出口总额进行不等概率抽样(PPS抽样),抽取了8个省市作为研究样本,以此来预测2008年我国各地区出口贸易总额及抽样方差,并与简单随机抽样的预测结果进行比较,以期得到较为准确的预测结果,为宏观决策层更准确地把握各项促进出口政策的实施力度提供依据。
二、PPS抽样方法简介
从抽样发展的历史来看论文服务,最初提出的是代表性样本,这是一种主观有意识的抽样。但是,这种方法无法计算抽样误差,因此进一步发展到等概率随机抽样,以使总体中的每一个单元处于平等地位,有同样的机会被抽中,从而可以科学地计算和控制抽样误差。当总体单元之间的差异不大时,简单随机抽样是简便的、有效地。但是当总体单元之间的差异非常大时,简单随机抽样效果并不好,例如,要反映一个城市的经济发展情况,大型企业对城市的影响是比较大的,因而在抽样中是否抽中这些企业,对推断总体的结果也有很大影响。而对一些名不见经传的小企业是否抽中则无足轻重,因而在抽样中如果把它们处在同等地位,显然也是有缺陷的。因此就需要引入不等概率抽样。
1、不等概率抽样的基本含义
不等概率抽样是指在抽取样本前给总体的每一个单元赋予一定的被抽中概率。不等概率抽样分为放回与不放回两种情况。在有放回的不等概率抽样中,最常用的是按总体单元的规模大小来确定抽选的概率。设总体中第 个单元的规模度量为 ,总体的总规模度量为 ,则该单元的抽选概率应为 。这种不等概率抽样称作按与规模大小成比例的概率抽样,英文为probability proportional to size,简称PPS抽样。但是,总体单元大小的度量往往不止一个,比如度量一个企业的大小,可以是资金大小,也可以是产值或销售额的大小,还可以是人员的多少,因此通常用 表示规模大小的抽选概率。由于每个单元均有被抽中的概率, ,因此也称作PPZ抽样。
2、PPS抽样的实施方法
PPS抽样的实施方法有累积总和法、拉希里方法、规模累积等距抽选的方法和分裂法,本文这里选用规模累积等距抽选的方法。这种方法是在累积和的基础上采取等距抽样的方法。具体如下:
设总体单元数为 ,其规模度量分别为 , 论文服务,…, ,进行累积,直至 。若欲抽取样本的容量为n,则先求得等距抽样的间隔 ,然后在 之间随即等概率抽取一个数,假设为 ,则所 在的单元代码区间相应的单元即为被抽中的单元。以后每隔 个度量值,即 等数字所在的单元代码区间的相应单元,即为被抽中的单元。
这种抽样方法的特点是当所有单元的度量 时,它是不重复的抽样;当某个 时,则第i个单元有可能被重复抽中;当 时,则第 个单元肯定会被重复抽中。这种方法抽取样本比较容易,每个单元的被抽中概率与 的大小成比例,因而在我国得到广泛的应用。
3.Hansen-Hurvitz估计量
(1)总体总量的估计
1943年,汉森和赫维茨对PPS抽样提出了估计总体总量的估计量为:

其中 为入样的第 个单元的变量值, 为第 个单元根据其规模大小的入样概率。通常情况下若以该单元包含的元素单位为度量时, ,其中, 是总体总量的一个无偏估计量。
(2)方差估计量为:

三、实证分析
1、数据收集与处理
各地区按经营单位所在地分货物出口总额 单位:万美元
地区
|
2007年
|
2008年
|
地区
|
2007年
|
2008年
|
全 国
|
121777576
|
143069307
|
河 南
|
837492
|
1071890
|
北 京
|
4892639
|
5749961
|
湖 北
|
817294
|
1170891
|
天 津
|
3807405
|
4210299
|
湖 南
|
651540
|
841288
|
河 北
|
1700041
|
2400412
|
广 东
|
36931609
|
40566447
|
山 西
|
653249
|
925312
|
广 西
|
510916
|
734744
|
内蒙古
|
294439
|
359185
|
海 南
|
136446
|
158720
|
辽 宁
|
3532409
|
4206950
|
重 庆
|
450721
|
572205
|
吉 林
|
385706
|
477163
|
四 川
|
860596
|
1313249
|
黑龙江
|
1225712
|
1680624
|
贵 州
|
146547
|
190078
|
上 海
|
14384611
|
16914514
|
云 南
|
476828
|
498441
|
江 苏
|
20360978
|
23802941
|
西 藏
|
32636
|
70757
|
浙 江
|
12826397
|
15429623
|
陕 西
|
467525
|
538082
|
安 徽
|
881373
|
1136411
|
甘 肃
|
165866
|
160135
|
福 建
|
4993757
|
5699184
|
青 海
|
38591
|
41910
|
江 西
|
544459
|
772666
|
宁 夏
|
108567
|
125837
|
山 东
|
7511011
|
9319479
|
新 疆
|
1150217
|
1929910
|
表1中为2007年与2008年各地区按经营单位所在地分货物出口总额的原始数据,根据2007年货物出口总额采用PPS等距抽样法抽取13个省市做样本,以2007年货物出口总额作为规模 ,并进行累计,得下表。
地区
|
2007年出口额
|
累积和
|
代码范围
|
地区
|
2007年出口额
|
累积和
|
代码范围
|
|
|
北 京
|
4892639
|
4892639
|
1~4892639
|
湖 北
|
817294
|
79648972
|
78831679~79648972
|
|
天 津
|
3807405
|
8700045
|
4892640~8700045
|
湖 南
|
651540
|
80300512
|
79648973~80300512
|
|
河 北
|
1700041
|
10400085
|
8700046~10400085
|
广 东
|
36931609
|
117232121
|
80300513~117232121
|
|
山 西
|
653249
|
11053334
|
10400086~11053334
|
广 西
|
510916
|
117743036
|
117232122~117743036
|
|
内蒙古
|
294439
|
11347774
|
11053335~11347774
|
海 南
|
136446
|
117879482
|
117743037~117879482
|
|
辽 宁
|
3532409
|
14880183
|
11347775~14880183
|
重 庆
|
450721
|
118330203
|
117879483~118330203
|
|
吉 林
|
385706
|
15265888
|
14880184~15265888
|
四 川
|
860596
|
119190799
|
118330204~119190799
|
|
黑龙江
|
1225712
|
16491601
|
15265889~16491601
|
贵 州
|
146547
|
119337345
|
119190800~119337345
|
|
上 海
|
14384611
|
30876211
|
16491602~30876211
|
云 南
|
476828
|
119814173
|
119337346~119814173
|
|
江 苏
|
20360978
|
51237189
|
30876212~51237189
|
西 藏
|
32636
|
119846810
|
119814174~119846810
|
|
浙 江
|
12826397
|
64063587
|
51237190~64063587
|
陕 西
|
467525
|
120314334
|
119846811~120314334
|
|
安 徽
|
881373
|
64944960
|
64063588~64944960
|
甘 肃
|
165866
|
120480200
|
120314335~120480200
|
|
福 建
|
4993757
|
69938717
|
64944961~69938717
|
青 海
|
38591
|
120518791
|
120480201~120518791
|
|
江 西
|
544459
|
70483176
|
69938718~70483176
|
宁 夏
|
108567
|
120627359
|
120518792~120627359
|
|
山 东
|
7511011
|
77994187
|
70483177~77994187
|
新 疆
|
1150217
|
121777576
|
120627360~121777576
|
|
河 南
|
837492
|
78831678
|
77994188~78831678
|
|
|
|
|
|
将 除以样本量 ,得到抽样间隔 。在 之间抽一随机数R=2751684,处于北京的代码范围,因此北京作为抽中的样本。按照规模累积等距抽样法,依次抽到其他省市,分别是辽宁、上海、江苏、浙江、福建、山东、广东。其中广东作为出口大省被重复抽中4次,则广东省应入样4次,应计量4次;上海、江苏分别被抽中2次,则各入样2次论文服务,应计量2次。即总共8个省市入选。
2、总体总量的估计
这8个省市被抽选的概率为,分别为北京0.0402、辽宁0.0290、上海0.1181、江苏0.1672、浙江0.1053、福建0.0410、山东0.061678、广东0.3033,用这8个样本省市来估计2008年全国出口贸易总额,采用汉森―赫维茨估计量,由公式得:
故估计推断,全国31个省市2008年出口贸易总额为140837723万美元。
抽样的方差:
置信度为95%的置信区间为:

即: 所以置信区间为(137718364.1~143957081.9)
2008年,这31个省市的实际出口贸易总额为143069307万美元,位于置信区间内。
3、与简单随机抽样估计方法的比较分析
(1) 基于简单随机抽样的估计
用随机数抽取13个地区作为样本,具体如下所示:
1/2 1 2 下一页 尾页 |