概率统计中概念的对比分析
论文关键词:概率统计,概念,对比分析
概率统计在日常生活、生产实践和科学实验中的应用是非常广泛的.概率统计是新课程改革过程中重点加强的内容之一.有关概率统计的各种计算问题,既是中学数学教学的疑难问题,也是高考数学试题中考查的主要内容.解决这类问题的关键,在于对概念的理解和掌握.
为了有效的帮助学生解决有关概率的计算问题,本人曾写了《概率问题中的概念辨析》(中学生理科应试2007.2),对随机事件与随机试验、频率与概率、互斥事件与对立事件、互相独立事件与独立重复试验等概念进行了辨析.
但是,还有一些概念的含义也很难区分.例如,离散型随机变量与连续型随机变量、二项分布~与几何分布~、期望与方差、均方差与标准差、系统抽样与分层抽样、条形图与直方图、正态分布与标准正态分布,等等.
在学习概率统计中的各种概念时,同学们很难搞清楚其中的含义和区别.所以,很有必要对这些概念做进一步的对比分析.
一、离散型随机变量与连续型随机变量
如果随机试验的结果可以用一个变量来表示,那么就把这个变量叫做随机变量.随机变量常用希腊字母等表示.
对于随机变量所有可能的取值,如果我们能事先按一定的次序一一列出,这样的随机变量叫做离散型随机变量.例如,抛掷一枚骰子,设所得点数为随机变量,则所有可能的取值分别为1、2、3、4、5、6.这些取值,我们能够事先一一列举出来.这时,所得的随机变量就是离散型随机变量.
如果随机变量所有可能的取值,可以是某个区间内的任何一个值,这时,我们就不能够事先按一定的次序一一列出,这样的随机变量叫做连续型随机变量.例如,对某班学生的身高(或体重)进行测量,所得的数据是随机变量,则所有可能的取值是某个区间内的实数.事先,我们不能够把所有可能的取值一一列举出来.这时,所得的随机变量就是连续型随机变量.
二、二项分布~与几何分布~
在一次试验中,如果某事件发生的概率是,那么在次独立重复试验中,这个事件恰好发生次的概率为.于是得到随机变量的分布列
称这样的随机变量服从二项分布.记作~.
例如,设某人投篮时投中的概率为0.8,若连续投篮次,则投中次数是恰好为的概率是.这时,投中次数服从二项分布.记作~.
设某事件在一次试验中发生的概率是.如果,在次独立重复试验中这个事件第一次发生时,所作试验的次数为随机变量.那么,在第次试验时事件第一次发生的概率为.
于是,得到随机变量的分布列
称这样的随机变量服从几何分布.记作~.
例如,设某射击手有5发子弹,射击一次中靶的概率为0.9,若命中就停止射击,否则一直到子弹用尽,求耗子弹数的分布列.
因为,当时,耗子弹数的概率,此时服从几何分布,记作~;当时,.所求分布列为
|
1
|
2
|
3
|
4
|
5
|
P
|
0.9
|
0.09
|
0.009
|
0.0009
|
0.0001
|
三、期望与方差
若随机变量的值分别为时,相应的概率P分别为.则称
.
为随机变量的数学期望或平均数、均值,简称期望.同时把
.
叫做随机变量的均方差,简称方差.把均方差的算术平方根叫做标准差,记作.
例如.(2008年高考湖北理)袋中有20个大小相同的球,其中记上0号的有10个,记上n号的有n个(n=1,2,3,4).现从袋中任取一球.ξ表示所取球的标号.
(1)求ξ的分布列,期望和方差;
(2)若η=aξ-b,Eη=1,Dη=11,试求a,b的值.
解:(1)的分布列为:
∴
(2)
由,得a2×2.75=11,即又
所以,当a=2时,由1=2×1.5+b,得b=-2;当a=-2时,由1=-2×1.5+b,得b=4.
∴或即为所求.
四、系统抽样与分层抽样
系统抽样与分层抽样都是从总体中抽出一个样本的抽样方法.
如果,总体中的个体数较多,就将总体均衡的分成几个部分,按事先确定的规则,在每个部分中随机抽取数目相同的个体,得到的所需样本.这种抽样方法叫做系统抽样.
如果,总体由差异明显的几个部分组成,就把总体按其差异分成几个层次,分别在每一层中,按一定的比例抽随机取个体.这种抽样方法叫做分层抽样.
例(2009年广东卷文)某单位200名职工的年龄分布情况如图2,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是。若用分层抽样方法,则40岁以下年龄段应抽取人.
【答案】37, 20
【解析】根据系统抽样的方法,先均匀分组,然后规则抽取。由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.
由分层抽样是在不同层次中,按比例抽取。
1/2 1 2 下一页 尾页 |