内容正文:
5.1.4 用样本估计总体
1.会求样本的平均数、标准差、方差.(重点)
2.理解用样本的数字特征估计总体的数字特征的方法.(重点)
3.会应用相关知识解决实际统计问题.(难点)
1.通过样本数字特征的学习,体现了数据分析的核心素养.
2.借助用样本的数字特征解决实际问题,提升数学运算的核心素养.
中国体育彩票的种类有很多.体育彩票市场曾创造了无数的神话,相当一部分中奖者在谈及自己的中奖经历时都表示他们能够中奖,是经过长期研究体育彩票的走势及中奖号码分布特点后(即作出频率分布表),精心选号的结果.所以说彩民之所以能中大奖是因为他们“推测”的方法是科学的,“推测”的结果是比较可靠的.那么他们是如何“推测”的呢?
问题:(1)你认为应该从哪些方面对彩票进行“推测”?
(2)他们是如何处理中奖数据的?
[提示] (1)他们把中奖号码绘制成图、表等进行观察,分析中奖号码的分布、走势,以此去推测、估计下次的中奖号码.
其主要是利用中奖号码的分布去估计下期中奖号码的分布.
(2)绘成图、表进行分析.
知识点1 用样本的数字特征估计总体的数字特征
1.在容许一定误差存在的情况下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.
(1)估计一般是有误差的.例如,总体平均数可以大于样本均值,也可以等于样本均值,还可以小于样本均值.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差将越来越小.
(2)一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
2.样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.
条
件
假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2
结
论
如果记样本均值为,样本方差为b2,则=,b2=
1.下列说法不正确的是( )
A.方差是标准差的平方
B.标准差的大小不会超过极差
C.若一组数据的值大小相等,没有波动变化,则标准差为0
D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散
D [标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数的周围越分散.]
2.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均环数
8.6
8.9
8.9
8.2
方差s2
3.5
3.5
2.1
5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是( )
A.甲 B.乙 C.丙 D.丁
C [由表可知,乙、丙的成绩最好,平均环数都为8.9,但乙的方差大,说明乙的波动性大,所以丙为最佳人选.]
知识点2 用样本的分布估计总体的分布
(1)如果样本的容量恰当,抽样方法又合理,样本的分布与总体分布会差不多.特别地,每一组的频率与总体对应的频率相差不会太大.
(2)同数字特征的估计一样,分布的估计一般也有误差.如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,(πi-pi)2=[(π1-p1)2+(π2-p2)2+…+(πn-pn)2]不等于零.同样,大数定律可以保证,当样本的容量越来越大时,上式很小的可能性将越来越大.
3.已知样本10,8,10,8,6,13,11,10,12,7,9,8,12,9,11,12,9, 10,11,10,那么频率为0.2的范围是( )
A.5.5~7.5 B.7.5~9.5
C.9.5~11.5 D.11.5~13.5
D [样本容量为20,频率为0.2的数有4个,而在11.5~13.5之间的数有13,12,12,12,共4个,其他的都不正确.]
4.为了解中学300名男生的身高情况,随机抽取若干名男生进行身高测量,将所得数据整理后,画出频数分布直方图(如图).估计该校男生的身高在169.5 cm~174.5 cm之间的人数有( )
A.12 B.48 C.72 D.96
C [根据图形,身高在169.5 cm~174.5 cm之间的人数的百分比为:×100%=24%,
∴该校男生的身高在169.5 cm~174.5 cm之间的人数有300×24%=72(人).故选C.]
类型1 用样本对总体进行估计
【例1】 某公司员工年收入的频率分布直方图如下:
(1)估计该公司员工年收入的众数、中位数、平均数(同一组中的数据用该组区间的中点值为代表);
(2)假设你到人才市场找工作,该公司招聘人员告诉你,“我们公司员工的年平均收入超过13万元”,你认为招聘人员对该公司员