内容正文:
5.1.4 用样本估计总体
知识层面
1.会求样本的平均数、标准差、方差. 2.理解用样本的数字特征估计总体的数字特征的方法.3.会应用相关知识解决实际统计问题.
素养层面
通过样本数字特征的学习,提升数据分析素养;借助用样本的数字特征解决实际问题,提升数学运算素养.
中国体育彩票的种类有很多.体育彩票市场曾创造了无数的神话,相当一部分中奖者在谈及自己的中奖经历时都表示他们能够中奖,是经过长期研究体育彩票的走势及中奖号码分布特点后(即作出频率分布表),精心选号的结果.所以说彩民之所以能中大奖是因为
学生用书第60页
他们“推测”的方法是科学的,“推测”的结果是比较可靠的.那么他们是如何“推测”的呢?
问题1.你认为应该从哪些方面对彩票进行“推测”?
提示:把中奖号码绘制成图、表等进行观察,分析中奖号码的分布、走势,以此去推测、估计下次的中奖号码.其主要是利用中奖号码的分布去估计下期中奖号码的分布.
问题2.他们是如何处理中奖数据的?
提示:绘成图、表进行分析.
知识点 用样本估计总体
1.用样本估计总体
(1)前提
样本的容量恰当,抽样方法合理.
(2)必要性
①在容许一定误差存在的前提下,可以用样本的数字特征估计总体的数字特征,这样能节省人力和物力等.
②有时候总体的数字特征不可能获得,只能用样本的数字特征去估计总体的数字特征.
(3)误差
估计一般是有误差的.但是,大数定律可以保证,当样本的容量越来越大时,估计的误差很小的可能性将越来越大.
2.用样本的数字特征估计总体的数字特征
(1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.
(2)样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.
条件
假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2
结论
如果记样本均值为,样本方差为b2,则=,b2=
3.用样本的分布来估计总体的分布
如果总体在每一个分组的频率记为π1,π2,…,πn,样本在每一组对应的频率记为p1,p2,…,pn,一般来说,(πi-pi)2不等于零.当样本的容量越来越大时,上式很小的可能性将越来越大.
1.李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期,收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
序号
1
2
3
4
5
6
7
8
9
10
质量/千克
14
21
27
17
18
20
19
23
19
22
据调查,市场上今年樱桃的批发价格为每千克15元,用所学的统计知识估计今年此果园樱桃的总产量与按批发价格销售樱桃所得的总收入分别约为( )
A.200千克,3 000元
B.1 900千克,28 500元
C.2 000千克,30 000元
D.1 850千克,27 750元
答案:C
解析:样本平均数为(14+21+27+17+18+20+19+23+19+22)÷10=20(千克).由此可估计每棵樱桃树所产樱桃质量平均约为20千克,所以这100棵樱桃树所产樱桃的质量约为20×100=2 000(千克).根据樱桃批发价格为每千克15元,可得总收入约为15×2 000=30 000(元).故选C.
2.(多选)对于用样本分布估计总体分布的过程,下列说法不正确的是( )
A.总体容量越大,估计越精确
B.总体容量越小,估计越精确
C.样本容量越大,估计越精确
D.样本容量越小,估计越精确
答案:ABD
解析:样本为所研究的具体对象,样本容量越大,越能反映总体情况,估计越精确.总体容量不影响样本估计结果.故选ABD.
学生用书第61页
3.在一次模拟考试后,从高三某班随机抽取了20位学生的数学成绩,其分布如下:
分组
[90,100)
[100,110)
[110,120)
[120,130)
[130,140)
[140,150]
频数
1
2
6
7
3
1
分数在130分(包括130分)以上者为优秀,据此估计该班的优秀率约为( )
A.10% B.20%
C.30% D.40%
答案:B
解析:由表可知,优秀的人数为3+1=4,则优秀率为=20%,故据此估计该班的优秀率约为20%.故选B.
4.如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为( )
A.3,5 B.5,5
C.3,7 D.5,7
答案:A
解析:甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y=5.又甲、乙两组数据的平均值相等,所以×(56+65+62+74+70+x)=×(59+61+67+65+78),所以x=3.故选A.
5.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用右面的柱形图表示.根据柱形图估计该校学生这一天平均的课外阅读时间为________h.
答案:0.9
解析:由题意得,
=0.9.
题型一 用样本的数字特征估计总体的数字特征
例1 (新课标全国卷Ⅱ节选)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图(如图1)和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
图1
B地区用户满意度评分的频数分布表
满意度评分分组
[50,60)
[60,70)
[70,80)
[80,90)
[90,100]
频数
2
8
14
10
6
在图2中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
图2
[思路点拨] 先依据B地区用户满意度评分的频数分布表中的频数作出B地区的频率分布直方图,再比较A、B两地的直方图得出平均值和分散程度的情况.
解:B地区用户满意度评分的频率分布直方图如下图所示.
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
学生用书第62页
频率分布直方图中数字特征的求解技巧
若频率分布直方图的横轴是区间形式,则各数字特征可以近似估计如下:
(1)中位数:频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值.
(2)平均数:平均数的估计值等于频率分布直方图中每个矩形的高度(面积)与相应区间的中点值(有时也用左端点值或右端点值)之积的总和.
(3)众数:在频率分布直方图中,众数约为最高的矩形对应区间的中点值.
[注意] 利用频率分布直方图求出的众教、中位数、平均数均为近似值,往往与由实际数据得出的结果不一致,但通过它们能粗略地估计众数、中位数和平均数.
对点练1.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图所示,则
(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.
(2)这20名工人中一天生产该产品数量的中位数为________.
(3)这20名工人中一天生产该产品数量的平均数为________.
答案:(1)13 (2)62.5 (3)64
解析:(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13.
(2)设中位数为x,则0.2+(x-55)×0.04=0.5,x=62.5.
(3)0.20×50+0.40×60+0.25×70+0.10×80+0.05×90=64.
题型二 用样本的分布估计总体的分布
例2 某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图.
(1)在总体的400名学生中,估计分数小于70的频率;
(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;
(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.
解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.04+0.02)×10=0.6.
所以样本中分数小于70的频率为1-0.6=0.4.
所以在总体的400名学生中,分数小于70的频率估计为0.4.
(2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,
分数在区间[40,50)内的人数为100-100×0.9-5=5.
所以总体中分数在区间[40,50)内的人数估计为400×=20.
(3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×=30.
所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.
所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.
1.总体的分布分两种情况
(1)当总体中的个体取值很少时,用茎叶图估计总体的分布.
(2)当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.
2.利用频率分布直方图求数字特征
(1)在频率分布直方图中,众数是最高的矩形的底边的中点.
(2)在频率分布直方图中,中位数左边和右边的直方图的面积相等.
(3)平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
学生用书第63页
对点练2.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y
[-0.20,0)
[0,0.20)
[0.20,0.40)
[0.40,0.60)
[0.60,0.80)
企业数
2
24
53
14
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
解析:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,
s2=i(yi-)2
=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]
=0.029 6,所以s==0.02×≈0.17,
所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.
1.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均环数
8.6
8.9
8.9
8.2
方差s2
3.5
2.1
3.5
5.6
从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是( )
A.甲 B.乙
C.丙 D.丁
答案:B
解析:由表可知,乙、丙的成绩最好,平均环数都为8.9,但丙的方差大,说明丙的波动性大,所以乙为最佳人选.
2.为了解某中学300名男生的身高情况,随机抽取若干名男生进行身高测量,将所得数据整理后,画出频数分布直方图(如图).估计该校男生的身高在169.5 cm~174.5 cm之间的人数有( )
A.12 B.48
C.72 D.96
答案:C
解析:根据图形,身高在169.5 cm~174.5 cm之间的人数的百分比为:×100%=24%,所以该校男生的身高在169.5 cm~174.5 cm之间的人数有300×24%=72(人).故选C.
3.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图所示,则甲、乙两人这几场比赛得分的中位数之和是( )
甲
乙
5 2
5 4
9 7 6 1
9 4
0
1
2
3
4
5
3 4 6
3 6 7 8
3 8 9
1
A.63 B.64
C.65 D.66
答案:A
解析:甲、乙两人在这几场比赛中得分的中位数分别是36和27,则中位数之和是36+27=63.故选A.
4.在“争创美丽校园,争做文明学生”示范校评比活动中,10位评委给某校的评分情况如下表所示:
评分/分
80
85
90
95
评委人数
1
2
5
2
则这10位评委评分的平均数是________分.
答案:89
解析:==89.
学科网(北京)股份有限公司
$$