第九章 2 第二节 用样本估计总体(教师用书word)-【金版新学案】2026年高考数学高三总复习大一轮复习讲义(湘教版)
2025-12-05
|
16页
|
25人阅读
|
1人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | - |
| 年级 | 高三 |
| 章节 | - |
| 类型 | 教案-讲义 |
| 知识点 | 用样本估计总体 |
| 使用场景 | 高考复习-一轮复习 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | DOCX |
| 文件大小 | 247 KB |
| 发布时间 | 2025-12-05 |
| 更新时间 | 2025-12-05 |
| 作者 | 山东正禾大教育科技有限公司 |
| 品牌系列 | 金版新学案·高考大一轮复习讲义 |
| 审核时间 | 2025-11-10 |
| 下载链接 | https://m.zxxk.com/soft/54796566.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学讲义聚焦“用样本估计总体”高考核心考点,涵盖集中趋势、离散程度、频率分布直方图及百分位数等内容,按知识内在逻辑构建“概念梳理-考点分层-真题回扣”体系,通过考点精析、方法归纳、真题演练环节,帮助学生系统突破统计量计算与应用难点。
资料以数学眼光观察数据分布规律,数学思维推理统计量关系,创新设计“百分位数步骤拆解”“直方图特征估计”等教学活动。设置基础检测、能力提升分层练习,配合真题再现强化应用,助力学生高效掌握统计核心素养,为教师把控复习节奏提供清晰指引。
内容正文:
第二节 用样本估计总体
【课程标准】 1.会用统计图表对总体进行估计,会求n个数据的第p百分位数. 2.能用数字特征估计总体集中趋势和总体离散程度.
1.用样本估计总体的集中趋势
(1)平均数:若样本容量为n,第i个个体是xi,则样本平均数=.平均数也称为均值.
(2)众数:观测数据中出现次数最多的数是众数,用M0表示.
(3)中位数:将一组观测数据按从小到大的顺序排列后,称处于中间位置的数是中位数,用Me表示.当数据个数为奇数时,处于中间位置的数就是中位数;当数据的个数是偶数时,则中间两个数的平均数即为中位数.
[微提醒] 平均数、中位数和众数的比较
名称
优点
缺点
平均数
与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
不受数据组中极端值的影响具有较好的稳定性
对极端值不敏感
众数
反映一组数据的集中趋势
众数是一个位置代表值,它不受数据中极端值的影响
2.用样本估计总体的离散程度
(1)极差:将一组数据中的最大值与最小值统称为极值,将最大值与最小值之差称为极差,也称全距,用R表示.
(2)方差
①总体方差:若设y1,y2,…,yN是总体的全部个体,μ是总体均值,则称
σ2=为总体方差或方差.
②样本方差:若从总体中随机抽样,获得n个观测数据x1,x2,…,xn,用表示这n个数据的均值,则称s2=[(x1-)2+(x2-)2+…+(xn-)2].为这n个数据的样本方差,也简称方差.
③分层抽样的方差:将总体分为两层,第一、二层的样本量分别为n1,n2,样本均值分别为,样本方差分别为,则全部样本的样本容量、样本均值和样本方差分别为n=n1+n2,=(n1+n2),s2={n1[+(-)2]+n2[+(-)2]}.
(3)标准差
标准差是方差的算术平方根.如果σ2是总体方差,则称σ=是总体标准差;如果s2是样本方差,则称s=是样本标准差.
即s=.
3.用频率分布直方图估计总体分布
众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
(3)众数:众数是频率分布直方图中最高矩形所在区间的中点所对应的数据.
4.百分位数
(1)定义:百分位数是位于按从小到大的顺序排列的一组数据中某一个百分位置的数值,以Pr表示,其中r是区间[1,99]内的整数.一个百分位数Pr将总体或样本的全部观测值分为两部分,至少有r%的观测值小于或等于它,且至少有(100-r)%的观测值大于或等于它,当r%=50%时,Pr即对应中位数.
学生用书⬇第262页
(2)计算一组n个数据的第P百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算c=n×r%.
第3步,若c不是整数,用m表示比c大的最小整数,则所求Pr是xm,如果c是整数,则所求的Pr是.
【常用结论】
(1)若x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,…,mxn+a的平均数为m+A.
(2)数据x1,x2,…,xn与数据x'1=x1+a,x'2=x2+a,…,x'n=xn+a的方差相等,即数据经过平移后方差不变.
(3)若x1,x2,…,xn的方差为s2,那么ax1+b,ax2+b,…,axn+b的方差为a2s2.
【自主检测】
1.(多选)下列说法正确的是( )
A.对一组数据来说,平均数和中位数总是非常接近
B.方差与标准差具有相同的单位
C.如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变
D.在频率分布直方图中,最高的小长方形底边中点的横坐标是众数
答案:CD
2.平均数和中位数都描述了数据的集中趋势,它们的大小关系和数据分布的形态有关,在如图两种分布形态中,a,b,c,d分别对应平均数和中位数之一,则可能的对应关系是( )
A.a为中位数,b为平均数,c为平均数,d为中位数
B.a为平均数,b为中位数,c为平均数,d为中位数
C.a为中位数,b为平均数,c为中位数,d为平均数
D.a为平均数,b为中位数,c为中位数,d为平均数
答案:A
解析:在频率分布直方图中,中位数两侧小矩形的面积和相等,平均数可以用每个小矩形底边中点的横坐标与小矩形的面积之积的和近似代替,结合两个频率分布直方图得:a为中位数,b为平均数,c为平均数,d为中位数.故选A.
3.某车间12名工人一天生产某产品(单位:kg)的数量分别为13.8,13,13.5,15.7,13.6,14.8,14,14.6,15,15.2,15.8,15.4,则所给数据的第25,50,75百分位数分别是 .
答案:13.7,14.7,15.3
解析:将12个数据按从小到大排序:13,13.5,13.6,13.8,14,14.6,14.8,15,15.2,15.4,15.7,15.8.由i=12×25%=3,得所给数据的第25百分位数是第3个数据与第4个数据的平均数,即P25==13.7;由c=12×50%=6,得所给数据的第50百分位数是第6个数据与第7个数据的平均数,即P50==14.7;由c=12×75%=9,得所给数据的第75百分位数是第9个数据和第10个数据的平均数,即P75==15.3.
4.(用结论)已知x1,x2,…,x10的平均值为6,方差为3,则2x1-1,2x2-1,…,2x10-1的平均值为 ,方差为 .
答案:11 12
解析:新数据的平均值为2×6-1=11,新数据的方差为22×3=12.
考点一 百分位数的估计自主练透
1.(2024·湖北武汉五调)已知一组数据1,2,3,4,x的第三四分位数是x,则x的取值范围为( )
A. B.[2,3]
C.[3,4] D.
答案:C
解析:在五个数中,第三四分位数为第二大的数,故1,2,3,4,x中第二大的数是x,所以3≤x≤4.故选C.
2.某工厂随机抽取部分工人,对他们某天生产的产品件数进行了统计,统计数据如表所示,则该组数据的产品件数的第60百分位数是( )
件数
7
8
9
10
11
人数
3
6
5
4
2
A.8.5 B.9
C.9.5 D.10
答案:B
解析:抽取的工人总数为20,20×60%=12,那么第60百分位数是所有数据从小到大排序后的第12项与第13项数据的平均数,第12项与第13项数据分别为9,9,所以第60百分位数是P60=9.故选B.
3.为了解“双减”政策实施后学生每天的体育活动时间,研究人员随机调查了某地区1 000名学生每天进行体育运动的时间,按照时长(单位:min)分成6组:第一组[30,40),第二组[40,50),第三组[50,60),第四组[60,70),第五组[70,80),第六组[80,90],经整理得到如图所示的频率分布直方图,则可以估计该地区学生每天体育活动时间的第25百分位数约为 min.
答案:47.5
解析:由10×0.01=0.1<0.25,10×0.01+10×0.02=0.3>0.25,故第25百分位数位于[40,50)内,则第25百分位数为P25=40+×10=47.5,可以估计该地区学生每天体育活动时间的第25百分位数约为47.5.
4.如图所示是由某市3月1日至3月10日的最低气温(单位:℃)绘制的折线统计图,由图可知这10天最低气温的第80百分位数是 .
答案:2
解析:由折线图可知,这10天的最低气温按照从小到大的顺序排列为-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8是整数,则这10天最低气温的第80百分位数是P80==2.
学生用书⬇第263页
计算一组n个数据第p百分位数的步骤
考点二 总体集中趋势的估计师生共研
(1)某射击运动员进行打靶练习,已知打十枪每发的环数分别为9,10,7,8,10,10,6,8,9,7,设其平均数为a,中位数为b,众数为c,则有( )
A.a>b>c B.c>a>b
C.b>c>a D.c>b>a
(2)(多选)某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法正确的是( )
A.频率分布直方图中第三组的频数为10
B.根据频率分布直方图估计样本的众数为75分
C.根据频率分布直方图估计样本的中位数为75分
D.根据频率分布直方图估计样本的平均数为75分
答案:(1)D (2)ABC
解析:(1)将9,10,7,8,10,10,6,8,9,7按从小到大的顺序排列为6,7,7,8,8,9,9,10,10,10,则众数为c=10,中位数为b=×(8+9)=8.5,平均数为a=×(6+7+7+8+8+9+9+10+ 10+10)=8.4,所以c>b>A.故选D.
(2)分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;因为众数的估计值是频率分布直方图中最高矩形底边的中点的横坐标,从图中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10= 0.65>0.5,所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)+75×(10×0.030)+85×(10×0.025) +95 ×(10×0.010)=73(分),故D错误.故选ABC.
频率分布直方图中的数字特征
1.众数:最高矩形的底边中点的横坐标.
2.中位数:中位数左边和右边的矩形的面积和应该相等.
3.平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.
对点练1.(1)(2024·新课标Ⅱ卷)某农业研究部门在面积相等的100块稻田上种植一种新型水稻,得到各块稻田的亩产量(单位:kg)并整理得下表:
亩产量
[900,950)
[950,1 000)
[1 000,1 050)
频数
6
12
18
亩产量
[1 050,1 100)
[1 100,1 150)
[1 150,1 200)
频数
30
24
10
根据表中数据,下列结论中正确的是( )
A.100块稻田亩产量的中位数小于1 050 kg
B.100块稻田中亩产量低于1 100 kg的稻田所占比例超过80%
C.100块稻田亩产量的极差介于200 kg至300 kg之间
D.100块稻田亩产量的平均值介于900 kg至1 000 kg之间
(2)(多选)(2024·山东菏泽三模)某灯具配件厂生产了一种塑胶配件,该厂质检人员某日随机抽取了100个该配件的质量指标值(单位:分)作为一个样本,得到如下所示的频率分布直方图,则(同一组中的数据用该组区间的中点值作代表)( )
A.m=0.030
B.样本质量指标值的平均数为75
C.样本质量指标值的众数小于其平均数
D.样本质量指标值的第75百分位数为85
答案:(1)C (2)ACD
解析:(1)对于A,因为前3组的频率之和0.06+0.12+0.18=0.36<0.5,前4组的频率之和0.36+0.30 =0.66>0.5,所以100块稻田亩产量的中位数所在的区间为[1 050,1 100),故A不正确;对于B,100块稻田中亩产量低于1 100 kg的稻田所占比例为×100%=66%,故B不正确;对于C,因为1 200-900=300,1 150-950=200,所以100块稻田亩产量的极差介于200 kg至300 kg之间,故C正确;对于D,100块稻田亩产量的平均值约为×(925×6+975×12+1 025×18+1 075×30+1 125×24+1 175×10)=1 067(kg),故D不正确.故选C.
(2)对于A,由题意知(0.010+0.015+0.035+m+0.010)×10=1,解得m=0.030,故A正确;对于B,样本质量指标值的平均数为55×0.1+65×0.15+75×0.35+85×0.3+ 95×0.1=76.5,故B错误;对于C,样本质量指标值的众数是=75<76.5,故C正确;对于D,前3组的频率之和为×10=0.60,前4组的频率之和为0.60+0.030×10=0.90,故第75百分位数位于第4组,设其为t,则×0.030+0.60=0.75,解得t=85,即第75百分位数为85,故D正确.故选ACD.
考点三 总体离散程度的估计多维探究
角度1 方差与标准差
(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
学生用书⬇第264页
试验序号i
1
2
3
4
5
6
7
8
9
10
伸缩率xi
545
533
551
522
575
544
541
568
596
548
伸缩率yi
536
527
543
530
560
533
522
550
576
536
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为,样本方差为s2.
(1)求,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果≥2,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
解:(1)由题意可知,zi=xi-yi(i=1,2,…,10)的值分别为:9,6,8,-8,15,11,19,18,20,12,
所以=zi=×(9+6+8-8+15+11+19+18+20+12)=11,
s2=×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+0+(19-11)2+(18-11)2+(20-11)2+(12-11)2]=61.
(2)由(1)知:=11,2=2=,故有≥2 ,
所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
利用样本的方差、标准差解决优化决策问题的依据
1.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
2.用样本估计总体就是利用样本的数字特征来描述总体的数字特征.
角度2 分层随机抽样的方差与标准差
(2025·黑龙江哈尔滨模拟)某校有高中生2 000人,为了获得该校全体高中生的身高信息,抽取了男、女生样本量均为25的样本,计算得到男生样本的均值为170,方差为16,女生样本的均值为160,方差为20,则总样本的方差为 .
答案:43
解析:因为男生样本的均值为170,女生样本的均值为160,所以总样本的均值为×170+×160=165,所以总样本的方差s2=×[16+(170-165)2]+×[20+(160- 165)2]=43.
计算分层随机抽样的方差的步骤
第一步:确定;
第二步:确定;
第三步:应用公式s2=[+]+·[+(-)2],计算s2.
对点练2.(1)(2025·湖南长沙一模)为调查某地区中学生每天睡眠时间,采用样本量比例分配的分层随机抽样,现抽取初中生800人,其每天睡眠时间均值为9小时,方差为1,抽取高中生1 200人,其每天睡眠时间均值为8小时,方差为0.5,则估计该地区中学生每天睡眠时间的方差为( )
A.0.94 B.0.96
C.0.75 D.0.78
(2)甲、乙两名学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲
82
81
79
78
95
88
93
84
乙
92
95
80
75
83
80
90
85
①求两位学生预赛成绩的平均数和方差;
②现要从中选派一人参加数学竞赛,从统计学的角度考虑,你认为选派哪位学生参加合适?请说明理由.
答案:(1)A
解析:(1)该地区中学生每天睡眠时间的平均数为=8.4(小时),则该地区中学生每天睡眠时间的方差为×[1+(9-8.4)2]+×[0.5+(8-8.4)2] =0.94.故选A.
(2)①=×(82+81+79+78+95+88+93+84)=85,
=×(92+95+80+75+83+80+90+85)=85,
=×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,
=×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85- 85)2]=41.
②由(1)知=<,
甲的成绩较稳定,所以派甲参赛比较合适.
学生用书⬇第265页
[真题再现] 1.(多选)(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则( )
A.两组样本数据的样本平均数相同
B.两组样本数据的样本中位数相同
C.两组样本数据的样本标准差相同
D.两组样本数据的样本极差相同
答案:CD
解析:设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为+c,m+c,σ,t,因为c≠0,所以A,B不正确,C,D正确.故选CD.
2.(多选)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值, x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5 的标准差不小于 x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
答案:BD
解析:对于A,如1,2,2,2,2,5的平均数不等于2,2,2,2的平均数,故A错误;对于B,不妨设x1≤x2≤x3≤x4≤x5≤x6,可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数,均为,故B正确;对于C,因为x1是最小值,x6是最大值,则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标准差,例如:1,4,4,4,4,7,则平均数n=×(1+4×4+7)=4,标准差s1=,4,4,4,4,则平均数m=4,标准差s2=0,显然>0,即s1>s2,故C错误;对于D,不妨设x1≤x2≤x3≤x4≤x5≤x6,则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6时,等号成立,故D正确.故选BD.
[教材呈现] 1.(人教A必修二P189T6)数据x1,x2,…,xn的平均数为,数据y1,y2,…,yn的平均数为,a,b为常数.如果满足y1=ax1+b,y2=ax2+b,…,yn=axn+b.证明=a +b
2.(湘教版必修一P264T4)在某次测量中得到的A样本数据为:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.众数 B.平均数
C.中位数 D.标准差
点评:高考题考查平均数、中位数、标准差、极差的定义等基础知识,高考题与教材题相似度极高.
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。