内容正文:
11.1 用样本估计总体
返回目录
知识清单
知识点1 抽样方法
简单随机抽样与分层随机抽样
类别 简单随机抽样 分层随机抽样
特点 从总体中逐个抽取 将总体分成互不交叉的层,然后在各
层中按同一比例抽样
适用范围 总体个体数较少 总体由差异明显的几部分组成
共同点 (1)抽样过程中每个个体被抽到的可能性相等;
(2)一般是不放回抽样
相互联系 分层随机抽样中,各层抽样时采用简单随机抽样
返回目录
知识点2 统计图表
1.常见的统计图有条形图、扇形图、折线图、频率分布直方图等.
2.画频率分布直方图的步骤
(1)求极差;(2)决定组数与组距;(3)将数据分组;(4)列出频率分布表;(5)画出频率分布直
方图.
返回目录
知识点3 样本的数字特征
1.百分位数
计算一组n个数据的第p百分位数的步骤:
(1)按从小到大的顺序排列原始数据;
(2)计算i=n×p%;
(3)若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百
分位数为第i项与第(i+1)项数据的平均数.
注意 中位数是第50百分位数.
返回目录
2.众数、中位数、平均数
数字特征 样本数据 频率分布直方图
众数 出现次数最多的数据 最高的小长方形下底边中点的横坐
标
中位数 将数据按从小到大(或从大到小)的顺
序依次排列,处在最中间位置的一个
数据(或中间两个数据的平均数) 把频率分布直方图划分为左右两个
面积相等的部分时,分界线与x轴交
点的横坐标
平均数 样本数据的算术平均数 每个小长方形的面积与小长方形下
底边中点的横坐标乘积之和
返回目录
3.方差和标准差
方差:s2= [(x1- )2+(x2- )2+…+(xn- )2]= (xi- )2或 - .
标准差:
s= =
4.利用按比例分配分层(两层)随机抽样获得的样本中,第一层的样本量为n1,平均数为 ,
方差为 ;第二层的样本量为n2,平均数为 ,方差为 .则
总样本平均数为 = + ,
总样本方差为s2= [ +( - )2]+ ·[ +( - )2].
返回目录
如果样本量是按比例分配的,第1,2,3层的样本量分别为l,m,n,各层的样本平均数分别为
, , ,则总样本平均数为 + + .
返回目录
即练即清
1.判断正误.(对的打“√”,错的打“✕”)
(1)分层随机抽样中,每个个体被抽到的可能性与层数及分层有关. ( )
(2)在实数集中随机抽取10个数分析奇偶性,可选用简单随机抽样. ( )
(3)对一组数据来说,平均数和中位数总是非常接近. ( )
(4)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越大.
( )
(5)一组数据的平均数、中位数、百分位数、众数一定不是原数据中的数. ( )
✕
√
✕
✕
✕
返回目录
2.完成下列两项调查:
①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调
查社会购买能力的某项指标.此调查宜采用的抽样方法是__________________.
②从某中学的15名艺术特长生中选出3名调查学习负担情况.此调查宜采用的抽样方法
是__________________.
②简单随机抽样
①分层随机抽样
返回目录
3.若数据1,2,2,3,4,5,6,6,7,8的中位数为m,60%分位数为a,则m=_______,a=________.
5.5
4.5
返回目录
4.某厂有A,B两条生产线制造同一型号可充电电池,现采用比例分配的分层随机抽样法,
从某天两条生产线上的成品中随机抽取20件成品,测试产品可充电次数的均值及方差,
结果如表:
项目 抽取成品数 样本均值 样本方差
A生产线产品 8 210 1
B生产线产品 12 200 1
则20个产品组成的总样本的方差为__________.
25
返回目录
考点清单
考点 抽样方法与总体分布的估计
角度1 抽样方法
典例1 (2025届安徽阜阳三中月考)某中学高二年级有学生500人,其中男生300人,女生
200人,现获得全体学生的身高信息,采用比例分配的分层随机抽样方法,抽取了容量为5
0的样本,经计算得到样本中男生身高(单位:cm)的平均数为171,方差为29;女生身高(单
位:cm)的平均数为161,方差为19.则下列说法中不正确的是 ( )
A.样本中有30名男生的身高信息
B.每个男生的身高信息被抽入到样本的概率均为
D
返回目录
C.样本的平均数为167
D.样本的方差为45
解析 对于A,由题意可知,样本中有300×=30(名)男生的身高信息,因此A中说法正确;
对于B,每个男生的身高信息被抽入到样本的概率均为 = ,因此B中说法正确;
对于C,由题意得样本的平均数为 =167,因此C中说法正确;
对于D,样本的方差s2= ×[29+(171-167)2]+ ×[19+(161-167)2]=49,因此D中说法不正确.故选D.
×
×
返回目录
解题技巧 1.简单随机抽样常用抽签法(适用于总体中个体数较少的情况)、随机数法
(适用于个体数较多的情况).
2.进行比例分配的分层随机抽样的相关计算时,常用到以下两个关系:
第1层 第2层 … 第k层 总计
总体 N1 N2 … Nk N
样本 n1 n2 … nk n
(1)抽样比= ,
各层的抽样比相等: = =…= = ;
(2)n1∶n2∶…∶nk=N1∶N2∶…∶Nk.
返回目录
变式训练
1.(情境模型变式)已知某班共有学生46人,该班语文老师为了了解学生每天阅读课
外书籍的时长情况,决定利用随机数法从全班学生中抽取10人进行调查.将46名学生按
01,02,…,46进行编号.现提供随机数表的第7行至第9行:
84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76
63 01 63 78 59 16 95 56 57 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79
33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54
若从表中第7行第41列开始向右依次读取2个数据,每行结束后,下一行依然从左向右读
数,则得到的第8个样本编号是__________.
44
返回目录
解析 由题意可知,得到的样本编号依次为12,06,01,16,19,10,07,44,39,38,则得到的第8
个样本编号是44.
返回目录
角度2 统计图表
典例2 (多选)(2025届广东执信中学测试,9)如图所示的是2024年中国大学生使用App
偏好及目的统计图,根据统计图,下列关于2024年中国大学生使用App的结论正确的是
( )
AC
返回目录
A.超过 的大学生更爱使用购物类App
B.超过半数的大学生使用App是为了学习与生活需要
C.使用App偏好情况中7个占比数字的极差是23%
D.使用App的目的中6个占比数字的40%分位数是34.3%
返回目录
解析 对于A,根据题图知,大学生使用购物类App的占比为25.7%,大于 ,A正确;
对于B,根据题图知,大学生使用App是为了学习与生活需要的占比为34.3%+14.0%=48.3%,B错误;
对于C,根据题图知,使用App偏好情况中7个占比数字的极差是25.7%-2.7%=23%,C正确;
对于D,根据题图知,使用App的目的中6个占比数字从小排到大分别为0.6%,8.4%,14.
0%,16.3%,26.4%,34.3%,又6×40%=2.4,所以40%分位数是14.0%,D错误.故选AC.
返回目录
归纳总结 统计图表的主要应用
1.扇形图:直观描述各类数据占总数的比例.
2.折线图:描述数据随时间的变化趋势.
3.条形图和直方图:直观描述不同类别或分组数据的频数和频率.
返回目录
变式训练
2.(关键元素变式)(多选)(2026届河北保定四校联考,9)如图所示的是我国2023年第
四季度至2024年第四季度的折叠屏手机出货量、同比(与上一年同期相比)增长率统计
图,则关于这5个季度的数据说法正确的是 ( )
ABD
返回目录
A.折叠屏手机季度出货量的极差不超过92万台
B.折叠屏手机季度出货量的中位数为250.5万台
C.与2023年第二季度相比,2024年第三季度折叠屏手机的出货量增加13.7%
D.2024年前3个季度折叠屏手机的同比增长率均为正数
返回目录
解析 折叠屏手机季度出货量的极差为2 771-1 857=914千台,即91.4万台,因此A正确;
将折叠屏手机季度出货量(千台)从小到大排列为1 857,2 233,2 505,2 571,2 771,故中位
数为2 505千台,即250.5万台,因此B正确;
同比是指与上一年同期相比,故折叠屏手机2024年第三季度的出货量比2023年第三季
度的出货量增加13.7%,因此C错误;
由题图可知,2024年前3个季度折叠屏手机的同比增长率均为正数,因此D正确.故选
ABD.
返回目录
角度3 总体集中趋势的估计
典例3 为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随
机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每
只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出
残留在小鼠体内离子的百分比.根据试验数据分别得到如图所示的直方图:
返回目录
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值
为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为
代表).
返回目录
解析 (1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
返回目录
解题技巧 1.频率分布直方图的几个特点
(1)纵轴表示频率/组距;
(2)频率分布直方图中各个小矩形高的比就是相应各组的频率之比;
(3)频率分布直方图中各小矩形的面积是相应各组的频率,所有小矩形的面积之和等于
1,即频率之和为1.
2.数字特征在频率分布直方图中的体现
(1)平均数: = xiSi(xi表示第i个小矩形底边中点的横坐标,Si表示第i个小矩形的面积).
(2)方差:s2= (xi- )2·Si.
返回目录
(3)众数:最高小矩形底边中点的横坐标.
(4)中位数:把频率分布直方图划分为左右两个面积相等的部分时,分界线与横轴交点的
横坐标.
(5)百分位数:类比中位数,百分位数所在直线把频率分布直方图划分为左右两个部分,
左边所有矩形的面积和为p%.中位数是第50百分位数.
求解公式:已知频率分布直方图的组距为d.
①找出百分位数所在的区间[a,b);
②第p百分位数=a+d· .
返回目录
变式训练
3.(关键结论变式)近几年,我国新能源汽车行业呈现一片生机勃勃的景象.电动汽车因其智能性与操控感越来越被人们接受与认可,尤其是其辅助驾驶功能.某品牌电动汽车公司为了更好地了解车主使用辅助驾驶功能的情况,进行了问卷调查,从中抽取了100位车主进行抽样分析,分析100位车主在100次驾驶途中使用辅助驾驶功能的次数,得到如下频率分布直方图(60次及以上的称为经常使用辅助驾驶功能),则下列结论错误的是( )
D
返回目录
A.b=0.005
B.估计车主在100次驾驶途中使用辅助驾驶功能的次数的平均数低于70(同一组中的数
据用该组区间的中点值为代表)
C.从这100位车主中随机选取一位车主,则这位车主经常使用辅助驾驶功能的概率约为
D.按照“经常使用辅助驾驶功能”的人与“不经常使用辅助驾驶功能”的人进行分
层随机抽样,从这100人中抽取12人,则在经常使用辅助驾驶功能的人中应抽取8人
返回目录
解析 对于A,由频率分布直方图可得2b+0.015+0.020+0.025+0.030=0.1,解得b=0.005,
因此A正确;对于B,使用辅助驾驶功能的次数的平均数为45×0.005×10+55×0.020×10+6
5×0.025×10+75×0.030×10+85×0.015×10+95×0.005×10=69.5,因此B正确;对于C,使用辅
助驾驶功能的次数不少于60的频率为1-(0.005+0.020)×10=0.75,因此C正确;对于D,“经
常使用辅助驾驶功能”的人与“不经常使用辅助驾驶功能”的人的频率之比为 ∶
=3∶1,故从这100人中抽取12人,在经常使用辅助驾驶功能的人中应抽取 ×12=9人,因
此D错误.故选D.
返回目录
4.(设问条件变式)(2026届辽宁名校联盟联考,15)在高中学段学生综合素质评价平台
上对某校高三年级学生参加社区服务的次数进行统计,随机抽取M名学生作为样本,得
到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分
布直方图.
分组 频数 频率
[10,15) 10 0.25
[15,20) 24 n
[20,25) m p
[25,30] 2 0.05
合计 M 1
返回目录
(1)求出表中M,p及图中a的值;
(2)若该校高三年级学生有840人,试估计该校高三年级学生参加社区服务的次数在区
间[10,15)内的人数;
(3)估计该校高三年级学生参加社区服务次数的中位数.(结果精确到0.01)
返回目录
解析 (1)由题表可得M= =40,n= =0.6,
所以p=1-0.25-0.6-0.05=0.1,
a= =0.12.
(2)因为该校高三年级学生有840人,在区间[10,15)内的频率是0.25,
所以估计该校高三年级学生参加社区服务的次数在区间[10,15)内的人数为840×0.25=210.
(3)因为0.25<0.5,且0.25+0.6>0.5,所以中位数在区间[15,20)内,
设中位数为x,则0.25+0.12(x-15)=0.5,解得x≈17.08.
所以估计该校高三年级学生参加社区服务次数的中位数是17.08.
返回目录
角度4 总体离散程度的估计
典例4 某市为了解新高三学生的数学学习情况,以便为即将展开的一轮复习提供准确
的数据,在开学初该市教体局组织高三学生进行了一次摸底考试,现从参加考试的学生
中随机抽取200名,根据统计结果,将他们的数学成绩(满分150分)分为[70,80),[80,90),
[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]共8组,得到如图所示的频率分
布直方图.
(1)设事件A=“从参加考试的学生中随机抽取1名学生,该学生的成绩不低于110分”,
估计事件A发生的概率;(用频率估计概率)
(2)利用所给数据估计本次数学考试成绩的平均数及方差(各组数据以其中点值作代
表).
参考数据:(x1- )2=998.56,(x2- )2=466.56,(x3- )2=134.56,(x4- )2=2.56,(x5- )2=70.56,(x6- )2=
返回目录
338.56,(x7- )2=806.56,(x8- )2=1 474.56,其中xi(i=1,2,…,8)为第i组数据的中点值.
返回目录
解析 (1)∵(0.004+0.008+0.016+0.034+m+0.008+0.004+0.002)×10=1,∴m=0.024,
故估计事件A发生的概率为(0.024+0.008+0.004+0.002)×10=0.38.
(2)估计本次数学考试成绩的平均数为(75×0.004+85×0.008+95×0.016+105×0.034+115×
0.024+125×0.008+135×0.004+145×0.002)×10=106.6,
估计本次数学考试成绩的方差为(998.56×0.004+466.56×0.008+134.56×0.016+2.56×0.034+70.56×0.024+338.56×0.008+806.56×0.004+1 474.56×0.002)×10=205.44.
返回目录
变式训练
5.(情境模型变式)(2023全国乙理,17,12分)某厂为比较甲、乙两种工艺对橡胶产品
伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随
机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.
甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
试验
序号i 1 2 3 4 5 6 7 8 9 10
伸缩
率xi 545 533 551 522 575 544 541 568 596 548
伸缩
率yi 536 527 543 530 560 533 522 550 576 536
返回目录
记zi=xi-yi(i=1,2,…,10),记z1,z2,…,z10的样本平均数为 ,样本方差为s2.
(1)求 ,s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否
有显著提高 如果 ≥2 ,则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后
的橡胶产品的伸缩率有显著提高,否则不认为有显著提高 .
返回目录
解析 (1)zi=xi-yi(i=1,2,···,10)依次为9,6,8,-8,15,11,19,18,20,12,则 = ×(9+6+8-8+15+11
+19+18+20+12)=11,
s2= ×[(9-11)2+(6-11)2+(8-11)2+(-8-11)2+(15-11)2+(11-11)2+(19-11)2+(18-11)2+(20-11)2+(12-
11)2]=61.
(2)由(1)知 =11,s2=61,则 -2 =11-2 >0,∴ ≥2 ,即甲工艺处理后的橡胶产品的
伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高.
返回目录
$