内容正文:
[每日格言】再长的路,一步步也能走完;再短的路,
作亚(一)
抽样的基本方法、用样本
1知识整合
1.获取数据的途径
(1)对于需要使用数据的人而言,获取数据
的方法有两种:直接获取与间接获取
(2)一般地说,在调查过程中,有两种获取
数据的方法:普查和抽样调查.
(3)总体和样本
名称
定义
总体
调查对象的全体称为总体
样本
被抽取的一部分称为样本
个体
构成总体的每一个对象称为个体
样本容量
样本中个体的数目叫做样本容量
2.抽样的基本方法
(1)简单随机抽样
一般地,从N(N为正整数)个不同个体构
成的总体中,逐个不放回地抽取n(1≤n<N)
个个体组成样本,并且每次抽取时总体内
的每个个体被抽到的可能性相等,这样的
抽样方法叫做简单随机抽样.简单随机抽
样通常采用抽签法和随机数法,
(2)分层随机抽样
将总体按其属性特征分成互不交叉的若干
类型(有时称作层),然后在每个类型中按
照所占比例抽取一定的个体,这种抽样的
方法叫做分层随机抽样,
3.频率分布直方图
(1)频率分布直方图中每个矩形的底边长
是该组的组距,矩形的高是该组的频率与
2
不迈开双脚也无法到达。
高一数学(配BSD版)
今
月
星期
计总体分布
天气
组距的比,从而矩形的面积等于这个组的
频率,即矩形的面积=组距×频率
=频
组距
率.我们把这样的图叫做频率分布直方图.
频率分布直方图以面积的形式反映了数据
落在各个小组的频率的大小
(2)画频率分布直方图的步骤
①计算极差;
②确定组距与组数;
③分组;
④列表;
⑤画频率分布直方图.
[常用结论]
1.分层抽样相关计算
样本容量该层抽取的个体数
(1)总你的个数=该层的个体数
(2)总体中某两层的个体数之比等于样本
中这两层抽取的个体数之比.
2.频率分布直方图的性质
(1)因为小矩形的面积=组距×频率=频
组距
率,所以各小矩形的面积表示相应各组的
频率.这样,频率分布直方图就以面积的形
式反映了数据落在各个小组内的频率
大小.
(2)在频率分布直方图中,各小矩形的面积
之和等于1.
(3)样本容量=
频数
相应的频率·
寒假作业海不辞水,故能成其大;山不辞土石,
2基础演练
1.(多选)下列各项调查的方式中你认为合理
的有
(
A.为了调查某批次汽车的抗撞击能力,采
用普查的方式
B.为了调查市场上某种食品的色素含量
是否符合国家标准,采用抽样调查的
方式
C.对货运飞船“天舟六号”零部件的检查,
采用普查调查的方式
D.为了了解全校同学喜欢课程情况,对某
班男同学进行抽样调查
2.某市举行以“学习党的二十大精神,培根铸
魂育新人”为主题的中小学教师演讲比赛,
若将报名的50位教师编号为00,01,…,
49,利用下面的随机数表来决定他们的出
场顺序,选取方法是从下面随机数表第1
行第5列开始横向依次选取两个数字,重
复的剔除,则选出来的8个个体的编号为
()
45673212
1231
020104
52
152001
1251
29
32
04
9234
493582
00362348
6969387481
A.12
B.20
C.29
D.23
3.某校高三一班有学生54人,二班有学生
42人,现在要用分层随机抽样的方法从两
个班抽出16人参加军训表演,则两班分别
被抽取的人数是
()
A.8,8
B.10,6
C.9,7
D.12,4
2
数能成其高。
[每日格言]
4.容量为100的样本数据,分组后的频数如
下表:
分组[40,50)[50,60)[60,70)[70,80)[80,90)
[90,100]
频数
5
12
20
38
17
8
则样本数据落在区间[80,100]内的频率是
(
A.0.25
B.0.35
C.0.45
D.0.55
3综合演练
1.(多选)为确保食品安全,某市质检部门检
查1000袋方便面的质量,抽查总量的2%,
在这个问题中,下列说法正确的是()
A.总体是指这1000袋方便面的质量
B.个体是1袋方便面
C.样本是按2%抽取的20袋方便面
D.样本容量为20
2.某校有700名高一学生,400名高二学生,
400名高三学生,高一数学兴趣小组欲采
用按比例分配的分层随机抽样的方法在全
校抽取15名学生进行某项调查,则下列说
法正确的是
(
A.高三每一个学生被抽到的概率最大
B.高三每一个学生被抽到的概率最小
C.高一每一个学生被抽到的概率最大
D.每位学生被抽到的概率相等
3.为了促进边疆少数民族地区教育事业发
展,某省派出了200名老师援疆.现采用分
层随机抽样的方法从中抽取一个容量为
40的样本,调查他们的援疆工作情况,若
样本中女教师比男教师少8人,则该省此
次援疆女教师人数为
()
A.16
B.40
C.80
D.120
[每日格言]内外相应,言行相称。
4.某城市一月份从各气象采集点处得到的平
均气温(单位:℃)的数据制成频率分布直
方图,如图所示,图中有一处因污迹看不
清.已知各采集点的平均气温范围是
[20.5,26.5],且平均气温低于22.5℃的
采集点个数为11,则平均气温不低于
25.5℃的采集点个数为
频率
↑组距
0.26
0.22
0.18
0.10
20.521.522523.524.525.526.5平均气温/元
A.6
B.7
C.8
D.9
5.(多选)(2025·汉中高一期末)某地发起
“寻找绿色合伙人—低碳生活知识竞
赛”活动,从参赛选手的答卷中随机抽取
了100份,将成绩分成6组,第1组为
[40,50),第2组为[50,60),…,第6组为
[90,100],画出如图所示的频率分布直
方图,则
+频率
组距
0.032
0.020
0.012
1
0.006
0八405060708090100分数
A.m=0.01
B.第6组有15个样本
C.从第5,6组中,按组别分层抽取6个样
本,则应在第5组抽取3个样本
D.估计参赛选手成绩的中位数在
[70,80)内
27
高一数学(配BSD版)
6.已知一个样本:30,29,26,24,25,27,26,
22,24,25,26,28,25,21,23,25,27,29,
25,28.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)根据频率分布直方图,估计总体中出现
在23一28内的数的频率是多少.
寒假作业每一个成功者都有一个开始。勇于开始
4真题体验
1.(2025·全国二卷)样本数据2,8,14,16,
20的平均数为
()
A.8
B.9
C.12
D.18
2.(2023·上海卷)如图为2017一2021年中
国货物进出口总额的统计图,则下列说法
错误的是
)
↑总额/万亿元
40
17.37
30
14.33
14.29
12.48
14.09
20
21.73
16.41
17.24
17.93
10
15.33
0
2017
2018
2019
2020
2021
年份
进口□出口
2017一2021年中国货物进出口总额
A.从2018年开始,每年与上一年相比,
2021年的进出口总额增长率最大
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始,每年与上一年相比,
2020年的进出口总额增长率最小
3.(多选)(2023·新课标I卷)有一组样本数
据x1,x2,…,x6,其中x1是最小值,x6是
最大值,则
()
A.x2,x3,x4,x5的平均数等于x1,x2,…,
x。的平均数
B.x2,x3,x4,x的中位数等于x1,x2,…,
x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,
…,x。的标准差
D.x2,x3,x4,x的极差不大于x1,x2,…,
x6的极差
2
才能找到成功的路。
[每日格言]
5易误警示
易错一对总体、样本、个体的理解有误
[示例1](多选)为了了解参加运动会的
2000名运动员的年龄情况,从中抽取了
20名运动员的年龄进行统计分析.就这个
问题,下列说法正确的有
A.2000名运动员是总体
B.所抽取的20名运动员是一个样本
C.样本容量为20
D.每个运动员被抽到的机会相等
名师叮嘱
抽样调查总是调查某项具体指标,如年龄、
身高、体重,所以总体、样本、个体是对应的具体指
标,其单位与调查的某项具体指标的单位相同.
易错二忽略基本抽样方法的运用条件
[示例2]某校为了了解高二学生的身高情
况,打算在高二年级12个班中抽取3个
班,再按每个班男女生比例抽取样本,正确
的抽样方法是
A.简单随机抽样
B.先用分层随机抽样,再用随机数表法
C.分层随机抽样
D.先用抽签法,再用分层随机抽样
名师叮嘱
(1)总体无明显差异且总量较小,样本容量较小
时,用抽签法
(2)总体无明显差异且总量较大,样本容量较小
时,用随机数表法。
(3)总体有明显差异时用分层随机抽样,在每层内
抽取时用简单随机抽样[每日格言]生命之灯因热情而点燃,生命之舟因拼
△>0,
当a>0时,
1a-(a+3)+a+3>0,→
a+3>1,
Za
-3<a<1,
a>0,
→0<a<1;
a<3,
△>0,
当a<0时,
a-(a+3)+a+3<0,→
1
1-3<a<1,
a<0,
→a∈0.
a>3
综上,实数a的取值范围为{a0<a<l}.
[真题体验]
1.B由指数函数、暴函数的单调性可知y=0.3x在R上
单调递减,y=√元在[0,十∞)上单调递增,
所以f(x)=0.3x一√x在定义域上单调递减,
显然f(0)=1>0,f(0.3)=0.3.3-0.30.5>0,f(0.5)
=0.30.5-0.50.5<0,
所以根据零,点存在性定理可知f(x)的零点位于(0.3,
0.5).故选B.
2D由是意,得21=815若S不交,则
2.1lnN1=3.151lnN2,
即2lnN1=3lnN2,所以N?=N.故选D.
3.ACD根据题意可知Lp,∈[60,90],Lp,∈[50,60],
Lp,=40,结合对数运算逐项分析判断.
对于选项A:可得
L4-L,=20×1g2-20X1g2=20X1gL,
5p0
Po
p2
因为L4≥L,则L4-Le,=20X1g≥0,
p2
即g≥0,所以号1且,>0,可得≥,故
p21
A正确;
对于选项B:可得
Le,-Lp=20×1g-20×1g2=20×1g2,
Po
Po
P3
因为Lp-L4=L4,-40>10,则20×1g2≥10,即
1g货≥2所以会≥且A>0,可得≥而
当且仅当Lp,=50时,等号成立,故B错误;
对于选项C:因为Le,=20×1g=40,
Po
即1g=2,可得2=100,即pg=100p0,故C正确;
Po
Po
对于速项D:由速项A可知:L-L,=20Xg,
且L2-L2,≤90-50=40,则20X1g≤40,
2
中g会≤2,可得会≤10,且,>0,所以≤
P2
100p2,故D正确.故选ACD.
5
搏而前行。
高一数学(配BSD版)
[易误警示
[示例1][解析]由零,点存在定理知,保证在(一2,5)
上有零,点的充分条件是f(x)在[一2,5]上连续且
f(一2)f(5)<0,所以A、B、C错误.故选D.
[答案]D
[示例2][解析]由题意可知y=kx(>0),x≥0,
则144=k·36,∴.k=4,故y=4x(x≥0).
[答案]D
作业(十一)抽样的基本方法、
用样本估计总体分布
[基础演练]
1.BC调查某批次汽车的抗撞击能力,有破坏性,故用抽
查方式,故A错误;为了调查市场上某种食品的色素含
量是否符合国家标准,工作量大,用抽查方式,故B正
确;对货运飞船“天舟六号”零部件的检查十分重要,故
进行普查检查,故C正确;了解全校同学喜欢课程情
况,应在各班进行抽样,同时不能仅限男同学,故D
错误.
2.B根据随机数表的读数规则,依次从随机数表中读出
的有效编号为32,12,31,02,01,04,15,20,得到选出来
的第8个个体的编号为20.
3C抽样比为2日,则两班分别被拾取的人教是
16
54×日=9,42×日=7
4.A由题意可得样本数据落在区间[80,100]内的频数
为17+8=25,则所求频率为品=0.25,故选A
[综合演练]
1.AD由题意知总体是指这1000袋方便面的质量,A
说法正确;个体是指1袋方便面的质量,B说法错误;样
本是指按照2%抽取的20袋方便面的质量,C说法错
误;样本容量为20,D说法正确.
15
2.D由题意知,抽样比例为700十400十400100,所必
15人中,高一要抽7人,高二要抽4人,高三要抽4人,
7
故高一每位学生被抽到的概率为700=100,高二每位
学生被抽到的机率为品0一0高三每位华生旅抽到
的概率为0=0在按北例分配的分层随机抽样中,
1
每个个体被抽到的概率相等,故每位学生被抽到的概率
相等.
3.C设样本中女教师为x人,则(40一x)一x=8,解得x=
16,所以接醒女教师人数为200×6=80.
40
4.D由图可知,平均气温在[21.5,22.5)和[22.5,23.5)
的频率相等,且组距为1,所以平均气温在[21.5,22.5)
的频率是1-(0.10+0.180.2+0.26)×1=0.12,低
于22.5℃的频率是0.10+0.12=0.22,又平均气温低
于2.5℃的来集点个数是1,所以样本容量为2
50,则平均气温不低于25.5℃的采集,点个数为0.18×
50=9,故选D.
寒假作业积极者相信只有推动自己才能推动世界
5.AD对于A,由10×(0.006+0.012+0.02+0.032+
0.02十m)=1,得m=0.01,故A正确;
对于B,第6组有0.01×10×100=10个样本,B错误;
对于C,由频率分布直方图可知第5组与第6组的频率
分别为0.2与0.1,
0.2
则第5组内抽取为6×0.20.4个样本,故C错误;
对于D,因为0.06+0.12+0.2=0.38<0.5,0.06+
0.12+0.2+0.32=0.7>0.5,
所以估计参赛选手得分的中位数在[70,80)内,故D
正确.
故选AD,
6.解析(1)计算极差:30一21=9.决定组距和组数:取组
距为2,因为号=4日,所以共分5组决定分点,使分
点比数据多一位小数.并把第1小组的分点减小0.5,
即分成如下5组:20.5~22.5,22.524.5,24.5
26.5,26.528.5,28.530.5.
列出频率分布表如下,
分组
频数
频率
20.522.5
2
0.10
22.5~24.5
3
0.15
24.5~26.5
8
0.40
26.5~28.5
4
0.20
28.5~30.5
0.15
合计
20
1.00
(2)如图所示,画出频率分布直方图,取各小长方形上的
中点并用线段连接就构成了频率折线图」
↑频率
组距
0.200H
0.100
0.075
0.050H
0
18.520.522.524.526.528.530.532.5样本
(3)根据频率分布直方图得,样本值出现在23一28内的
频率为0.15+0.40+0.20=0.75,所以可以估计总体
中出现在23~28内的数的频率为0.75.
[真题体验]
1.C样本数据2,8,14,16,20的平均数为
2+8+14+16+20=60=12.
5
5
故选C.
2.C由题图可知,2020年的进口总额小于2019年的进
口总额,故C不正确;由题图可知,2017一2021年的进
出口总额依次为27.81,30.50,31.57,32.22,39.10,与
上一年相比,2018年的增长率为30.50-27.81≈
27.81
9.7%,同理可得2019年,2020年,2021年的增长率分
别约为3.5%,2.1%,21.4%,故A,B,D正确,故选C.
3.BD对于选项A:设x2,x3,x4,x5的平均数为m,x1,
x2,…,c6的平均数为n,
5
只要推动自己就能推动世界。
[每日格言]
则n-m=西十2十十4十十2-十十x4十x西
6
4
=2(西十x6)-(十十4十x药)
12
因为没有确定2(1十x6),x2十x3十x4十x5的大小关
系,所以无法判断m,n的大小,
例如:1,2,3,4,5,6,可得m=n=3.5;
例如1,1,1,1,1,7,可得m=1,n=2;
例知1,222,22,可得m=2,m=吕故A错误;
对于选项B:不妨设x1≤x2≤x3≤x4≤5≤x6,
可知x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位
数均为,故B正确;
2
对于选项C:因为x1是最小值,x6是最大值,
则x2,x3,x4,x5的波动性不大于x1,x2,…,x6的波动
性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的
标准差,
例如:2,4,6,8,10,12,则平均数
n=合(2+4+6+8+10+12)=7,
标准差51=
√合2-7)+4-7)+(6-7)2+(8-)+(10-7)2+(2-)
=105
3
4,68,10,则平均数m=(4+6+8+10)=7,
标准差52=
√24-+6-n2+8-n2+0-0=5,
显然√05>5,即51>52;故C错误;
3
对于选项D:不妨设x1≤x2≤x3≤x4≤x5≤x6,
则x6一x1≥x5一x2,当且仅当x1=x2,x5=x6时,等号
成立,故D正确.
故选BD.
[易误警示
[示例1][解析]由已知可知,2000名运动员的年龄
是总体,20名运动员的年龄是样本,总体中个体数为
2000,样本容量为20,在整个抽样过程中每个运动员被
抽到的机会均为丽所以A,B错误,CD正璃,故
选CD.
[答案]CD
[示例2][解析]在高二年级12个班中抽取3个班,
这属于简单随机抽样中的抽签法,按男女生比例抽取
样本属于分层随机抽样,所以是先用抽签法,再用分层
随机抽样,故选D.
[答案]D
作业(十二)用样本估计总体的数字特征
[基础演练]
1.C由方差的定义,知方差反映了一组数据的离散
程度.
2.A原数据的平均数应为1.2十80=81.2,原数据的方
差与新数据的方差相同,即为4.4.