内容正文:
随机抽样与统计图表
1.简单随机抽样
抽签 法 和 随 机 数 法 是 比 较 常 用 的 两 种
方法.
2.分层随机抽样
一般地,按一个或多个变量把总体划分成
若干个子总体,每个个体属于且仅属于一
个子总体,在每个子总体中独立地进行简
单随机抽样,再把所有子总体中抽取的样
本合在一起作为总样本,这样的抽样方法
称为分层随机抽样,每一个子总体称为层.
3.统计图表
(1)常见的统计图表有条形图、扇形图、折
线图、频率分布直方图等.
(2)作频率分布直方图的步骤
①求极差;
②决定组距与组数;
③将数据分组;
④列频率分布表;
⑤画频率分布直方图.
1.下列抽样试验中,适合用抽签法的是
( )
A.从某厂生产的3000件产品中抽取600件
进行质量检验
B.从某厂生产的两箱(每箱15件)产品中
抽取6件进行质量检验
C.从甲、乙两厂生产的两箱(每箱15件)
产品中抽取6件进行质量检验
D.从 某 厂 生 产 的3000件 产 品 中 抽 取
10件进行质量检验
2.(2023·遵义高一期中)某工厂为了对产品
质量进行严格把关,从500件产品中随机
抽出50件进行检验,对这500件产品进行
编号001,002,…,500,从下列随机数表的
第二行第三组第一个数字开始,每次从左
往右选取三个数字,则抽到第四件产品的
编号为 ( )
2839 3125 8395 9524 7232
8995
7216 2884 3660 1073 4366
7575
9436 6118 4479 5140 9694
9592
6017 4951 4068 7516 3241
4782
A.447 B.366
C.140 D.118
3.(2023·渭南高一期中)某工厂生产的A,
B,C三种不同型号的产品数量之比为2∶
3∶5,为研究这三种产品的质量,现用分层
抽样的方法从该工厂生产的A,B,C 三种
产品中抽出100件进行测试,则应该抽取
的A 型号产品的件数为 ( )
A.20 B.30
C.50 D.80
4.(2023·绍兴高一开学考试)某中学为了解
高三男生的体能情况,通过随机抽样,获得了
200名男生的100米体能测试成绩(单位:
秒),将数据按照[11.5,12),[12,12.5),…,
[15.5,16]分成9组,制成了如图所示的频
率分布直方图.
—42—
高一数学(配RJA版)
由直方图可估计本校高三男生100米体能
测试成绩小于13.5秒的人数为 ( )
A.47 B.54
C.67 D.94
1.某学校高中部共有学生2100名,高中部
各年级男、女生人数如下表.已知在高中部
学生中随机抽取1名学生,抽到高三年级
女生的概率是0.2,现用分层抽样的方法
在高中部抽取60名学生,则应在高二年级
抽取的学生人数为 ( )
性别
年级
高一年级 高二年级 高三年级
女生 372 y x
男生 327 z 420
A.12 B.16
C.18 D.24
2.某大型商场从参与购物的人群中随机选出
200人,并将这200人按年龄分组,得到的
频率分布直方图如图所示,则在这200人
中年龄在[25,35)的人数n及直方图中a
值是 ( )
A.n=35,a=0.032
B.n=35,a=0.32
C.n=30,a=0.035
D.n=30,a=0.35
3.(多选)(2023·汉中高一期中)某地教育局
为了解“双减”政策的落实情况,在辖区内
高三年级在校学生中抽取100名学生,调
查他们课后完成作业的时间,根据调查结
果绘制的频率分布直方图如图所示,下列
结论正确的是 ( )
A.所抽取的学生中有25人在2小时至
2.5小时之间完成作业
B.该地高三年级学生完成作业的时间超
过3小时的概率估计为35%
C.估计该地高三年级有一半以上的学生
完成作业的时间超过2.6小时
D.估计该地高三年级有一半以上的学生
完成作业的时间在2小时至3小时
之间
4.某大学艺术专业400名学生参加某次测
评,根据男、女学生人数比例,使用分层随
机抽样的方法从中随机抽取了100名学
生,记录他们的分数,将数据分成7组:
[20,30),[30,40),…,[80,90],并整理得
到如下频率分布直方图.
—52—
(1)样本中分数小于70的频率;
(2)已知样 本 中 分 数 小 于40的 学 生 有
5人,试估计样本中分数在区间[40,50)内
的人数;
(3)已知样本中有一半男生的分数不小于
70,且样本中分数不小于70的男女生人数
相等.试估计样本中男生和女生人数的
比例.
1.(2021·天津卷)从某网络平台推荐的影视
作品中抽取400部,统计其评分数据,将所
得400个评分数据分为8组:[66,70),
[70,74),…,[94,98],并整理得到如下的
频率分布直方图,则评分在区间[82,86)内
的影视作品数量是 ( )
A.20 B.40
C.64 D.80
2.(2021·全国甲卷)为了解某地农村经济情
况,对该地农户家庭年收入进行抽样调查,
将农户家庭年收入的调查数据整理得到如
下频率分布直方图:
根据此频率分布直方图,下面结论中不正
确的是 ( )
A.该地农户家庭年收入低于4.5万元的
农户比率估计为6%
B.该地农户家庭年收入不低于10.5万元
的农户比率估计为10%
C.估计该地农户家庭年收入的平均值不
超过6.5万元
D.估计该地有一半以上的农户,其家庭年
收入介于4.5万元至8.5万元之间
易错一 忽视频率分布直方图的特征致错
[示例1] 为了解人们对环保知识的认知情
况,某调查机构对A地区随机选取n个居
民进行了环保知识问卷调查(满分为100
分),并根据问卷成绩(不低于60分记为及
格)绘制成如图所示的频率分布直方图(分
为[40,50),[50,60),[60,70),[70,80),
[80,90),[90,100]六组),若问卷成绩最后
三组频数之 和 为360,则 下 列 结 论 正 确
的是 ( )
—62—
高一数学(配RJA版)
A.n=600
B.问卷成绩在[70,90)内的频率为0.5
C.a=0.3
D.以样本估计总体,若对A地区5000人
进行问卷调查,则约有2000人及格
在本题的求解过程中或初学频率分布直方图时,
易把频率分布直方图的纵轴误当成频率,解决此
类问题一定要注意纵轴为
频率
组距.
易错二 不能沟通各类统计图表间的联系
致错
[示例2] (2023·安阳高一期中)郑州市某家
保险公司的保险产品有以下五种:甲,一年期
短险;乙,两全保险;丙,理财类保险;丁,定期
寿险;戊,重大疾病保险.各种保险按相关约
定进行参保与理赔,该保险公司对五个险种
的参保客户进行抽样调查,得到如图所示的
统计图,则以下说法正确的是 ( )
A.42~53周岁客户人数不低于54周岁的
客户人数的4倍多
B.不低于54周岁客户参保总费用最多
C.丁险种人均参保费用最低
D.戊险种参保人都是42~53周岁的客户
若需要解答的题目中含有两种或以上统计图表,
首先弄清楚各种统计图表的纵轴、横轴表示的含
义,然后再沟通这几种统计图表,把其所表达的信
息相互沟通联系,然后求解.
—72—
高一数学(配RJA版)
(2)如图所示,
过点A1作A1O⊥CC1,垂足为O.
因为平面ACC1A1⊥平面BCC1B1,平面ACC1A1∩平
面BCC1B1=CC1,A1O⊂平面ACC1A1,
所以A1O⊥平面BCC1B1,
所以四棱锥A1-BB1C1C的高为A1O.
因为A1C⊥平面ABC,AC,BC⊂平面ABC,
所以A1C⊥BC,A1C⊥AC,
又A1B=AB,BC为公共边,
所以△ABC与△A1BC全等,所以A1C=AC.
设A1C=AC=x,则A1C1=x,
所以O 为CC1中点,OC1=
1
2AA1=1
,
又A1C⊥AC,所以A1C2+AC2=AA12,
即x2+x2=22,解得x= 2,即A1C1= 2,
所以A1O= A1C12-OC12= (2)2-12=1,
所以四棱锥A1-BB1C1C的高为1.
【易误警示】
[示例1] 解析 连接 AC,A1C1,A1B,AD1,D1C,A1P
(图略).因 为 AA1∥CC1,AA1=CC1,所 以 四 边 形
AA1C1C是平行四边形,所以AC∥A1C1.又因为AC⊄
平面 A1BC1,A1C1⊂平 面 A1BC1,所 以 AC∥ 平 面
A1BC1.同理可证AD1∥平面A1BC1.又因为AC⊂平
面ACD1,AD1⊂平面ACD1,且AC∩AD1=A,所以平
面ACD1∥平面A1BC1.因为A1P⊂平面A1BC1,所以
A1P∥平面 ACD1,故②正确.因为 BC1∥AD1,所 以
BC1∥平面 ACD1,所以点 P 到平面ACD1 的距离不
变.又因为VAD1PC=VPACD1,所以三棱锥A D1PC的
体积不变,故①正确.连接DB,DC1,DP,B1D(图略).
因为DB=DC1,所以当P 为BC1 的中点时才有DP⊥
BC1,故③ 错 误.因 为 BB1⊥平 面 ABCD,AC⊂平 面
ABCD,所以AC⊥BB1.又因为AC⊥BD,BB1∩BD=
B,BB1,BD⊂平面BB1D1D,所以AC⊥平面BB1D1D.
因为B1D⊂平面BB1D1D,所以B1D⊥AC.同理可证
B1D⊥AD1.又 因 为 AC⊂平 面 ACD1,AD1⊂平 面
ACD1,AC∩AD1=A,所以B1D⊥平面ACD1.又因为
B1D⊂平面PDB1,所以平面PDB1⊥平面ACD1,故④
正确.
答案 ①②④
[示例2] D 若α∥β,则由m⊥平面α,n⊥平面β,可得
m∥n,这与m,n是异面直线矛盾,故α与β相交.
设α∩β=a,过空间内一点P,作m'∥m,n'∥n,则m'与
n'相交,m'与n'确定的平面为γ.因为l⊥m,l⊥n,所以
l⊥m',l⊥n',所以l⊥γ.
因为m⊥α,n⊥β,所以m'⊥α,n'⊥β,
所以a⊥m',a⊥n',所以a⊥γ.
又因为l⊄α,l⊄β,所以l与a 不重合,所以l∥a.
作业(十一) 随机抽样与统计图表
【基础演练】
1.B 选项A中总体中的个体数较大,样本容量也较大,不适
合用抽签法;
选项B中总体中的个体数较小,样本容量也较小,且同厂
生产的两箱产品可视为搅拌均匀了,可用抽签法;
选项C中甲、乙两厂生产的两箱产品质量可能差别较大,
不能满足搅拌均匀的条件,不能用抽签法;
选项D中总体中的个体数较大,不适合用抽签法.
2.A 从第二行第三组第一个数字开始,每次从左往右选
取三个数字,依次可得:366,010,118,447,…,故选A.
3.A 某工厂生产的A,B,C 三种不同型号产品的数量之
比为2∶3∶5,则A 被抽的抽样比为 22+3+5=
1
5
,所以
抽出100件产品中A 型号产品的件数为100×15=20
,
故选A.
4.D 由题意,得(0.08+0.16+0.30+a+0.52+0.30+
0.12+0.08+0.04)×0.5=1,解得a=0.40,由图得本
校高三男生100米体能测试成绩小于13.5秒的频率为
(0.08+0.16+0.30+0.40)×0.5=0.47,
估计本校高三男生100米体能测试成绩小于13.5秒的
人数为200×0.47=94.
【综合演练】
1.B 因为在高中部学生中随机抽取1名学生,抽到高三
年级女生的概率是0.2,
所以 x
2100=0.2
,解得x=420,
所以高二年级的学生人数为2100-372-327-420-
420=561(人),
所以用分层抽样的方法在高中部抽取60名学生,则应
在高二年级抽取的学生人数为60× 5612100≈16
(人),故
选B.
2.C 由图知,年龄在[25,35)的小矩形的面积为0.015×
10=0.15,
即年龄在[25,35)的频率为0.15,所以年龄在[25,35)的
人数n=0.15×200=30.
由频率分布直方图的小矩形面积和为1可得
0.010×10+0.015×10+a×10+0.030×10+0.010×
10=1,解得a=0.035.
3.ABC 频率分布直方图中2小时至2.5小时之间的频
率为(2.5-2)×0.5=0.25,故抽取的学生中有100×
0.25=25人 在2小 时 至2.5小 时 之 间 完 成 作 业,A
正确;
频率分布直方图中超过3小时的频率为0.5×(0.3+
0.2+0.1+0.1)=0.35,B正确;
由频率分 布 直 方 图 可 得 不 超 过2.6小 时 的 频 率 为
(0.1+0.3+0.5)×0.5+0.1×0.4=0.49,
则超过2.6小 时 的 频 率 为1-0.49=0.51>0.5,C
正确;
频率分布直方图中2小 时 至3小 时 之 间 的 频 率 和 为
0.5×(0.5+0.4)=0.45<0.5,D错误,故选ABC.
4.解析 (1)根据频率分布直方图可知,样本中分数不小
于70的频率为(0.02+0.04)×10=0.6,
所以样本中分数小于70的频率为1-0.6=0.4.
(2)根 据 题 意,得 样 本 中 分 数 不 小 于 50 的 频 率 为
(0.01+0.02+0.04+0.02)×10=0.9,
所以分数在区间[40,50)内的人数为100-100×0.9-5=5.
—55—
(3)由题意可知,样本中分数不小于70的学生人数为
(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×12=30
,
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
所以样本中男生和女生人数的比例为60∶40=3∶2.
【真题体验】
1.D 由频率分布直方图可知,评分在区间[82,86)内的
影视作品数量为400×0.050×4=80.
2.C 因为频率直方图中的组距为1,所以各组的直方图
的高度等于频率.样本频率分布直方图中的频率即可作
为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计
值为0.02+0.04=0.06=6%,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计
值为0.04+0.02×3=0.10=10%,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的
比率估计值为0.10+0.14+0.20×2=0.64=64%>
50%,故D正确;
该地农户家庭年收入的平均值的估计值为3×0.02+
4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+
9×0.10+10×0.10+11×0.04+12×0.02+13×
0.02+14×0.02=7.68(万元),超过6.5万元,故C错
误.故选C.
【易误警示】
[示例1] A 10×(0.010+0.015+0.015+a+0.025+
0.005)=1,解得a=0.03,故C错误;
n= 36010×(0.03+0.025+0.005)=600
,故A正确;
问卷成绩在[70,90)内的频率为10×(0.03+0.025)=
0.55,故B错误;
不低于60分的频率为1-10×(0.010+0.015)=0.75,
则约有5000×0.75=3750人及格,故D错误.故选A.
[示例2] A 对于 A,观察参保人年龄分布的扇形图,
42~53周岁客户人数占比33%,不低于54周岁的客户
人数占比8%,42~53周岁客户人数不低于54周岁的
客户人数的4倍多,故A正确;
对于B,统计图显示的是人均参保费用,由于人数未知,
故不能确定哪个年龄段参保总费用最多,故B错误;
对于C,由参保险种比例,丁险种参保比例最高,但统计
图看不出丁险种的人均参保费用,故C错误;
对于D,戊险种的参保人占比33%,42~53周岁客户人
数占比33%,但统计图看不出两者相同,故D错误.故
选A.
作业(十二) 用样本估计总体
【基础演练】
1.ACD 由数据的极差、标准差、方差的定义可知,它们都可
以影响样本数据的分布和稳定性,而数据的平均数则与之
无关,故B不正确,A、C、D正确.
2.D 将数据由小到大进行排列为:5,5,6,7,8,8,8,
因此,这组数据的众数为8,中位数为7.
3.D 由题知,6个数分别减去214,得0,-1,0,1,2,-2,
这6个数的平均数为0,所以6个数平均数为214,又
1
6
[0+(-1)2+0+1+22+(-2)2]≈1.67,所以方差
为1.67,故选D.
4.A 因为数据x1,x2,x3,…,xn 的方差s2=4,则数据
3x1+1,3x2+1,3x3+1,…,3xn+1的方差为32×4,标
准差为 32×4=6.
【综合演练】
1.C 由题意可知,平均数
x=79+79+84+84+86+84+87+90+90+9710 =86
,
众数为84.
2.A 由题意,15
(6+7+8+a+10)=8,解得a=9,故此
组数据的方差为1
5
(22+12+12+22)=2,所以此组数
据的标准差为 2,故选A.
3.B 设这组数据分别为x1,x2,…,xn,
则x1+x2+…+xn=3n,(x1-3)2+(x2-3)2+…+
(xn-3)2=4n,
所以(x21+x22+…+x2n)-6(x1+x2+…+xn)+(32+
32+…+32)=4n,
所以(x21+x22+…+x2n)-18n+9n=4n,
从而x21+x22+…+x2n=13n.
因为这组数据的平方和是这组数据和的平方的1
9
,
所以13n=19× 3n
2=n2,解得n=13或n=0(舍去).
4.ACD 一队每场比赛平均失球个数是1.5,二队每场比
赛平均失球个数是2.1,平均说来一队比二队防守技术
好,A正确;
一队全年比赛失球个数的标准差为1.1,二队全年比赛
失球个数的标准差为0.4,二队比一队技术水平更稳
定,B错误;
一队有时表现很差,有时表现又非常好,二队很少不失
球,故C、D正确.
5.解析 ∵7×50%=3.5,∴其50%分位数是第4个数据
为8.5.
答案 8.5
【真题体验】
1.BD 对于选项A:设x2,x3,x4,x5 的平均数为m,x1,
x2,…,x6的平均数为n,
则n-m=
x1+x2+x3+x4+x5+x6
6 -
x2+x3+x4+x5
4
=
2x1+x6 - x2+x3+x4+x5
12
,
因为没法确定2x1+x6 ,x2+x3+x4+x5 的大小关
系,所以无法判断m,n的大小,
例如:1,2,3,4,5,6,可得m=n=3.5;
例如1,1,1,1,1,7,可得m=1,n=2;
例如1,2,2,2,2,2,可得m=2,n=116
;故A错误;
对于选项B:不妨设x1≤x2≤x3≤x4≤x5≤x6,
可知x2,x3,x4,x5 的中位数等于x1,x2,…,x6 的中位
数均为
x3+x4
2
,故B正确;
对于选项C:因为x1是最小值,x6是最大值,
则x2,x3,x4,x5 的波动性不大于x1,x2,…,x6 的波动
性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标
准差,
例如:2,4,6,8,10,12,则平均数n=16
(2+4+6+8+
10+12)=7,
标准差s1=
1
6 2-7
2+ 4-7 2+ 6-7 2+ 8-7 2+ 10-7 2+ 12-7 2
= 1053
,
—65—