内容正文:
用样本估计总体
1.百分位数
一般地,一组数据的第p百分位数是这样
一个值,它使得这组数据中至少有p%的
数据小于或等于这个值,且至少有(100-
p)%的数据大于或等于这个值.
2.平均数、中位数和众数
(1)平均数:x=1n
(x1+x2+…+xn).
(2)中位数:将一组数据按从小到大或从大
到小的顺序排列,处在最中间的一个数据
(当数据个数是奇数时)或最中间两个数据
的平均数(当数据个数是偶数时).
(3)众数:一组数据中出现次数最多的数据
(即频数最大值所对应的样本数据).
3.方差和标准差
(1)方差:s2=1n
[(x1-x)2+(x2-x)2+…+
(xn-x)2]=
1
n∑
n
i=1
(xi-x)2 或
1
n∑
n
i=1
(x2i-x2).
(2)标准差:
s= 1n
[(x1-x)2+(x2-x)2+…+(xn-x)2].
4.总体(样本)方差和总体(样本)标准差
(1)一般式:如果总体中所有个体的变量值
分别为Y1,Y2,…,YN,总体平均数为Y,则
总体方差S2=1N∑
N
i=1
(Yi-Y)2.
(2)加权式:如果总体的N 个变量值中,不同
的值共有k(k≤N)个,不妨记为Y1,Y2,…,
Yk,其中Yi出现的频数为fi(i=1,2,…,k),
则总体方差为S2=1N∑
k
i=1
(Yi-Y)2.
1.(多选)下列说法正确的是 ( )
A.数据的极差越小,样本数据分布越集
中、稳定
B.数据的平均数越小,样本数据分布越集
中、稳定
C.数据的标准差越小,样本数据分布越集
中、稳定
D.数据的方差越小,样本数据分布越集
中、稳定
2.某篮球兴趣小组7名学生参加投篮比赛,
每人投10个,投中的个数分别为:8,5,7,
5,8,6,8,则这组数据的众数和中位数分
别为 ( )
A.5,7 B.6,7
C.8,5 D.8,7
3.小明体育测试6次立定跳远成绩分别为
214,213,214,215,216,212,则6次成绩的
平均值与方差为 ( )
A.213,1.67 B.214,1.66
C.214,1.29 D.214,1.67
4.数据x1,x2,x3,…,xn 的平均数为x=2,
方差s2=4,则数据3x1+1,3x2+1,3x3+
1,…,3xn+1的标准差为 ( )
A.6 B.7
C.12 D.36
1.2024年某高一学生下学期政治考试成绩
为:79,79,84,84,86,84,87,90,90,97,则
该生政治考试成绩的平均数和众数依次为
( )
A.85,84 B.84,85
C.86,84 D.84,86
—82—
高一数学(配RJA版)
2.一组数据6,7,8,a,10的平均数为8,则此
组数据的标准差为 ( )
A.2 B.2 C.3 D.4
3.已知一组数据的平均数是3,方差是4,且
这组数据的平方和是这组数据和的平方的
1
9
,则这组数据的个数是 ( )
A.10 B.13 C.15 D.16
4.(多选)在某年的足球联赛中,一队每场比
赛平均失球个数是1.5,全年比赛失球个
数的标准差为1.1;二队每场比赛平均失
球个数是2.1,全年比赛失球个数的标准
差为0.4,则下列说法正确的是 ( )
A.平均说来一队比二队防守技术好
B.一队比二队技术水平更稳定
C.一队有时表现差,有时表现又非常好
D.二队很少不失球
5.某歌手电视大奖赛中,七位评委对某选手
打出如下分数:7.9,8.1,8.4,8.5,8.5,
8.7,9.9,则其50%分位数为 .
1.(多选)(2023·新课标Ⅰ卷)有一组样本数
据x1,x2,…,x6,其中x1 是最小值,x6 是
最大值,则 ( )
A.x2,x3,x4,x5 的平均数等于x1,x2,…,
x6 的平均数
B.x2,x3,x4,x5 的中位数等于x1,x2,…,
x6 的中位数
C.x2,x3,x4,x5 的标准差不小于x1,x2,…,
x6 的标准差
D.x2,x3,x4,x5 的极差不大于x1,x2,…,
x6 的极差
2.(2021·全国乙卷)某厂研制了一种生产高
精产品的设备,为检验新设备生产产品的
某项指标有无提高,用一台旧设备和一台
新设备各生产了10件产品,得到各件产品
该项指标数据如下:
旧设备 9.810.310.010.29.99.810.010.110.29.7
新设备10.110.410.110.010.110.310.610.510.410.5
旧设备和新设备生产产品的该项指标的样
本平均数分别记为x 和y,样本方差分别
为s21 和s22.
(1)求x,y,s21,s22;
(2)判断新设备生产产品的该项指标的均
值较旧设备是否有显著提高(如果y-x≥
2
s21+s22
10
,则认为新设备生产产品的该项
指标的均值较旧设备有显著提高,否则不
认为有显著提高).
易错一 不能正确理解平均数、方差的计
算公式致错
[示例1] 已知样本数据x1,x2,…,x2024的平
均数与方差分别是m 和n,若yi=-xi+2
(i=1,2,…,2024),且样本数据的 y1,
y2,…,y2024平均数与方差分别是n和m,
则x21+x22+…+x22024= .
解答本题的易错之处是不能灵活地运用平均数与
方差的变形公式,即要将公式s2=1n∑
n
i=1
(xi-x)2
变形为s2=1n∑
n
i=1
(x2i-x2),从而得到x21+x22+…+
x2n=ns2+nx2.
易错二 记错众数、中位数、平均数的公式
致错
[示例2] (多选)体育王老师记录了16名
同学各10次投篮的命中次数,记录如下表
命中次数 4 5 6 7 8 9
命中人数 1 2 2 4 5 2
则根据这16名同学投篮数据,以下说法正
确的是 ( )
A.众数为7.5 B.中位数为7.5
C.75%分位数为8 D.平均数为7
利用表格中的数据求样本的中位数和百分位数
时,首先要将所给的数字按照从小到大的顺序排
列,本题的易错之处就是忘记将数据从小到大
排序.
—92—
(3)由题意可知,样本中分数不小于70的学生人数为
(0.02+0.04)×10×100=60,
所以样本中分数不小于70的男生人数为60×12=30
,
所以样本中的男生人数为30×2=60,
女生人数为100-60=40,
所以样本中男生和女生人数的比例为60∶40=3∶2.
【真题体验】
1.D 由频率分布直方图可知,评分在区间[82,86)内的
影视作品数量为400×0.050×4=80.
2.C 因为频率直方图中的组距为1,所以各组的直方图
的高度等于频率.样本频率分布直方图中的频率即可作
为总体的相应比率的估计值.
该地农户家庭年收入低于4.5万元的农户的比率估计
值为0.02+0.04=0.06=6%,故A正确;
该地农户家庭年收入不低于10.5万元的农户比率估计
值为0.04+0.02×3=0.10=10%,故B正确;
该地农户家庭年收入介于4.5万元至8.5万元之间的
比率估计值为0.10+0.14+0.20×2=0.64=64%>
50%,故D正确;
该地农户家庭年收入的平均值的估计值为3×0.02+
4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+
9×0.10+10×0.10+11×0.04+12×0.02+13×
0.02+14×0.02=7.68(万元),超过6.5万元,故C错
误.故选C.
【易误警示】
[示例1] A 10×(0.010+0.015+0.015+a+0.025+
0.005)=1,解得a=0.03,故C错误;
n= 36010×(0.03+0.025+0.005)=600
,故A正确;
问卷成绩在[70,90)内的频率为10×(0.03+0.025)=
0.55,故B错误;
不低于60分的频率为1-10×(0.010+0.015)=0.75,
则约有5000×0.75=3750人及格,故D错误.故选A.
[示例2] A 对于 A,观察参保人年龄分布的扇形图,
42~53周岁客户人数占比33%,不低于54周岁的客户
人数占比8%,42~53周岁客户人数不低于54周岁的
客户人数的4倍多,故A正确;
对于B,统计图显示的是人均参保费用,由于人数未知,
故不能确定哪个年龄段参保总费用最多,故B错误;
对于C,由参保险种比例,丁险种参保比例最高,但统计
图看不出丁险种的人均参保费用,故C错误;
对于D,戊险种的参保人占比33%,42~53周岁客户人
数占比33%,但统计图看不出两者相同,故D错误.故
选A.
作业(十二) 用样本估计总体
【基础演练】
1.ACD 由数据的极差、标准差、方差的定义可知,它们都可
以影响样本数据的分布和稳定性,而数据的平均数则与之
无关,故B不正确,A、C、D正确.
2.D 将数据由小到大进行排列为:5,5,6,7,8,8,8,
因此,这组数据的众数为8,中位数为7.
3.D 由题知,6个数分别减去214,得0,-1,0,1,2,-2,
这6个数的平均数为0,所以6个数平均数为214,又
1
6
[0+(-1)2+0+1+22+(-2)2]≈1.67,所以方差
为1.67,故选D.
4.A 因为数据x1,x2,x3,…,xn 的方差s2=4,则数据
3x1+1,3x2+1,3x3+1,…,3xn+1的方差为32×4,标
准差为 32×4=6.
【综合演练】
1.C 由题意可知,平均数
x=79+79+84+84+86+84+87+90+90+9710 =86
,
众数为84.
2.A 由题意,15
(6+7+8+a+10)=8,解得a=9,故此
组数据的方差为1
5
(22+12+12+22)=2,所以此组数
据的标准差为 2,故选A.
3.B 设这组数据分别为x1,x2,…,xn,
则x1+x2+…+xn=3n,(x1-3)2+(x2-3)2+…+
(xn-3)2=4n,
所以(x21+x22+…+x2n)-6(x1+x2+…+xn)+(32+
32+…+32)=4n,
所以(x21+x22+…+x2n)-18n+9n=4n,
从而x21+x22+…+x2n=13n.
因为这组数据的平方和是这组数据和的平方的1
9
,
所以13n=19× 3n
2=n2,解得n=13或n=0(舍去).
4.ACD 一队每场比赛平均失球个数是1.5,二队每场比
赛平均失球个数是2.1,平均说来一队比二队防守技术
好,A正确;
一队全年比赛失球个数的标准差为1.1,二队全年比赛
失球个数的标准差为0.4,二队比一队技术水平更稳
定,B错误;
一队有时表现很差,有时表现又非常好,二队很少不失
球,故C、D正确.
5.解析 ∵7×50%=3.5,∴其50%分位数是第4个数据
为8.5.
答案 8.5
【真题体验】
1.BD 对于选项A:设x2,x3,x4,x5 的平均数为m,x1,
x2,…,x6的平均数为n,
则n-m=
x1+x2+x3+x4+x5+x6
6 -
x2+x3+x4+x5
4
=
2x1+x6 - x2+x3+x4+x5
12
,
因为没法确定2x1+x6 ,x2+x3+x4+x5 的大小关
系,所以无法判断m,n的大小,
例如:1,2,3,4,5,6,可得m=n=3.5;
例如1,1,1,1,1,7,可得m=1,n=2;
例如1,2,2,2,2,2,可得m=2,n=116
;故A错误;
对于选项B:不妨设x1≤x2≤x3≤x4≤x5≤x6,
可知x2,x3,x4,x5 的中位数等于x1,x2,…,x6 的中位
数均为
x3+x4
2
,故B正确;
对于选项C:因为x1是最小值,x6是最大值,
则x2,x3,x4,x5 的波动性不大于x1,x2,…,x6 的波动
性,即x2,x3,x4,x5的标准差不大于x1,x2,…,x6的标
准差,
例如:2,4,6,8,10,12,则平均数n=16
(2+4+6+8+
10+12)=7,
标准差s1=
1
6 2-7
2+ 4-7 2+ 6-7 2+ 8-7 2+ 10-7 2+ 12-7 2
= 1053
,
—65—
高一数学(配RJA版)
4,6,8,10,则平均数m=14 4+6+8+10 =7
,
标准差s2=
1
4 4-7
2+ 6-7 2+ 8-7 2+ 10-7 2
= 5,
显然 105
3 > 5
,即s1>s2;故C错误;
对于选项D:不妨设x1≤x2≤x3≤x4≤x5≤x6,
则x6-x1≥x5-x2,当且仅当x1=x2,x5=x6 时,等号
成立,故D正确.故选BD.
2.解析 (1)各项所求值如下所示.
x=110
(9.8+10.3+10.0+10.2+9.9+9.8+10.0+
10.1+10.2+9.7)=10.0,
y=110
(10.1+10.4+10.1+10.0+10.1+10.3+
10.6+10.5+10.4+10.5)=10.3,
s21=
1
10×
[(9.7-10.0)2+2×(9.8-10.0)2+(9.9-
10.0)2+2×(10.0-10.0)2+(10.1-10.0)2+2×
(10.2-10.0)2+(10.3-10.0)2]=0.036,
s22=
1
10×
[(10.0-10.3)2+3×(10.1-10.3)2+(10.3-
10.3)2+2×(10.4-10.3)2+2×(10.5-10.3)2+
(10.6-10.3)2]=0.04.
(2)由(1)中 数 据 得y-x=2 0.152=2 0.0225,
2
s21+s22
10 =2 0.0076.
显然y-x>2
s21+s22
10 .
所以可认为新设备生产产品的该项指标的均值较旧设
备有显著提高.
【易误警示】
[示例1] 解析 由题意得 -m+2=n
,
m=n, ,解得m=1,n=1,
∴ 12024
[(x1-1)2+(x2-1)2+…+(x2024-1)2]=1,
∴x21+x22+…+x22024+2024-2(x1+x2+…+x2024)
=2024,
∴x21+x22+…+x22024=2(x1+x2+…+x2024)=2×
2024=4048.
答案 4048
[示例2] CD 对于A,16名同学中,命中8次的人数最
多,则众数为8,A错误;
对于B,将数据从小到大排序,则中位数为7,B错误;
对于C,16×75%=12,将数据从小到大排序,则第12
个数据和第13个数据都是8,故75%分位数为8,C
正确;
对于D,平均数为116×
(4+10+12+28+40+18)=7,D
正确.
作业(十三) 随机事件与概率
【基础演练】
1.D “至少有一次中靶”的对立事件是“两次都不中靶”.
2.B 从5个小球中任取2个,其中数字之差的绝对值为
2或4的事件包含(1,3),(1,5),(2,4),(3,5),共4个样
本点.
3.解析 抛掷一次硬币正面朝上的概率是0.5.
答案 0.5
4.解析 这 个 试 验 的 样 本 空 间 为 Ω={(1,1),(1,0),
(0,1),(0,0)},共4个样本点.
答案 4
【综合演练】
1.C 不可能事件的概率为0,必然事件的概率为1,故A
错误;频率是由试验的次数决定的,故B错误;概率是频
率的稳定值,故C正确,D错误.
2.C 由题意,可知A={1,2},B={2,3},
则A∩B={2},A∪B={1,2,3},∴A∪B 表示向上的
点数为1或2或3.
3.ABD X=4表示两次抛掷所得总数之和为4,则随机
试验的样本点是“第一枚是3点,第二枚是1点”或“第
一枚是1点,第二枚是3点”或“两枚都是2点”.
4.BCD 对于A,事件A 与B 互斥时,A∪B 不一定是必
然事件,故A不正确;对于B,事件E 与F 不会同时发
生,所以E 与F 是互斥事件,但除了事件E 与F 之外还
有“丙取到红楼梦”“丁取到红楼梦”,所以E 与F 不是
对立事件,故E 与F 是互斥但不对立事件,故B正确;
对于C,事件A={1,2,3,4,5},事件B={2,3,5},所以
B 包含于A,故C正确;对于D,样本空间Ω={正品,次
品},含有2个样本点,故D正确.
5.解析 最少需要取3次,最多需要取7次,那么剩余鸡
的只数最多4只,最少0只,所以剩余动物的脚数可能
是8,6,4,2,0.
答案 {0,2,4,6,8}
6.解析 ∵第1,2,4组的频数分别为6,7,9,
∴第1,2,4组 的 频 率 分 别 为640=0.15
,7
40=0.175
,
9
40=0.225.
∵第3组的频率为0.25,∴第5组的频率是1-0.25-
0.15-0.175-0.225=0.2,
∴售出的这300双皮鞋中尺码为40~42的皮鞋约为0.
2×300=60(双).
答案 60
7.解析 (1)对于事件D,可能的结果为1个红球,2个白
球或2个红球,1个白球,故D=A+B.
(2)对于事件C,可能的结果为1个红球,2个白球或2
个红球,1个白球或3个红球,故CA=A.
8.解析 (1)甲、乙、丙三个协会共有的运动员人数为27+
9+18=54,
则应从甲协会抽取27×654=3
(人),
从乙协会抽取9×654=1
(人),
从丙协会抽取18×654=2
(人).
故从甲、乙、丙三个协会中抽取的运动员人数分别为3,
1,2.
(2)①从6名运动员中随机抽取2人参加双打比赛的所
有样本点为(A1,A2),(A1,A3),(A1,A4),(A1,A5),
(A1,A6),(A2,A3),(A2,A4),(A2,A5),(A2,A6),
(A3,A4),(A3,A5),(A3,A6),(A4,A5),(A4,A6),
(A5,A6),共15种.
②事 件 A 可 用 集 合 表 示 为 {(A1,A5),(A1,A6),
(A2,A5),(A2,A6),(A3,A5),(A3,A6),(A4,A5),
(A4,A6),(A5,A6)}.
【真题体验】
1.D 设高一2名学生为A1,A2,高二2名学生为B1,B2,
从中随机选2名的样本点有(A1,A2),(A1,B1),(A1,
—75—