内容正文:
■方 勤
2020年高考对统计的考查主要围绕“频
率分布直方图、样本的数字特征、求线性回归
方程”等核心考点展开,重点考查同学们应用
统计知识解决实际问题的能力。
聚焦1:利用频率分布直方图的数据估
计总体
例1 (2020年高考天津卷改编)从一批
零件中抽取80个,测量其直径(单位:mm),
将所得数 据 分 为9组:[5.31,5.33),[5.33,
5.35),…,[5.45,5.47),[5.47,5.49],并整理
得到如图1所示的频率分布直方图,则在被
抽取的零件中,直径落在区间[5.43,5.47)内
的个数为 。
图1
解:根据频率分布直方图可知,直径落在
区间[5.43,5.47)内 的 零 件 频 率 为(6.25+
5)×0.02=0.225,则在区间[5.43,5.47)内的
零件个数为80×0.225=18。
素养:利用频率 分 布 直 方 图 估 计 总 体 的
分布情况:①最高的小长方形底边中点的横
坐标即是众数;②中位数的左边和右边的小
长方形的面积之和是相等的;③平均数是频
率分布直方图的“重心”,它等于频率分布直
方图中每个小长方形的面积乘以小长方形底
边中点的横坐标之和。
变式训练1:某高校调查了200名学生每
周的自习时间(单位:h),制成了如图2所示
的频率分布直方图,其中自习时间的范 围 是
[17.5,30],样本数据分组为[17.5,20),[20,
22.5),[22.5,25),[25,27.5),[27.5,30]。根
据频率分布直方图,这200名 学 生 中 每 周 的
自习时间不少于22.5h的人数是 。
图2
提示:由频率分布直方图可知,自习时间
不少于22.5h的人数是200×(0.16+0.08+
0.04)×2.5=140。
聚焦2:样本的数字特征
例2 (2020年高考全国卷)在一组样本
数据中,1,2,3,4出现的频率分别为 p1,p2,
p3,p4,且∑
4
i=1
pi=1,则下面四种情形中,对应
样本的标准差最大的一组是( )。
A.p1=p4=0.1,p2=p3=0.4
B.p1=p4=0.4,p2=p3=0.1
C.p1=p4=0.2,p2=p3=0.3
D.p1=p4=0.3,p2=p3=0.2
解:计算出四个 选 项 中 对 应 数 据 的 平 均
数和方差,由此可得标准差最大的一组。
对于 A,该组数据的平均数为xA =(1+
4)×0.1+(2+3)×0.4=2.5,方 差 为s2A =
(1-2.5)2×0.1+(2-2.5)2×0.4+(3-
2.5)2×0.4+(4-2.5)2×0.1=0.65。对于B,
该组数 据 的 平 均 数 为xB =(1+4)×0.4+
(2+3)×0.1=2.5,方差为s2B =(1-2.5)2×
0.4+(2-2.5)2×0.1+(3-2.5)2×0.1+
(4-2.5)2×0.4=1.85。对于 C,该组数据的
平均数为xC=(1+4)×0.2+(2+3)×0.3=
2.5,方 差 为 s2C =(1-2.5)2 ×0.2+(2-
2.5)2×0.3+(3-2.5)2×0.3+(4-2.5)2×
0.2=1.05。对 于 D,该 组 数 据 的 平 均 数 为
xD=(1+4)×0.3+(2+3)×0.2=2.5,方差
32
数学部分·创新题追根溯源
高一使用 2021年2月
为s2D=(1-2.5)2×0.3+(2-2.5)2×0.2+
(3-2.5)2×0.2+(4-2.5)2×0.3=1.45。应
选B。
素养:平均数、中位数、众数描述其集中
趋势,方差和标准差描述其 波 动 大 小。当 平
均数相同时,再考查用方差进行决策。
变式训练2:设一组样本数据x1,x2,…,
xn 的 方 差 为 0.01,则 数 据 10x1,10x2,…,
10xn 的方差为 。
提示:数据axi+b(i=1,2,…,n)的 方
差是数据xi(i=1,2,…,n)的方差的a2 倍,
所以所求数据的方差为102×0.01=1。
聚焦3:回归分析模型及应用
例3 (2020年高考全国卷)某沙漠地区
经过治理,生态系统得到很大改善,野生动物
数量有所增加。为调查该地区某种野生动物
的数量,将其分成面积相近的200个地块,从
这些地块中 用 简 单 随 机 抽 样 的 方 法 抽 取20
个作为样区,调查得到样本数据(xi,yi)(i=
1,2,…,20),其中xi 和yi 分别表示第i个样
区的植物覆盖面积(单位:公顷)和这种野生
动物的 数 量,并 计 算 可 得∑
20
i=1
xi=60,∑
20
i=1
yi=
1200,∑
20
i=1
(