内容正文:
■淮安市新马高级中学 陈 刚
在统计知识的学习与应用过程中,存在
诸多容易混淆出错的地方,这些易错点若不
加以重视,会影响对统计结果的理解与分析。
下面将针对常见的统计易错点进行详细剖
析,并结合具体例题加深理解。
易错点一、求中位数、百分位数时忽略数
据顺序
例 1 (多选题)某校举行了交通安全知
识主题演讲比赛,甲、乙两位同学演讲后,6位评
图1
委对甲、乙的演
讲分别进行打分
(满分10分),得
到如图1所示的
折线统计图,则
( )。
A.若 去 掉
最高分和最低分,则甲同学得分的中位数大
于乙同学得分的中位数
B.甲同学得分的极差大于乙同学得分的
极差
C.甲同学得分的上四分位数小于乙同学
得分的上四分位数
D.甲同学得分的方差大于乙同学得分
的方差
易错提醒:在求数据的中位数、百分位数
时,一定要先把数据从小到大排列,然后根据
中位数、百分位数的定义进行求解。
解析:甲、乙的得分从小到大排列如下:
甲:7.0,8.3,8.9,8.9,9.2,9.3;
乙:8.1,8.5,8.6,8.6,8.7,9.1。
所以去掉最高分和最低分可得甲同学得
分的中位数为8.9,乙同学得分的中位数为
8.6,故A正确。
甲同学得分的极差为9.3-7.0=2.3,乙
同学得分的极差为9.1-8.1=2,故B正确。
因为6×75%=4.5,所以甲同学得分的
第75百分位数为9.2,乙同学得分的第75百
分位数为8.7,故C错误。
由图可以看出,甲同学得分的波动比乙
同学得分的波动大,故甲同学得分的方差大
于乙同学得分的方差,故D正确。
故选ABD。
易错点二、统计公式的关联应用出错
例 2 已知一组数据的平均数、方差分
别是x、s2,将这组数据中的每一个数都乘以
2,得到一组新数据,则这组新数据的平均数、
方差分别是( )。
A.x、
1
2s
2 B.2x、2s2
C.2x、4s2 D.x、s2
易错提醒:一组数据加上一个常数,新数
组的平均数与方差不变;一组数据乘以一个
常数,新数组的平均数是原数组平均数的常
数绝对值倍,新数组的方差是原数组方差的
平方倍。
解析:若新样本中的每一个数据是原样
本中每个数据的2倍,则新样本的平均数是
原样本平均数的2倍,方差为原来的4倍。
故选C。
易错点三、对频率分布直方图中的数据
特征理解不透
例 3 (多选题)某超市随机抽取了当
天100名顾客的消费金额作为样本,并分组
如下:[0,50),[50,100),[100,150),…,
图2
[250,300](单 位:
元),得到如图2所
示的频率分布直方
图,则下列说法正确
的是( )。
A.若该超市当
天总共有600名顾客,则消费金额在[100,
150)(单位:元)内的顾客约有180人
B.若每组数据以区间中点值为代表,则
样本中消费金额的平均数是145元
23
解题篇 易错题归类剖析
高考数学 2025年6月
C.若用样本估计总体,则该超市当天消
费金额的中位数是100.8元
D.现从样本的第1,2组中用比例分配的
分层随机抽样方法抽取6人,再从这6人中
随机抽取2人做进一步调查,则抽到的2人
的消费金额都不少于50元的概率是
2
5
易错提醒:在对频率分布直方图中的数据
信息分析与应用时,要特别注意从频率分布直
方图中确定对应的众数、中位数与平均数等。
一般可以借助以下几点来确定频率分布直方
图中的数据特征:众数就是频率分布直方图中
最高小长方形的底边中点的横坐标;中位数就
是左右两侧的小长方形面积相等的分界点;平
均数就是频率分布直方图中每个小长方形面
积乘以对应底边中点的横坐标之和。
解析:因为0.1+0.2+50a+0.2+0.15
+0.1=1,所以a=0.005。
对于选项A,消费金额在[100,150)内的
顾客约有50a×600=150(人),故A错误。
对于选项B,样本中消费金额的平均数
是0.1×25+0.2×75+0.25×125+0.2×
175+0.15×225+0.1×275=145(元),故B
正确。
对于选项C,设消费金额的中位数是t,
前二组的频率和为0.1+0.2<0.5,前三组
的频率和为0.1+0.2+0.25>0.5,所以t在
第三组内,所以0.1+0.2+(t-100)×0.005
=0.5,解得t=140,故C错误。
对于选项D,第1组和第2组的频率分
别为0.1,0.2,所以从样本的第1,2组中用比
例分配的分层随机抽样方法抽取6人,第1
组抽2人,第2组抽4人,当从这6人中随机
抽取2人做进一步调查时,则抽到的2人的
消费金额都不少于50元的概率P=
C24
C26
=
6
15
=
2
5
,故D正确。
故选BD。
易错点四、混淆线性回归方程与非线性
回归方程(即曲线)
例 4 某公司2025年1月至5月的销
售情况的数据汇总如表1:
表1
月份x 1 2 3 4 5
销售量y(万件)4.95.86.88.3 10.2
该公司根据以往的历史经验,建立了销
售量y(万件)关于月份x 的回归模型:̂y=
ûx2+̂v来预测接下来几个月的销售情况。
(1)根据题中给出的数据信息及对应的
回归模型,试求销售量y(万件)关于月份x
的回归方程;(̂u 的值精确到0.1)
(2)基于(1)中的结果,若该公司的月利
润z(单位:万元)与月份x,销售量y(万件)
的关系为z=24 x-
5y+2
x
,试确定该公司
月利润预报值最大的月份。
参考公式:对于一组数据(x1,y1),(x2,
y2),…,(xn,yn),其回归直线ŷ =̂bx+â 的
斜率和截距的最小二乘估计公式分别为b̂=
∑
n
i=1
(xi -x)(yi -y)
∑
n
i=1
(xi -x)2
,̂a=y-̂bx。
易错提醒:在求非线性回归方程时,一
定要先判断回归曲线类型,若不是直线,则
要转化为回归直线求解,在计算过程中要
注意求回归系数的两个公式之间的相互转
化。特别是一些常见的非线性回归模型,
如 指 数 函 数 型 y=cax、对 数 函 数 型 y=
bln
x+a、幂函数型y=axn、二次函数型
y=bx2+a、反比例函数型y=a+
b
x
等,合
理变换与转化方程,借助线性回归模型的
求解与应用,再逆向来确定对应的非线性
回归模型及其应用。
解析:(1)令 w=x2,则 w=
1
5×
(12+
22+32+42+52)=11,y=
1
5×
(4.9+5.8+
6.8+8.3+10.2)=7.2。
由参考公式得̂u=
∑
5
i=1
(wi-w)(yi-y)
∑
5
i=1
(wi-w)2
=
33
解题篇 易错题归类剖析
高考数学 2025年6月
[-10×(-2.3)+(-7)×(-1.4)+(-2)
×(-0.4)+5×1.1+14×3]÷[(1-11)2
+(4-11)2+(9-11)2+(16-11)2+(25-
11)2]=81.1÷374≈0.2,̂v=y-̂uw=7.2
-0.2×11=5。
故y关于x的回归方程为ŷ=0.2x2+5。
(2)由(1)知ŷ=0.2x2+5。
所以 z=24 x -
5y+2
x
=24 x -
5(0.2x2+5)+2
x
=24 x-x
3
2-
27
x
。
令h(x)=24 x-x
3
2-
27
x
(x>0),求
导得 h'(x)=
12
x
-
3
2 x +
27
2x
-32 =
-3x2+24x+27
2x x
=
-3(x-9)(x+1)
2x x
(x>
0)。
由h'(x)>0,得0<x<9,h(x)单调递
增;
由h'(x)<0,得x>9,h(x)单调递减。
所以h(x)=24 x-x
3
2-
27
x
(x>0)在
x=9处取得极大值,此时也是所求的最大
值,则h(x)max=h(9)=72-27-9=36,故该
公司月利润预报值最大的月份是9月。
易错点五、求解独立性检验问题对χ2 的
值理解不准确
例 5 (多选题)某研究小组对高三
500名学生的性别与身高的数据进行汇总,
对于学生的性别和身高是否低于170
cm的
关联性进行简单随机抽样,得到如表2所示
的列联表:
表2
身高
性别
低于170
cm 不低于170
cm合计
女 140 60 200
男 120 180 300
合计 260 240 500
附:χ2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
,
其中n=a+b+c+d。
表3
α
0.1 0.05 0.01 0.005
xα 2.706 3.841 6.635 7.879
小组成员甲用列联表中的数据进行独立
性检验,小组成员乙将列联表中的所有数据
都缩小为原来的
1
10
后再进行独立性检验,则
下列说法正确的是( )。
A.依据α=0.01的独立性检验,小组成
员甲可以认为该中学高三年级学生的性别与
身高有关联
B.依据α=0.01的独立性检验,小组成
员甲不能认为该中学高三年级学生的性别与
身高有关联
C.小组成员甲、乙计算出的χ2 值相同,
依据α=0.01的独立性检验,他们得出的结
论也相同
D.小组成员甲、乙计算出的χ2 值不同,
依据α=0.01的独立性检验,他们得出的结
论也不同
易错提醒:在独立性检验问题中,往往是
基于相应列联表的数据信息、卡方χ2 的值的
大小及对应α的取值要求等,合理将计算出来
的值与对应的临界值对比,进而对二者的关系
进行概率层面上的分析与判断。
解析:由题意,零假设为 H0:该中学高三
年级学生的性别与身高没有关联。
对 于 成 员 甲 有 χ2甲 =
500×(140×180-120×60)2
260×240×200×300 ≈ 43.269>
6.635,基于α=0.01的独立性检验可知,小
组成员甲可认为该中学高三年级学生的性别
与身高有关联。
对 于 成 员 乙 有 χ2乙 =
50×(14×18-12×6)2
26×24×20×30 ≈4.327<6.635
,基
于α=0.01的独立性检验可知,小组成员乙
不能认为该中学高三年级学生的性别与身高
有关联。
小组成员甲、乙计算出的χ2 值不同,他
们得出的结论也不同。
故选AD。 (责任编辑 王福华)
43
解题篇 易错题归类剖析
高考数学 2025年6月