内容正文:
将上式左右两侧同乘以
5
6
,得5
6E
(X)=
1
6×
5
6+2×
1
6×
5
6
2
+3×
1
6×
5
6
3
+…
+(n-1)×
1
6×
5
6
n-1
+n× 56
n
。
所以
1
6E
(X)=E(X)-
5
6E
(X)=
1
6×
1+
5
6+
5
6
2
+…+ 56
n-2
+ 16 ×
5
6
n-1
。
故E(X)=1+
5
6+
5
6
2
+…+ 56
n-2
+ 56
n-1
=
1× 1- 56
n-1
1-
5
6
+ 56
n-1
=6×
1- 56
n-1
+ 56
n-1
=6-5× 56
n-1
,
n∈N*。
点评:本题考查离散型随机变量数学期
望的计算。先求出投掷次数的分布列,列出
数学期望的算式,发现其符合等差数列乘以
等比数列的形式,故而采用错位相减法对和
式进行计算和化简。但需要注意的是:由于
游戏有强制终止的规则,因此 X=n 的概率
需要单独运算(这是强制终止类问题的常见
易错点)。一般地,在求解与数学期望有关的
分布列问题时,通常有两种思路:①若随机变
量的可能取值情况较少,可直接写出分布列
并列式求和,这也是最常用的求解数学期望
的方法;②写出数学期望E(X=n)的递推关
系式,借助递推关系式构造等差、等比数列解
决问题(类似例4求概率的方法)。
最后,希望本文所探讨的解题技巧与备
考策略能够为同学们提供有益的参考,助力
同学们在高考中取得理想成绩。
注:本文系河南省基础教育课题“高中生
数学错题管理现状调查及方案研究”(课题编
号:JCJYC2303000103)的阶段性成果。
(责任编辑 王福华)
■河南省实验中学 奈小辉
统计与概率作为高中数学的核心知识之
一,在高考中占据重要地位,重点考查同学们
的逻辑思维、信息获取及运算化简能力。它
与函数、几何等其他数学知识相互补充,共同
构成了完整的数学知识体系。例如,在统计
模块中,数据的收集、整理和分析需要运用到
函数的思想。同时,概率模块与组合数紧密
相关,涉及排列组合的知识,这些内容在高中
数学中占据重要位置。
研究发现,近三年高
考概率与统计试题具有生活化素材立意、真
实性问题解决及跨学科交叉融合等特点。
展
望未来高考概率与统计试题的命制,将会进
一步加强生活实践情境的创设,丰富情境背
景,关注科技发展;贴近真实问题,激活基础
知识;紧跟时代热点,引领核心价值;渗透社
会文化,导向综合素养。统计与概率在2025
年高考将会怎么考? 同学们不妨从以下几个
方面着手复习。
一、非线性回归与相关系数
1.高考考查方向
模型选择与拟合:给定实际数据,判断变
量间的非线性关系类型,选择合适的非线性
函数模型(如指数函数模型、对数函数模型、
幂函数模型等)进行拟合,并求解模型中的参
7
知识篇 科学备考新指向
高考数学 2025年6月
数,从而得到回归方程。
相关系数应用:计算相关指数R2 =1-
∑
n
i=1
(yi -ŷi)2
∑
n
i=1
(yi -y)2
,依据 R2 的值判断变量间线
性相关程度的强弱,进而评估所选用的线性
或非线性回归模型的合理性。
2.未来考试趋势
未来可能会更加紧密地结合实际生活场
景,如经济增长预测、生物种群数量变化等,
考查非线性回归模型的构建与应用,同时对
相关系数的理解和运用的考查会更加深入,
可能涉及多变量间的相关分析。
例 1 一只药用昆虫的产卵数y 与一
定范围内的温度x 有关,现收集了该种药用
昆虫的6组观测数据,如表1:
表1
温度x/°C 21 23 24 27 29 32
产卵数y/个 6 11 20 27 57 77
经计算得x=
1
6∑
6
i=1
xi=26,y=
1
6∑
6
i=1
yi
=33,∑
6
i=1
(xi -x)(yi -y)=557,∑
6
i=1
(xi -
x)2=84,∑
6
i=1
(yi-y)2=3
930,线性回归模型
的残差平方和∑
6
i=1
(yi -ŷi)2 =236.64,e8.060
5
≈3
167,其中xi,yi 分别为观测数据中的温
度和产卵数,i=1,2,3,4,5,6。
(1)若用线性回归方程,求y 关于x 的线
性回归方程ŷ=̂bx+̂a(精确到0.1)。
(2)若用非线性回归模型求得y 关于x
回归 方 程 为 ŷ=0.06e0.230
3x,且 相 关 指 数
R2=0.952
2。
①试与(1)中的回归模型相比,用R2 说
明哪种模型的拟合效果更好。
②用拟合效果好的模型预测温度为35
°C
时该种药用昆虫的产卵数(结果取整数)。
附:回归直线ŷ=̂bx+̂a 中斜率和截距
的 最 小 二 乘 估 计 公 式 分 别 为 b̂ =
∑
n
i=1
(xi -x)(yi -y)
∑
n
i=1
(xi -x)2
,̂a=y-̂bx;
相关指数R2=1-
∑
n
i=1
(yi -ŷi)2
∑
n
i=1
(yi -y)2
。
解析:(1)由题意可知,n=6,所以x =
1
6∑
6
i=1
xi = 26,y =
1
6∑
6
i=1
yi = 33,̂b =
∑
6
i=1
(xi -x)(yi -y)
∑
6
i=1
(xi -x)2
=
557
84 ≈6.6
,̂a=33-
6.6×26=-138.6,所以y 关于x 的线性回
归方程为ŷ=6.6x-138.6。
(2)①对于线性回归模型,∑
6
i=1
(yi -y)2
=3
930,∑
6
i=1
(yi -ŷi)2=236.64。
故相关指数 R2=1-
∑
6
i=1
(yi -ŷi)2
∑
6
i=1
(yi -y)2
=
1-
236.64
3
930 ≈1-0.060
2=0.939
8。
因为0.939
8<0.952
2,所以用非线性
回归模型拟合效果更好。
②当 x=35 时,̂y=0.06e0.230
3×35 =
0.06×e8.060
5=0.06×3
167=190.02≈190。
所以当温度为35
°C时,该种药用昆虫
的产卵数估计为190个。
点评:该题考查同学们对线性回归方程
及非线性回归方程的理解与应用,不仅要求
同学们具有一定的计算能力,还要求同学们
掌握相关指数等概念,能够利用相关指数判
断回归模型的拟合效果。
二、二项分布、超几何分布、正态分布的
综合应用
1.高考考查方向
概念辨析与选择:给出实际问题情境,要
求同学们判断该问题适合用二项分布、超几
何分布,还是正态分布来解决,考查对三种分
布概念的理解和辨析能力。
8
知识篇 科学备考新指向
高考数学 2025年6月
综合计算:在一个问题中同时涉及多种
分布,如先利用正态分布确定某事件的概率,
再将其作为二项分布中的参数进行后续计
算,考查同学们的综合分析和计算能力。
2.未来考试趋势
未来可能会以更加复杂和新颖的实际问
题为背景,融合多种分布的知识,考查同学们
运用概率统计知识解决实际问题的能力,同
时可能会结合数学建模思想,要求同学们构
建合适的概率模型进行解答。
例 2 在某地区进行高中学生每周户
外运动调查,随机调查了1
000名高中学生
户外运动的时间(单位:小时),得到如图1所
示的样本数据的频率分布直方图。
图1
(1)求图1中
a 的值,估计该地
区 高 中 学 生 每 周
户 外 运 动 的 平 均
时间;(同 一 组 数
据 用 该 区 间 的 中
点值作代表)
(2)为进一步了解这1
000名高中学生户
外运动的时间分配,在(14,16],(16,18]两组内
的学生中,采用分层抽样的方法抽取了5人,再
从这5人中随机抽取3人进行访谈,记在(14,
16]内的人数为X,求X 的分布列和数学期望;
(3)以频率估计概率,从该地区的高中学
生中随机抽取8名学生,用“P8(k)”表示这8
名学生中恰有k 名学生户外运动时间在(8,
10]内的概率,当P8(k)最大时,求k的值。
解析:(1)由已知2(0.02+0.03+0.05
+0.05+0.15+a+0.05+0.04+0.01)=1,
解得a=0.1。
所以平均数为1×0.04+3×0.06+5×
0.1+7×0.1+9×0.3+11×0.2+13×0.1
+15×0.08+17×0.02=9.16。
(2)这1
000名高中学生户外运动的时
间分配,在(14,16],(16,18]两组内的学生分
别有1
000×0.08=80(人),1
000×0.02=
20(人)。根据分层抽样知5人中在(14,16]
内的人数为5×
80
80+20=4
,在(16,18]内的
人数为5-4=1。
所以随机变量 X 的可能取值为2,3,所
以P(X=2)=
C24
C35
=
3
5
,P(X=3)=
C34
C35
=
2
5
。
故X 的分布列如表2所示:
表2
X 2 3
P 35
2
5
所以E(X)=2×
3
5+3×
2
5=
12
5
。
(3)由频率分布直方图可知,运动时间在
(8,10]内的频率为0.15×2=0.3=
3
10
。
所以 P8(k)=Ck8
3
10
k
1-
3
10
8-k
=
Ck8
3
10
k 7
10
8-k
。
若P8(k)为最大值,则
P8(k)≥P8(k+1),
P8(k)≥P8(k-1),
即
Ck8
3
10
k 7
10
8-k
≥Ck+18
3
10
k+1 7
10
7-k
,
Ck8
3
10
k 7
10
8-k
≥Ck-18
3
10
k-1 7
10
9-k
,
即
1
8-k×
7
10≥
1
k+1×
3
10
,
1
k×
3
10≥
1
9-k×
7
10
,
解得1.17≤k≤2.7。
又因为k∈N,且0≤k≤8,所以k=2。
点评:本题第(1)问根据频率和为1,可
得a,再根据平均数公式直接计算平均数即
可。第(2)问要求同学们清晰辨别超几何分
布和二 项 分 布,分 别 计 算 时 间 在 (14,16],
(16,18]内的频数,结合分层抽样可得两组分
别抽取的人数,根据超几何分布的概率公式
分别计算概率,可得分布列与数学期望;根据
频率分布直方图可知运动时间在(8,10]内的
频率,利用二项分布的概率公式可得P8(k),
结合最值列不等式,解不等式即可。
三、马尔科夫链问题
1.高考考查方向
基本概念理解:考查对马尔科夫链的定
义、马尔科夫性质及转移概率矩阵的理解,判
断给定的随机过程是否为马尔科夫链。
9
知识篇 科学备考新指向
高考数学 2025年6月
概率计算:已知转移概率矩阵和初始状
态,计算经过若干次转移后处于特定状态的
概率,或者求解稳态概率。
2.未来考试趋势
随着人工智能、机器学习等领域的发展,
马尔科夫链在高考中的考查可能会逐渐增
多,并且会与前沿领域的实际应用相结合,如
文本生成、语音识别中的状态转移模型等。
例 3 马尔科夫链因俄国数学家安德
烈·马尔科夫得名,其过程具备“无记忆”的
性质,即第n+1次状态的概率分布只跟第n
次的状态有关,与第n-1,n-2,n-3,…次
状态无关。马尔科夫链是概率统计中的一个
重要模型,也是机器学习和人工智能的基石,
在强化学习、自然语言处理、金融领域、天气
预测等方面都有着极其广泛的应用。已知
A,B 两个盒子,各装有2个黑球和1个红
球,现从A,B 两个盒子中各任取一个球交换
放入另一个盒子,重复进行n(n∈N*)次这
样的操作后,记A 盒子中红球的个数为Xn,
恰有1个红球的概率为pn。
(1)求p1,p2 的值;
(2)求pn 的值(用n表示);
(3)求证:Xn 的数学期望E(Xn)为定值。
解析:(1)设第n(n∈N*)次操作后A 盒
子中恰有2个红球的概率为qn,则没有红球
的概率为1-pn-qn。
由题意知 p1=
C12C12+C11C11
C13C13
=
5
9
,q1=
C12C11
C13C13
=
2
9
。
p2=p1·
C12C12+C11C11
C13C13
+q1·
C12C13
C13C13
+
(1-p1-q1)·
C13C12
C13C13
=
49
81
。
(2)因为pn=pn-1·
C12C12+C11C11
C13C13
+qn-1·
C12C13
C13C13
+(1-pn-1-qn-1)·
C13C12
C13C13
=-
1
9pn-1+
2
3
,所以pn-
3
5=-
1
9 pn-1-
3
5 。
又p1-
3
5=-
2
45≠0
,所以 pn-
3
5 是
以-
2
45
为首项,-
1
9
为公比的等比数列。
所以pn-
3
5=-
2
45 -
1
9
n-1
,故pn=
-
2
45 -
1
9
n-1
+
3
5
。
(3)因为qn=
C12C11
C13C13
·pn-1+
C11C13
C13C13
·qn-1
=
2
9pn-1+
1
3qn-1
,1-qn-pn=
C11C12
C13C13
·pn-1
+
C13C11
C13C13
(1-qn-1-pn-1)=
2
9pn-1+
1
3
(1-
qn-1-pn-1),所以两式相减,得2qn+pn-1
=
1
3
(2qn-1+pn-1-1)。
又因为2q1+p1-1=0,所以2qn+pn-
1=0,所以qn=
1-pn
2
。
由题意知 Xn 的可能取值是0,1,2,则
P(Xn=0)=1-pn-qn=
1-pn
2
,P(Xn=1)
=pn,P(Xn=2)=qn=
1-pn
2
。
所以Xn 的分布列如表3所示:
表3
Xn 0 1 2
p
1-pn
2 pn
1-pn
2
所以E(Xn)=0×
1-pn
2 +1×pn+2×
1-pn
2 =1
,即Xn 的数学期望E(Xn)为定值。
点评:本题需要同学们对马尔科夫链知识
有所了解,同时能够结合数列、古典概型运算
公式及组合的定义进行求解。本题的难点在
于根据古典概型运算公式,用含pn-1 的代数
式表示pn,运用构造法,结合等比数列的定义
进行求解。最后需要根据古典概型运算公式,
结合题意得到qn、qn-1、pn、pn-1 之间的关系,
结合数学期望的运算公式进行求解。
注:本文系2023年度河南省基础教育教
学研究项目“高中生数学错题管理现状调查
及方案研究”(立项编号:JCJYC2303000103)
的研究成果。 (责任编辑 王福华)
01
知识篇 科学备考新指向
高考数学 2025年6月