新教材中统计新定义的变化方向及总结提升-《中学生数理化》高考数学2025年6月刊

2025-06-12

| 4页

| 30人阅读

| 3人下载

教辅

中学生数理化高中版编辑部

进店逛逛

资源信息

学段	高中
学科	数学
教材版本	-
年级	高三
章节	-
类型	教案-讲义
知识点	计数原理与概率统计
使用场景	高考复习
学年	2025-2026
地区（省份）	全国
地区（市）	-
地区（区县）	-
文件格式	PDF
文件大小	640 KB
发布时间	2025-06-12
更新时间	2025-06-12
作者	中学生数理化高中版编辑部
品牌系列	中学生数理化·高考数学
审核时间	2025-06-12
下载链接	https://m.zxxk.com/soft/52541317.html
价格	2.00储值（1储值=1元）
来源	学科网

内容正文：

􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹 期望和方差都可以作为决策依据,只要言之有理都可以得分。可以预计开放性试题在高考中出现的频率将越来越多。注:本文系江苏省教育科学“十四五”规划重点课题“学习进阶理论下高中数学单元学习元指导研究”(编号:B/2022/03/65)的阶段性研究成果。 (责任编辑王福华) 新教材中统计新定义的变化方向及总结提升 ■浙江省龙泉中学林建平项少婷概率统计是新教材变化最大的一个模块,是数学建模和数据分析的一个重要载体, 是抽象数学和实际问题紧密联系的重要桥梁,是研究大数据分析和人工智能技术等的重要工具。《普通高中数学课程标准》中统计方面主要考查:数据收集和整理的方法、数据直观图表的表示方法、数据统计特征的刻画、成对数据的统计相关性、回归模型的建立、独立性检验及其应用等。因此,高考对统计的考查要求有所提高,特别是统计与其他知识的结合,其中统计新定义问题是难点,不仅考查同学们的阅读能力、提取信息能力,还考查理解能力、自学能力等。一、统计量和指标变化例 1 (2025届景德镇高三第一次质检)第一组数据(x1,x2,…,xn),其中x1<x2 <…<xn,第二组数据(z1,z2,…,zn,zn+1), 这n+1个数互不相等,z1,z2 分别为其中最大与第二大的数。先从第二组数据中剔除一个数(剩余数相对位置保持不变)得到一组新数据,若将该组数据中相邻两数对换位置称为一次对换,经过至少k 次对换得到最终数据(y1,y2,…,yn),简记τ(k)。若用直线y= a+bx拟合点列Pi(xi,yi)(i=1,2,…,n),相关系数r= ∑ n i=1 xiyi-n􀭵x􀭵y ∑ n i=1 x2i -n􀭵x2 ∑ n i=1 y2i -n􀭵y2 。 (1)已知一组数据(10,8,2,5,-1,4),若剔除10,则经过τ(k1)后得到(8,5,4,2,-1) 拟合最佳;若剔除8,则经过τ(k2)得到(-1, 2,4,5,10)最佳。求k1+k2 的值。 (2)在一组互不相等的数的排列(a1, a2,…,an)中,定义在ai 的右边比其小的数的个数称为ai 的逆序数。已知a1,a3 的逆序数分别为n-1,n-3,剩余各数按相对顺序从大到小排列。若经过τ(k)后将这n 个数从小到大顺序排列,求k的所有可能取值。 (3)若剔除z1 后经过至少 m1 次对换 τ(m1)后得到拟合效果最佳,相关系数为r1。剔除z2 后经过至少m2 次对换τ(m2)后得到拟合效果最佳,相关系数为r2。若r1r2<0, 求证:m1+m2 为定值,并求出该定值。解析:(1)剔除10后将(8,2,5,-1,4)经过 k1 次对换后得到(8,5,4,2,-1),可得k1=3。剔除8后将(10,2,5,-1,4)经过k2 次对换后得到(-1,2,4,5,10),可得k2=7。所以k1+k2=10。 (2)因为a1 的逆序数为n-1,所以a1 必为这n个数中的最大数,将a1 对换到末位需要n-1次。因为a3 的逆序数为n-3,所以a3 可能是这n个数中第二大或者第三大的数。若a3 是第二大的数,再将a3 对换到倒数第二位需要n-3次对换,而后将其余各数对换到相应位置分别需要n-3,n-2,…,1, 0次对换,所以k= n2-n-2 2 ; 若a3 是第三大的数,则a2 只能是第二大的数,则各数对换到相应位置分别需要 n-2,n-3,…,1,0次对换,所以k= n2-n 2 。综上所述,k= n2-n-2 2 或k= n2-n 2 。 (3)先证明排序不等式。不妨假设a1<a2<…<an,b1<b2<… <bn,k1,k2,…,kn 是1,2,…,n的一个排列。 83 解题篇经典题突破方法高考数学 2025年6月对任意i,j∈{1,2,…,n},设i>j,则ai >aj,则(a1bk1+…+aibki+…+ajbkj+…+ anbkn)-(a1bk1+…+aibkj +…+ajbki +… +anbkn)=(ai-aj)(bki-bkj)。于是(a1bk1+…+aibki+…+ajbkj +… +anbkn)>(a1bk1+…+aibkj +…+ajbki + …+anbkn)成立的充要条件为ki>kj。于是经过若干次对换后得排序不等式: ∑ n i=1 aibn+1-i <∑ n i=1 aibki <∑ n i=1 aibi。假设(y1,y2,…,yn)经过若干次对换后得到(y1',y2',…,yn'),其中y1'<y2'<…< yn',则∑ n i=1 xiyn+1-i'<∑ n i=1 xiyi <∑ n i=1 xiyi'。因为r= ∑ n i=1 xiyi -n􀭺x􀭵y ∑ n i=1 x2i -n􀭺x2 ∑ n i=1 y2i -n􀭵y2 , 其中 ∑ n i=1 x2i -n􀭺x2 ∑ n i=1 y2i -n􀭵y2 与n􀭺x􀭵y均为定值,要使得拟合效果最佳,则|r|→1。由于r1r2<0,假设r1>0,r2<0,则r1 →1, 即∑ n i=1 xiyi 尽可能大,r2 → -1,即∑ n i=1 xiyi 尽可能小。设(z3,…,zn,zn+1)的所有逆序数之和为 q,反之,正序数之和为p,因为这n-1个数互不相等,所以p+q=C2n-1。若剔除z1,将(z2,z3,…,zn,zn+1)按从小到大的顺序排列,又(z3,…,zn,zn+1)中的数对换成从小到大的位置共需q 次对换,z2 需要n-1次对换,故m1=n-1+q。若剔除z2,将(z1,z3,…,zn,zn+1)按从大到小的顺序排列,又(z3,…,zn,zn+1)中的数对换成从大到小的位置共需p 次对换,z1 不变,故m2=p。所以m1+m2=n-1+p+q=n-1+ C2n-1= n2-n 2 。若r1<0,r2>0,同理可得 m1+m2= n2-n 2 。综上所述,m1+m2= n2-n 2 为定值。思维提升:一元回归模型中的相关系数与排序问题的结合,对统计量和指标进行重新定义。首先,提高阅读能力和理解能力;其次,结合新定义的概念、性质和已学知识构建数学模型,运用统计方法进行计算和分析;最后,做出决策解决实际问题。考查同学们从题目情境中发现问题、提出问题、分析问题、建立模型、解决数学实际问题的能力。二、新定义中的统计方法和技术例 2 (2024年全国模拟试题)某校20 名学生的数学成绩xi(i=1,2,…,20)和知识竞赛成绩yi(i=1,2,…,20)如表1: 表1 学生编号i 1 2 3 4 5 6 7 8 9 10 数学成绩xi 100 99 96 93 90 88 85 83 80 77 知识竞赛成绩yi 290160220200 65 70 90 100 60 270 学生编号i 11 12 13 14 15 16 17 18 19 20 数学成绩xi 75 74 72 70 68 66 60 50 39 35 知识竞赛成绩yi 45 35 40 50 25 30 20 15 10 5 计算可得数学成绩的平均值􀭺x=75,知识竞赛成绩的平均值􀭵y=90,且∑ 20 i=1 (xi-􀭺x)2 =6 464,∑ 20 i=1 (yi -􀭵y)2 =149 450,∑ 20 i=1 (xi - 􀭺x)(yi -􀭵y)=21 650。 (1)求这组学生的数学成绩和知识竞赛成绩的样本相关系数(精确到0.01)。 (2)设n∈N*,变量x 和变量y 的一组样本数据为{(xi,yi)|i=1,2,…,n},其中xi (i=1,2,…,n)两两不相同,yi(i=1,2,…, n)两两不相同。记xi 在{xn|n=1,2,…,n} 中的排名是第Ri 位,yi 在{yn|n=1,2,…, n}中的排名是第Si 位,i=1,2,…,n。定义变量x 和变量y 的“斯皮尔曼相关系数”(记为ρ)为变量x 的排名和变量y 的排名的样本相关系数。 ①记di=Ri-Si,i=1,2,…,n,证明: ρ=1- 6 n(n2-1)∑ n i=1 d2i。 ②用①的公式求这组学生的数学成绩和知识竞赛成绩的“斯皮尔曼相关系数”(精确 93 解题篇经典题突破方法高考数学 2025年6月到0.01)。 (3)比较(1)和(2)②的计算结果,简述 “斯皮尔曼相关系数”在分析线性相关性时的优势。附:r = ∑ n i=1 (xi-􀭵x)(yi-􀭵y) ∑ n i=1 (xi-􀭵x)2∑ n i=1 (yi-􀭵y)2 ; ∑ n k=1 k2 = n(n+1)(2n+1) 6 ; 6 464×149 450 ≈31 000。解析:(1)由题意可知,这组学生数学成绩和知识竞赛成绩的样本相关系数为r= ∑ 20 i=1 (xi -􀭺x)(yi -􀭵y) ∑ 20 i=1 (xi -􀭺x)2∑ 20 i=1 (yi -􀭵y)2 = 21 650 6 464×14 950 ≈ 21 650 31 000≈0.70 。 (2)①因为{Ri}和{Si}都是1,2,…,n 的一个排列,所以 ∑ n i=1 Ri = ∑ n i=1 Si = n(n+1) 2 ,从而{Ri}和{Si}的平均数􀭺R,􀭺S 都是 n+1 2 。因为∑ n i=1 R2i=∑ n i=1 S2i= n(n+1)(2n+1) 6 , 所以 ∑ n i=1 (Ri - 􀭺R)2 = ∑ n i=1 R2i - n􀭺R2 = n(n+1)(2n+1) 6 - n(n+1)2 4 = n(n+1)(n-1) 12 。同理可得, ∑ n i=1 (Si - 􀭺S)2 = n(n+1)(n-1) 12 。由于∑ n i=1 d2i =∑ n i=1 (Ri -Si)2=∑ n i=1 [(Ri - 􀭺R)-(Si-􀭺S)]2=∑ n i=1 (Ri-􀭺R)2+∑ n i=1 (Si- 􀭺S)2 - 2∑ n i=1 (Ri - 􀭺R)(Si - 􀭺S)= 2 · n(n+1)(n-1) 12 -2∑ n i=1 (Ri -􀭺R)(Si -􀭺S), 所以ρ= ∑ n i=1 (Ri -􀭺R)(Si -􀭺S) ∑ n i=1 (Ri -􀭺R)2 ∑ n i=1 (Si -􀭺S)2 = n(n+1)(n-1) 12 - 1 2∑ n i=1 d2i n(n+1)(n-1) 12 = 1 - 6 n(n2-1)∑ n i=1 d2i。 ②由题中的数据可写出Ri 与Si 的值, 如表2: 表2 学生编号i 1 2 3 4 5 6 7 8 9 10 数学成绩排名Ri 1 2 3 4 5 6 7 8 9 10 知识竞赛成绩排名Si 1 5 3 4 9 8 7 6 10 2 学生编号i 11121314151617181920 数学成绩排名Ri 11121314151617181920 知识竞赛成绩排名Si 12141311161517181920 所以∑ 20 i=1 d2i =9×02+4×12+3×22+ 2×32+1×42+1×82=114。因此这组学生的数学成绩和知识竞赛成绩的斯皮尔曼相关系数ρ=1- 6 20(202-1) × 114≈0.91。 (3)答案1:斯皮尔曼相关系数对于异常值不太敏感,如果数据中有明显的异常值,那么用斯皮尔曼相关系数比用样本相关系数更能刻画某种线性关系。答案2:斯皮尔曼相关系数刻画的是样本数据排名的样本相关系数,与具体的数值无关,只与排名有关。如果一组数据有异常值,但排名依然符合一定的线性关系,则可以采用斯皮尔曼相关系数刻画线性关系。思维提升:在新定义中给出新的统计方法和相关系数,约定新运算,建立新模型来解决问题,新模型可以是线性模型,还可以是二次曲线模型、指数函数模型、三角函数模型、参变数模型等。解决这类问题需要同学们具有较高的阅读理解、信息迁移及对实际问题进行数学抽象等能力。根据数学运算的相关值进行决策,体现了数学的实用性,同时也能提 04 解题篇经典题突破方法高考数学 2025年6月升同学们学习的兴趣和明确学习数学的作用。三、统计与社会、生活、科学技术等模块的结合例 3 (2024年湖南郴州三模试题) ChatGPT是由 OpenAI开发的一款人工智能机器人程序,一经推出就火遍全球。 ChatGPT的开发主要采用RLHF(人类反馈强化学习)技术,训练分为以下三个阶段: 第一阶段,训练监督策略模型。对抽取的prompt数据,人工进行高质量的回答,获取<prompt,answer>数据对,帮助数学模型 GPT-3.5更好地理解指令。第二阶段,训练奖励模型。用上一阶段训练好的数学模型,生成k个不同的回答,人工标注排名,通过奖励模型给出不同的数值, 奖励数值越高越好。奖励数值可以通过交叉熵损失函数(Loss=-∑ n i=1 yiln ŷi,其中yi∈ {0,1},̂yi ∈ (0,1),且∑ n i=1 ŷi =1)得到。第三阶段,实验与强化模型和算法。通过调整模型的参数,使模型得到最大的奖励以符合人工的选择取向。附参考数据:ln 2≈0.693,ln 5≈1.609, ln 7≈1.946。 (1)若已知某单个样本,其真实分布y= [y1,y2,…,y10]=[0,0,0,0,1,0,0,0,0,0], 其预测近似分布ŷ=[y1,y2,…,y10]=[0, 0.2,0,0,0.7,0,0,0.1,0,0],计算该单个样本的交叉熵损失函数Loss值。 (2)绝对值误差 MAE也是一种比较常见的损失函数,现已知某n 阶变量的绝对值误差 MAE= 1 n∑ n i=1 |̂yi -yi|,其中|̂yi- yi|=|̂yi1-yi1|+|̂yi2-yi2|+…+|̂yin- yin|,n表示变量的阶。若已知某个样本是一个三阶变量的数阵y= 􀭠 􀭡 􀪁 􀪁 􀪁 􀪁􀪁 y1 y2 y3 􀭤 􀭥 􀪁 􀪁 􀪁 􀪁􀪁 = 􀭠 􀭡 􀪁 􀪁 􀪁 􀪁􀪁 y11,y12,y13 y21,y22,y23 y31,y32,y33 􀭤 􀭥 􀪁 􀪁 􀪁 􀪁􀪁 ,其真实分布是y= 0,0,1 0,1,0 1,0,0 􀭠 􀭡 􀪁 􀪁 􀪁􀪁 􀭤 􀭥 􀪁 􀪁 􀪁􀪁 ,现已知其预测分布为ŷ= a,b,c c,a,b b,c,a 􀭠 􀭡 􀪁 􀪁 􀪁􀪁 􀭤 􀭥 􀪁 􀪁 􀪁􀪁 ,求证:该变量的绝对值误差 MAE为定值。 (3)在测试ChatGPT时,如果输入的问题没有语法错误,ChatGPT的回答被采纳的概率为0.9,当出现语法错误时,ChatGPT的回答被采纳的概率为0.5。现已知输入的问题中出现语法错误的概率为0.05,且Chat- GPT的回答被采纳,求该问题的输入语法没有错误的概率。解析:(1)由题意,该单个样本的交叉嫡损失函数Loss=-∑ n i=1 yiln ŷi=-1×ln 0.7 =-ln 7 10=ln 10 7 =ln 2+ln 5-ln 7≈ 0.356。 (2)由定义知,该三阶变量的绝对值误差 MAE= 1 3 [(a+b+1-c)+(c+1-a+b)+ (1-b+c+a)]= 1 3 (3+a+b+c)= 4 3 。 (3)记事件 A:ChatGPT中输入的语法无错误;事件B:ChatGPT中输入的语法有错误;事件C:ChatGPT的回答被采纳。依题意知,P(A)=0.95,P(B)=0.05, P(C|A)=0.9,P(C|B)=0.5。所以 P (A | C )= P(AC) P(C) = P(A)P(C|A) P(A)P(C|A)+P(B)P(C|B) = 0.95×0.9 0.95×0.9+0.05×0.5= 171 176 。思维提升:统计问题的核心是数据分析, 日常生活和社会问题是问题的载体,通过选取适宜的素材,呈现现实中的问题情境或是再现科学理论产生的场景,运用必备知识和关键能力解决实际问题,让同学们感受数学源于生活,而又高于生活。注:本文系丽水市教育科学研究课题“基于数学问题链落实数学核心素养的教学研究” (项目编号:2022SXSM020)的阶段性成果。 (责任编辑王福华) 14 解题篇经典题突破方法高考数学 2025年6月

资源预览图

新教材中统计新定义的变化方向及总结提升-《中学生数理化》高考数学2025年6月刊

所属专辑