新教材中统计新定义的变化方向及总结提升-《中学生数理化》高考数学2025年6月刊

2025-06-12
| 4页
| 30人阅读
| 3人下载
教辅
中学生数理化高中版编辑部
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 计数原理与概率统计
使用场景 高考复习
学年 2025-2026
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 PDF
文件大小 640 KB
发布时间 2025-06-12
更新时间 2025-06-12
作者 中学生数理化高中版编辑部
品牌系列 中学生数理化·高考数学
审核时间 2025-06-12
下载链接 https://m.zxxk.com/soft/52541317.html
价格 2.00储值(1储值=1元)
来源 学科网

内容正文:

􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹􀤹 期望和方差都可以作为决策依据,只要言之 有理都可以得分。可以预计开放性试题在高 考中出现的频率将越来越多。 注:本文系江苏省教育科学“十四五”规 划重点课题“学习进阶理论下高中数学单元 学习元指导研究”(编号:B/2022/03/65)的阶 段性研究成果。 (责任编辑 王福华) 新教材中统计新定义的变化方向及总结提升 ■浙江省龙泉中学 林建平 项少婷 概率统计是新教材变化最大的一个模 块,是数学建模和数据分析的一个重要载体, 是抽象数学和实际问题紧密联系的重要桥 梁,是研究大数据分析和人工智能技术等的 重要工具。《普通高中数学课程标准》中统计 方面主要考查:数据收集和整理的方法、数据 直观图表的表示方法、数据统计特征的刻画、 成对数据的统计相关性、回归模型的建立、独 立性检验及其应用等。因此,高考对统计的 考查要求有所提高,特别是统计与其他知识 的结合,其中统计新定义问题是难点,不仅考 查同学们的阅读能力、提取信息能力,还考查 理解能力、自学能力等。 一、统计量和指标变化 例 1 (2025届景德镇高三第一次质 检)第一组数据(x1,x2,…,xn),其中x1<x2 <…<xn,第二组数据(z1,z2,…,zn,zn+1), 这n+1个数互不相等,z1,z2 分别为其中最 大与第二大的数。先从第二组数据中剔除一 个数(剩余数相对位置保持不变)得到一组新 数据,若将该组数据中相邻两数对换位置称 为一次对换,经过至少k 次对换得到最终数 据(y1,y2,…,yn),简记τ(k)。若用直线y= a+bx拟合点列Pi(xi,yi)(i=1,2,…,n),相 关系数r= ∑ n i=1 xiyi-n􀭵x􀭵y ∑ n i=1 x2i -n􀭵x2 ∑ n i=1 y2i -n􀭵y2 。 (1)已知一组数据(10,8,2,5,-1,4),若 剔除10,则经过τ(k1)后得到(8,5,4,2,-1) 拟合最佳;若剔除8,则经过τ(k2)得到(-1, 2,4,5,10)最佳。求k1+k2 的值。 (2)在一组互不相等的数的排列(a1, a2,…,an)中,定义在ai 的右边比其小的数 的个数称为ai 的逆序数。已知a1,a3 的逆序 数分别为n-1,n-3,剩余各数按相对顺序 从大到小排列。若经过τ(k)后将这n 个数 从小到大顺序排列,求k的所有可能取值。 (3)若剔除z1 后经过至少 m1 次对换 τ(m1)后得到拟合效果最佳,相关系数为r1。 剔除z2 后经过至少m2 次对换τ(m2)后得到 拟合效果最佳,相关系数为r2。若r1r2<0, 求证:m1+m2 为定值,并求出该定值。 解析:(1)剔除10后将(8,2,5,-1,4)经过 k1 次对换后得到(8,5,4,2,-1),可得k1=3。 剔除8后将(10,2,5,-1,4)经过k2 次 对换后得到(-1,2,4,5,10),可得k2=7。 所以k1+k2=10。 (2)因为a1 的逆序数为n-1,所以a1 必 为这n个数中的最大数,将a1 对换到末位需 要n-1次。 因为a3 的逆序数为n-3,所以a3 可能 是这n个数中第二大或者第三大的数。 若a3 是第二大的数,再将a3 对换到倒 数第二位需要n-3次对换,而后将其余各数 对换到相应位置分别需要n-3,n-2,…,1, 0次对换,所以k= n2-n-2 2 ; 若a3 是第三大的数,则a2 只能是第二 大的数,则各数对换到相应位置分别需要 n-2,n-3,…,1,0次对换,所以k= n2-n 2 。 综上所述,k= n2-n-2 2 或k= n2-n 2 。 (3)先证明排序不等式。 不妨假设a1<a2<…<an,b1<b2<… <bn,k1,k2,…,kn 是1,2,…,n的一个排列。 83 解题篇 经典题突破方法 高考数学 2025年6月 对任意i,j∈{1,2,…,n},设i>j,则ai >aj,则(a1bk1+…+aibki+…+ajbkj+…+ anbkn)-(a1bk1+…+aibkj +…+ajbki +… +anbkn)=(ai-aj)(bki-bkj)。 于是(a1bk1+…+aibki+…+ajbkj +… +anbkn)>(a1bk1+…+aibkj +…+ajbki + …+anbkn)成立的充要条件为ki>kj。 于是经过若干次对换后得排序不等式: ∑ n i=1 aibn+1-i <∑ n i=1 aibki <∑ n i=1 aibi。 假设(y1,y2,…,yn)经过若干次对换后 得到(y1',y2',…,yn'),其中y1'<y2'<…< yn',则∑ n i=1 xiyn+1-i'<∑ n i=1 xiyi <∑ n i=1 xiyi'。 因为r= ∑ n i=1 xiyi -n􀭺x􀭵y ∑ n i=1 x2i -n􀭺x2 ∑ n i=1 y2i -n􀭵y2 , 其中 ∑ n i=1 x2i -n􀭺x2 ∑ n i=1 y2i -n􀭵y2 与n􀭺x􀭵y均 为定值,要使得拟合效果最佳,则|r|→1。 由于r1r2<0,假设r1>0,r2<0,则r1 →1, 即∑ n i=1 xiyi 尽可能大,r2 → -1,即∑ n i=1 xiyi 尽 可能小。 设(z3,…,zn,zn+1)的所有逆序数之和为 q,反之,正序数之和为p,因为这n-1个数 互不相等,所以p+q=C2n-1。 若剔除z1,将(z2,z3,…,zn,zn+1)按从 小到大的顺序排列,又(z3,…,zn,zn+1)中的 数对换成从小到大的位置共需q 次对换,z2 需要n-1次对换,故m1=n-1+q。 若剔除z2,将(z1,z3,…,zn,zn+1)按从 大到小的顺序排列,又(z3,…,zn,zn+1)中的 数对换成从大到小的位置共需p 次对换,z1 不变,故m2=p。 所以m1+m2=n-1+p+q=n-1+ C2n-1= n2-n 2 。 若r1<0,r2>0,同理可得 m1+m2= n2-n 2 。 综上所述,m1+m2= n2-n 2 为定值。 思维提升:一元回归模型中的相关系 数与排序问题的结合,对统计量和指标进 行重新定义。首先,提高阅读能力和理解 能力;其次,结合新定义的概念、性质和已 学知识构建数学模型,运用统计方法进行 计算和 分 析;最 后,做 出 决 策 解 决 实 际 问 题。考查同学们从题目情境中发现问题、 提出问题、分析问题、建立模型、解决数学 实际问题的能力。 二、新定义中的统计方法和技术 例 2 (2024年全国模拟试题)某校20 名学生的数学成绩xi(i=1,2,…,20)和知识 竞赛成绩yi(i=1,2,…,20)如表1: 表1 学生编号i 1 2 3 4 5 6 7 8 9 10 数学成绩xi 100 99 96 93 90 88 85 83 80 77 知识竞赛成绩yi 290160220200 65 70 90 100 60 270 学生编号i 11 12 13 14 15 16 17 18 19 20 数学成绩xi 75 74 72 70 68 66 60 50 39 35 知识竞赛成绩yi 45 35 40 50 25 30 20 15 10 5 计算可得数学成绩的平均值􀭺x=75,知 识竞赛成绩的平均值􀭵y=90,且∑ 20 i=1 (xi-􀭺x)2 =6 464,∑ 20 i=1 (yi -􀭵y)2 =149 450,∑ 20 i=1 (xi - 􀭺x)(yi -􀭵y)=21 650。 (1)求这组学生的数学成绩和知识竞赛 成绩的样本相关系数(精确到0.01)。 (2)设n∈N*,变量x 和变量y 的一组 样本数据为{(xi,yi)|i=1,2,…,n},其中xi (i=1,2,…,n)两两不相同,yi(i=1,2,…, n)两两不相同。记xi 在{xn|n=1,2,…,n} 中的排名是第Ri 位,yi 在{yn|n=1,2,…, n}中的排名是第Si 位,i=1,2,…,n。定义 变量x 和变量y 的“斯皮尔曼相关系数”(记 为ρ)为变量x 的排名和变量y 的排名的样 本相关系数。 ①记di=Ri-Si,i=1,2,…,n,证明: ρ=1- 6 n(n2-1)∑ n i=1 d2i。 ②用①的公式求这组学生的数学成绩和 知识竞赛成绩的“斯皮尔曼相关系数”(精确 93 解题篇 经典题突破方法 高考数学 2025年6月 到0.01)。 (3)比较(1)和(2)②的计算结果,简述 “斯皮尔曼相关系数”在分析线性相关性时的 优势。 附:r = ∑ n i=1 (xi-􀭵x)(yi-􀭵y) ∑ n i=1 (xi-􀭵x)2∑ n i=1 (yi-􀭵y)2 ; ∑ n k=1 k2 = n(n+1)(2n+1) 6 ; 6 464×149 450 ≈31 000。 解析:(1)由题意可知,这组学生数学成 绩和知识竞赛成绩的样本相关系数为r= ∑ 20 i=1 (xi -􀭺x)(yi -􀭵y) ∑ 20 i=1 (xi -􀭺x)2∑ 20 i=1 (yi -􀭵y)2 = 21 650 6 464×14 950 ≈ 21 650 31 000≈0.70 。 (2)①因为{Ri}和{Si}都是1,2,…,n 的 一 个 排 列,所 以 ∑ n i=1 Ri = ∑ n i=1 Si = n(n+1) 2 ,从而{Ri}和{Si}的平均数􀭺R,􀭺S 都是 n+1 2 。 因为∑ n i=1 R2i=∑ n i=1 S2i= n(n+1)(2n+1) 6 , 所 以 ∑ n i=1 (Ri - 􀭺R)2 = ∑ n i=1 R2i - n􀭺R2 = n(n+1)(2n+1) 6 - n(n+1)2 4 = n(n+1)(n-1) 12 。 同 理 可 得, ∑ n i=1 (Si - 􀭺S)2 = n(n+1)(n-1) 12 。 由于∑ n i=1 d2i =∑ n i=1 (Ri -Si)2=∑ n i=1 [(Ri - 􀭺R)-(Si-􀭺S)]2=∑ n i=1 (Ri-􀭺R)2+∑ n i=1 (Si- 􀭺S)2 - 2∑ n i=1 (Ri - 􀭺R)(Si - 􀭺S)= 2 · n(n+1)(n-1) 12 -2∑ n i=1 (Ri -􀭺R)(Si -􀭺S), 所以ρ= ∑ n i=1 (Ri -􀭺R)(Si -􀭺S) ∑ n i=1 (Ri -􀭺R)2 ∑ n i=1 (Si -􀭺S)2 = n(n+1)(n-1) 12 - 1 2∑ n i=1 d2i n(n+1)(n-1) 12 = 1 - 6 n(n2-1)∑ n i=1 d2i。 ②由题中的数据可写出Ri 与Si 的值, 如表2: 表2 学生编号i 1 2 3 4 5 6 7 8 9 10 数学成绩排名Ri 1 2 3 4 5 6 7 8 9 10 知识竞赛成绩排名Si 1 5 3 4 9 8 7 6 10 2 学生编号i 11121314151617181920 数学成绩排名Ri 11121314151617181920 知识竞赛成绩排名Si 12141311161517181920 所以∑ 20 i=1 d2i =9×02+4×12+3×22+ 2×32+1×42+1×82=114。 因此这组学生的数学成绩和知识竞赛成 绩的斯皮尔曼相关系数ρ=1- 6 20(202-1) × 114≈0.91。 (3)答案1:斯皮尔曼相关系数对于异常 值不太敏感,如果数据中有明显的异常值,那 么用斯皮尔曼相关系数比用样本相关系数更 能刻画某种线性关系。 答案2:斯皮尔曼相关系数刻画的是样 本数据排名的样本相关系数,与具体的数值 无关,只与排名有关。如果一组数据有异常 值,但排名依然符合一定的线性关系,则可以 采用斯皮尔曼相关系数刻画线性关系。 思维提升:在新定义中给出新的统计方 法和相关系数,约定新运算,建立新模型来解 决问题,新模型可以是线性模型,还可以是二 次曲线模型、指数函数模型、三角函数模型、 参变数模型等。解决这类问题需要同学们具 有较高的阅读理解、信息迁移及对实际问题 进行数学抽象等能力。根据数学运算的相关 值进行决策,体现了数学的实用性,同时也能提 04 解题篇 经典题突破方法 高考数学 2025年6月 升同学们学习的兴趣和明确学习数学的作用。 三、统计与社会、生活、科学技术等模块 的结合 例 3 (2024年湖南郴州三模试题) ChatGPT是由 OpenAI开发的一款人工智 能 机 器 人 程 序,一 经 推 出 就 火 遍 全 球。 ChatGPT的开发主要采用RLHF(人类反馈 强化学习)技术,训练分为以下三个阶段: 第一阶段,训练监督策略模型。对抽取 的prompt数据,人工进行高质量的回答,获 取<prompt,answer>数据对,帮助数学模型 GPT-3.5更好地理解指令。 第二阶段,训练奖励模型。用上一阶段 训练好的数学模型,生成k个不同的回答,人 工标注排名,通过奖励模型给出不同的数值, 奖励数值越高越好。奖励数值可以通过交叉 熵损失函数(Loss=-∑ n i=1 yiln ŷi,其中yi∈ {0,1},̂yi ∈ (0,1),且∑ n i=1 ŷi =1)得到。 第三阶段,实验与强化模型和算法。通 过调整模型的参数,使模型得到最大的奖励 以符合人工的选择取向。 附参考数据:ln 2≈0.693,ln 5≈1.609, ln 7≈1.946。 (1)若已知某单个样本,其真实分布y= [y1,y2,…,y10]=[0,0,0,0,1,0,0,0,0,0], 其预测近似分布ŷ=[y1,y2,…,y10]=[0, 0.2,0,0,0.7,0,0,0.1,0,0],计算该单个样 本的交叉熵损失函数Loss值。 (2)绝对值误差 MAE也是一种比较常 见的损失函数,现已知某n 阶变量的绝对值 误差 MAE= 1 n∑ n i=1 |̂yi -yi|,其中|̂yi- yi|=|̂yi1-yi1|+|̂yi2-yi2|+…+|̂yin- yin|,n表示变量的阶。若已知某个样本是一 个三阶变量的数阵y= 􀭠 􀭡 􀪁 􀪁 􀪁 􀪁􀪁 y1 y2 y3 􀭤 􀭥 􀪁 􀪁 􀪁 􀪁􀪁 = 􀭠 􀭡 􀪁 􀪁 􀪁 􀪁􀪁 y11,y12,y13 y21,y22,y23 y31,y32,y33 􀭤 􀭥 􀪁 􀪁 􀪁 􀪁􀪁 ,其 真实分布是y= 0,0,1 0,1,0 1,0,0 􀭠 􀭡 􀪁 􀪁 􀪁􀪁 􀭤 􀭥 􀪁 􀪁 􀪁􀪁 ,现已知其预测分布 为ŷ= a,b,c c,a,b b,c,a 􀭠 􀭡 􀪁 􀪁 􀪁􀪁 􀭤 􀭥 􀪁 􀪁 􀪁􀪁 ,求证:该变量的绝对值误差 MAE为定值。 (3)在测试ChatGPT时,如果输入的问 题没有语法错误,ChatGPT的回答被采纳的 概率为0.9,当出现语法错误时,ChatGPT的 回答被采纳的概率为0.5。现已知输入的问 题中出现语法错误的概率为0.05,且Chat- GPT的回答被采纳,求该问题的输入语法没 有错误的概率。 解析:(1)由题意,该单个样本的交叉嫡 损失函数Loss=-∑ n i=1 yiln ŷi=-1×ln 0.7 =-ln 7 10=ln 10 7 =ln 2+ln 5-ln 7≈ 0.356。 (2)由定义知,该三阶变量的绝对值误差 MAE= 1 3 [(a+b+1-c)+(c+1-a+b)+ (1-b+c+a)]= 1 3 (3+a+b+c)= 4 3 。 (3)记事件 A:ChatGPT中输入的语法 无错误;事件B:ChatGPT中输入的语法有 错误;事件C:ChatGPT的回答被采纳。 依题意知,P(A)=0.95,P(B)=0.05, P(C|A)=0.9,P(C|B)=0.5。 所 以 P (A | C )= P(AC) P(C) = P(A)P(C|A) P(A)P(C|A)+P(B)P(C|B) = 0.95×0.9 0.95×0.9+0.05×0.5= 171 176 。 思维提升:统计问题的核心是数据分析, 日常生活和社会问题是问题的载体,通过选 取适宜的素材,呈现现实中的问题情境或是 再现科学理论产生的场景,运用必备知识和 关键能力解决实际问题,让同学们感受数学 源于生活,而又高于生活。 注:本文系丽水市教育科学研究课题“基 于数学问题链落实数学核心素养的教学研究” (项目编号:2022SXSM020)的阶段性成果。 (责任编辑 王福华) 14 解题篇 经典题突破方法 高考数学 2025年6月

资源预览图

新教材中统计新定义的变化方向及总结提升-《中学生数理化》高考数学2025年6月刊
1
新教材中统计新定义的变化方向及总结提升-《中学生数理化》高考数学2025年6月刊
2
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。