9.3 统计案例(教师用书Word)-【正禾一本通】2026年新高考数学高三一轮总复习高效讲义(北师大版)

2025-12-02
| 11页
| 21人阅读
| 1人下载
教辅
山东正禾大教育科技有限公司
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 统计案例
使用场景 高考复习-一轮复习
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 DOCX
文件大小 364 KB
发布时间 2025-12-02
更新时间 2025-12-02
作者 山东正禾大教育科技有限公司
品牌系列 正禾一本通·高考一轮总复习高效讲义
审核时间 2025-12-02
下载链接 https://m.zxxk.com/soft/55204999.html
价格 3.00储值(1储值=1元)
来源 学科网

摘要:

该高中数学高考复习讲义聚焦统计案例专题,覆盖变量相关关系、样本相关系数、一元线性回归模型及独立性检验等高考核心考点,按“概念—方法—应用”逻辑构建知识体系。通过必备知识梳理、题型分类精讲、真题解析及分层练习,帮助学生系统突破相关系数计算、回归方程求解、独立性检验等难点。 讲义采用“题型示例—思维升华—对点练习”教学模式,注重培养数学思维与数据观念,如通过残差分析案例引导学生理解模型假设,结合三胎生育意愿调查等实例强化独立性检验应用。设置基础诊断、能力提升分层训练,配合解题方法总结,助力学生高效掌握统计问题求解策略,为教师把控复习节奏提供清晰路径。

内容正文:

9.3 统计案例 [课标要求] 1.了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹角的关系.会通过相关系数比较多组成对数据的相关性. 2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计方法. 3.针对实际问题,会用一元线性回归模型进行预测. 4.理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用. 【必备知识】 1.变量的相关关系 (1)定义:两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系. (2)分类:正相关和负相关. (3)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关. 2.样本相关系数 (1)样本相关系数 r=. (2)相关系数r的性质 ①当r>0时,成对样本数据正相关; 当r<0时,成对样本数据负相关; 当r=0时,成对样本数据无线性相关关系. ②样本相关系数r的取值范围为[-1,1]. 当|r|越接近1时,成对样本数据的线性相关程度越强; 当|r|越接近0时,成对样本数据的线性相关程度越弱. 3.一元线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫作最小二乘法. (2)一元线性回归方程:两个具有线性相关关系的变量的一组数据(,),(,),…,(,),其线性回归方程为=x+,则=,=-,其中,是线性回归方程的斜率,是在y轴上的截距,=,=,(,)称为样本点的中心. (3)利用决定系数刻画回归效果:=1-,越大,即模型的拟合效果越好,越小,即模型的拟合效果越差. (4)残差:观测值减去预测值称为残差. 4.独立性检验 (1)独立性检验的概念 利用2的取值推断分类变量X和Y是否独立的方法称为2独立性检验,读作“卡方独立性检验”,简称独立性检验. (2)独立性检验的计算公式 2=(其中n=a+b+c+d). (3)独立性检验 基于小概率值α的检验规则是:当2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α; 当2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立. (4)2独立性检验中常用的小概率值和相应的临界值 α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 【必记结论】 (1)经验回归直线过点. (2)根据经验回归方程计算的y值,仅是一个预报值,不是真实发生的值. (3)根据2的值可以判断两个分类变量有关的可信程度,若2越大,则两分类变量有关的把握越大. 【基点诊断】 1.判断下列说法正误(在括号内打“√”或“×”) (1)相关关系是一种非确定性关系.(   ) (2)线性回归直线y=bx+a至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点.(   ) (3)相关系数越大,样本数据的线性相关程度越强.(   ) (4)若分类变量X,Y关系越密切,则由观测数据计算得到的2的观测值越小.(   ) 答案:(1)√ (2)× (3)× (4)× 2.两个变量的相关关系有①正相关,②负相关,③不相关.下列散点图从左到右分别反映的变量间的相关关系是(   ) A.①②③ B.②③① C.②①③ D.①③② 解析:选D.第一个散点图中的点是从左下角分布到右上角区域,正相关;第三个散点图中的点是从左上角分布到右下角区域,负相关;第二个散点图中的点的分布没有什么规律,不相关. 3.对于变量Y和变量x的成对样本观测数据,用一元线性回归模型得到经验回归模型y=bx+a,对应的残差如下图所示,模型误差(   ) A.满足一元线性回归模型的所有假设 B.不满足一元线性回归模型的E(e)=0的假设 C.不满足一元线性回归模型的D(e)=σ2假设 D.不满足一元线性回归模型的E(e)=0和D(e)=σ2的假设 解析:选C.用一元线性回归模型得到经验回归模型y=bx+a,根据对应的残差图,残差的均值E(e)=0可能成立,但明显残差的x轴上方的数据更分散,D(e)=σ2不满足一元线性回归模型,正确的只有C. 4.随着国家三胎政策的全面放开,为了调查一线城市和非一线城市的三胎生育意愿,某机构用简单随机抽样的方法从不同地区调查了100位育龄妇女,结果如下表. 三胎生育意愿 城市级别 合计 非一线 一线 愿生 45 20 65 不愿生 13 22 35 合计 58 42 100 由2=,得2=≈9.616. 参照下表: α 0.1 0.05 0.01 0.001 xα 2.706 3.841 6.635 10.828 根据小概率值α=0.01的独立性检验,可以得到的结论是________________. 解析:因为2≈9.616>6.635,所以有99%以上的把握认为“生育意愿与城市级别有关”. 答案:生育意愿与城市级别有关 5.某地区医院的医务人员统计了该院近五天的棉签使用情况,具体数据如表所示: t(单位:天) 第1天 第2天 第3天 第4天 第5天 y(单位:袋) 15 24 36 44 56 根据以上数据发现y与t呈线性相关,其回归方程为y=10.2t+a,则估计第8天使用的棉签袋数为________. 解析:因为 = =3, = =35, 所以a=35-10.2×3=4.4,所以y=10.2t+4.4. 当t=8时,y=10.2×8+4.4=86. 答案:86 题型一 成对数据的相关性 【例1】 (1)(2024·天津卷)下列图中,相关性系数最大的是(   ) 解析:选A.观察4幅图可知,A图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关, 值相比于其他3图更接近1. (2)(多选)某服装生产商为了解青少年的身高和体重的关系,在15岁的男生中随机抽测了10人的身高和体重,数据如表所示: 编号 1 2 3 4 5 6 7 8 9 10 身高/cm 165 168 170 172 173 174 175 177 179 182 体重/kg 55 89 61 65 67 70 75 75 78 80 由表中数据制作成如图所示的散点图, 由最小二乘法计算得到经验回归直线l1的方程为y=b1x+a1,样本相关系数为r1,决定系数为;经过残差分析确定(168,89)为离群点(对应残差过大),把它去掉后,再用剩下的9对数据计算得到经验回归直线l2的方程为y=b2x+a2,样本相关系数为r2,决定系数为.则以下结论中正确的有(   ) A.a1>a2 B.b1>b2 C. D. 解析:选AC.身高的平均数为×(165+168+170+172+173+174+175+177+179+182)=173.5,因为离群点(168,89)的横坐标168小于平均值173.5,纵坐标89相对过大,所以去掉离群点后经验回归直线的截距变小而斜率变大,所以a1>a2,b1<b2,所以A正确,B错误; 去掉离群点后成对样本数据的线性相关程度更强,拟合效果会更好,所以,所以C正确,D错误. 思维升华 判定两个变量相关性的方法 (1)画散点图:若点的分布从左下角到右上角,则两个变量正相关;若点的分布从左上角到右下角,则两个变量负相关. (2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近1,相关性越强. (3)经验回归方程:当b>0时,正相关;当b<0时,负相关. 【对点练习】 1.(多选)对两组数据进行统计后得到的散点图如图,关于其线性相关系数的结论正确的是(   ) A.r1<0 B.r2>1 C.r1+r2>0 D.|r1|>|r2| 解析:选AC.由散点图可知,线性相关系数r1的图象表示y与x成负相关,故-1<r1<0,故A正确; 线性相关系数r2的图象表示y与x正相关,故1>r2>0,故B错误; 因为线性相关系数r2的点较线性相关系数r1的点密集,故|r2|>|r1|,故r1+r2>0,故C正确,D错误. 题型二 回归模型 角度1 一元线性回归模型 【例2】 为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导,根据统计,该田园综合体西红柿亩产量的增加量y(千克)与某种液体肥料每亩使用量x(千克)之间的对应数据如下: x(千克) 2 4 5 6 8 y(千克) 300 400 400 400 500 (1)由上表数据可知,可用经验回归模型拟合y与x的关系,请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合); (2)求y关于x的经验回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克? 附:相关系数r=, 经验回归方程=+x的斜率和截距的最小二乘估计公式分别为=,=-≈3.16. 解:(1)由已知数据可得=5, =400, 所以=(-3)×(-100)+(-1)×0+0×0+1×0+3×100=600, =2, =100, 所以样本相关系数r= =≈0.95>0.75. 所以可用经验回归模型拟合y与x的关系. (2)b==30, a=400-5×30=250, 所以经验回归方程为y=30x+250. 当x=15时,y=30×15+250=700(千克), 即当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为700千克. 思维升华 线性回归分析问题的类型及解题方法 (1)求线性回归方程 ①利用公式,求出回归系数b,a; ②待定系数法:利用回归直线过样本点的中心求系数. (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值. (3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数b. 角度2 非线性回归模型 【例3】 某乡村合作社借助互联网直播平台进行农产品销售,众多网红主播参与到直播当中,在众多网红直播中,统计了10名网红直播的观看人次xi和农产品销售量yi(i=1,2,3,…,10)的数据,得到如图所示的散点图. (1)利用散点图判断,y=a+bx和y=c+dln x哪一个更适合作为观看人次x和销售量y的回归方程类型;(只要给出判断即可,不必说明理由) (2)对数据作出如下处理,得到相关统计量的值如下表: 9.4 30.3 2 366 6.6 439.2 66 其中令ωi=ln xi,=. 根据(1)的判断结果及表中数据,求y关于x的回归方程,并预测当观看人次为280万人时的销售量. 参考数据:ln 2≈0.69,ln 7≈1.95. 附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归线=+u的斜率和截距的最小二乘估计分别为:=,=-. 解:(1)由散点图可知,散点分布在一条对数型曲线附近,所以选择回归方程=+ln x更适合. (2)令ω=ln x,则=+ω, 因为=66,2=6.6, 所以==10, 又=30.3,=2,所以=-=30.3-10×2=10.3, 所以y与ω的线性回归方程为y=10.3+10ω, 故y关于x的回归方程为y=10.3+10ln x. 令x=28,代入回归方程可得y=10.3+10ln 28=10.3+10×(2ln 2+ln 7)≈43.6(千件), 所以预测观看人次为280万人时的销售量约为43 600件. 思维升华 非线性回归问题的求解步骤 (1)作出散点图或利用已知散点图; (2)根据散点图选择恰当的拟合函数; (3)作恰当变化,将其化成线性函数,求经验回归方程; (4)在(3)的基础上通过变换,可得非线性经验回归方程. 【对点练习】 2.(2024·广州质检)一企业生产某种产品,通过加大技术创新投入降低了每件产品成本.为了调查年技术创新投入x(单位:千万元)对每件产品成本y(单位:元)的影响,对近10年的年技术创新投入xi和每件产品成本yi(i=1,2,3,…,10)的数据进行分析,得到如下散点图,并计算得:=6.8,=1.6,=350. (1)根据散点图可知,可用函数模型y=+α拟合y与x的关系,试建立y关于x的回归方程; (2)已知该产品的年销售额m(单位:千万元)与每件产品成本y的关系为m=-+100.该企业的年投入成本除了年技术创新投入,还要投入其他成本10千万元,根据(1)的结果回答:当年技术创新投入x为何值时,年利润的预报值最大? (注:年利润=年销售额-年投入成本) 参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线=+u的斜率和截距的最小二乘估计分别为=,=-. 解:(1)令u=,则y关于u的线性回归方程为=+u, 依题意,得==200, =-=70-200×0.3=10, 则y=10+200u, 所以y关于x的回归方程为y=10+. (2)由y=10+,得x=, 年利润M=m-x-10=-(y-20)2+90.8, 当y=20时,年利润M取得最大值, 此时,x==20, 所以当年技术创新投入20千万元时,年利润的预报值最大. 题型三 独立性检验 【例4】 (2023·全国甲卷改编)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g). 试验结果如下: 对照组的小白鼠体重的增加量从小到大排序为 15.2 18.8 20.2 21.3 22.5 23.2 25.8 26.5 27.5 30.1 32.6 34.3 34.8 35.6 35.6 35.8 36.2 37.3 40.5 43.2 试验组的小白鼠体重的增加量从小到大排序为 7.8  9.2  11.4 12.4 13.2 15.5 16.5 18.0 18.8 19.2 19.8 20.2 21.6 22.8 23.6 23.9 25.1 28.2 32.3 36.5 (1)计算试验组的样本平均数; (2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表: <m ≥m 对照组 试验组 ②根据①中的列联表,依据小概率值α=0.050的独立性检验,能否认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异? 附:χ2=, α 0.100 0.050 0.010 xα 2.706 3.841 6.635 解:(1)试验组的样本平均数为×(7.8+9.2+11.4+12.4+13.2+15.5+16.5+18.0+18.8+19.2+19.8+20.2+21.6+22.8+23.6+23.9+25.1+28.2+32.3+36.5)=19.8. (2)①将40个数据按照从小到大的顺序依次排列,得最中间的两个数据即第20个和第21个数据分别为23.2和23.6,则40只小白鼠体重的增加量的中位数m==23.4. 列联表如下: <m ≥m 对照组 6 14 试验组 14 6 ②零假设为H0:小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量没有差异. χ2===6.4>3.841=x0.050,依据小概率值α=0.050的独立性检验,我们推断H0不成立,所以在犯错误的概率不超过0.050的前提下,即认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异. 思维升华 独立性检验的一般步骤 【对点练习】 3.(2024·哈尔滨模拟)由中央电视台综合频道(CCTV-1)和唯众传媒联合制作的《开讲啦》是中国首档青年电视公开课.每期节目由一位知名人士讲述自己的故事,分享他们对于生活和生命的感悟,给予中国青年现实的讨论和心灵的滋养,讨论青年们的人生问题,同时也在讨论青春中国的社会问题,受到了青年观众的喜爱.为了了解观众对节目的喜爱程度,电视台随机调查了A,B两个地区的100名观众,得到如表所示的2×2列联表. 非常喜欢 喜欢 合计 A 30 15 B 合计 已知在被调查的100名观众中随机抽取1名,该观众来自B地区且喜爱程度为“非常喜欢”的概率为0.35. (1)现从100名观众中根据喜爱程度用按比例分配的分层随机抽样的方法抽取20名进行问卷调查,则应抽取喜爱程度为“非常喜欢”的A,B地区的人数各是多少? (2)完成上述表格,依据小概率值α=0.05的独立性检验,能否认为观众的喜爱程度与所在地区有关? 附:χ2=,n=a+b+c+d. α 0.05 0.01 0.001 xα 3.841 6.635 10.828 解:(1)由题意得来自B地区且喜爱程度为“非常喜欢”的观众为0.35×100=35(人), 所以应从A地区抽取30×=6(人),从B地区抽取35×=7(人). (2)完成表格如表: 非常喜欢 喜欢 合计 A 30 15 45 B 35 20 55 合计 65 35 100 零假设为H0:观众的喜爱程度与所在地区无关. χ2=≈0.1<3.841=x0.05, 根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此认为H0成立,即观众的喜爱程度与所在地区无关. 学科网(北京)股份有限公司 $

资源预览图

9.3 统计案例(教师用书Word)-【正禾一本通】2026年新高考数学高三一轮总复习高效讲义(北师大版)
1
9.3 统计案例(教师用书Word)-【正禾一本通】2026年新高考数学高三一轮总复习高效讲义(北师大版)
2
9.3 统计案例(教师用书Word)-【正禾一本通】2026年新高考数学高三一轮总复习高效讲义(北师大版)
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。