专题46 成对数据的统计分析 讲义——2026届上海市高三数学一轮复习

2025-12-30
| 2份
| 60页
| 605人阅读
| 44人下载
普通

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 -
使用场景 高考复习-一轮复习
学年 2026-2027
地区(省份) 上海市
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 2.58 MB
发布时间 2025-12-30
更新时间 2025-12-30
作者 立德树人
品牌系列 -
审核时间 2025-12-30
下载链接 https://m.zxxk.com/soft/55715591.html
价格 3.00储值(1储值=1元)
来源 学科网

摘要:

该高中数学高考复习讲义聚焦成对数据的统计分析专题,涵盖相关关系判断、相关系数计算、线性回归分析(含非线性转化)、独立性检验等核心考点,按“概念辨析-定量刻画-回归建模-分类推断”的逻辑层次构建知识网络。通过考点精析梳理内在联系,题型全解指导解题方法,真题演练强化应用能力,帮助学生系统突破统计分析难点。 资料创新采用“分层题型+素养导向”设计,如在相关系数教学中结合散点图直观观察与公式精确计算,培养学生数学眼光和数据观念。设置从基础判断到综合应用的梯度例题,如非线性回归通过换元转化为线性模型,渗透模型意识,助力学生在有限时间内提升分析和解决统计问题的能力,为教师把握复习重点和节奏提供清晰路径。

内容正文:

2026年高考数学一轮复习考点精析与题型全解(上海专用) 专题46 成对数据的统计分析 知识点一、成对数据间的关系 1、变量之间的相关关系 当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断. 注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系. 2、相关分析:研究成对数据关系的方法称为相关分析。 3、散点图 将样本中的个数据点描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系. (1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关,如图(1)所示; (2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负相关,如图(2)所示. 知识点二、相关系数 1、相关系数的性质:若相应于变量的取值,变量的观测值为,则变量与的相关系数,通常用来衡量与之间的线性关系的强弱,的范围为. (1)当时,表示两个变量正相关;当时,表示两个变量负相关. (2)越接近,表示两个变量的线性相关性越强;越接近,表示两个变量间几乎不存在线性相关关系.当时,所有数据点都在一条直线上. (3)通常当时,认为两个变量具有很强的线性相关关系. 2、相关系数的特点: (1)相关系数描述的是两个变量之间线性关系的方向与强度,是一种定量分析的方法. (2)相关系数的计算公式是关于x、y对称的,画散点图时, 不论以哪个变量作为横轴(纵轴),得到的相关系数都一样. (3)两个变量的相关系数与这两个变量的单位无关.例如,在 计算身高与体重的相关系数时,身高单位不管取“米”还是“厘米”, 结果都一样. (4)与平均数和标准差一样,相关系数不仅会受到数据量多少的影响,也会受到少数异常值的较大影响. (5)要用相关系数来描述两个随机变量的相关性,一般要求 这两个变量满足正态分布. 知识点三、一元线性回归分析 1、离差:通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为离差。离差是随机误差的估计结果,分为正离差和负离差。 2、拟合误差:用离差的平方和Q=来刻画直线和点之间的拟合程度,Q=称为拟合误差。 3、回归直线方程 设所求的直线方程为,回归方程的截距和斜率是用最小二乘法计算出来的. 称为样本点的中心,回归直线过样本点的中心. 把称为回归方程,对应的直线称为回归直线,x称为自变量或解释变量;Y称为因变量或响应变量,模型的参数a和b称为回归系数,a称为截距参数,b称为斜率参数; 4、求经验回归方程的四个步骤 第一步:列表表示xi,yi,x,xiyi. 第二步:计算,,, 第三步:代入公式计算,的值. 第四步:写出经验回归方程. 5、回归分析。依据具有相关关系的成对数据求回归方程的统计方法叫回归分析.回归分析的一般步骤为画散点图→求回归直线方程→用回归直线方程进行预报. 6、非线性回归 解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程. 求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误. 建立非线性回归模型的基本步骤: (1)确定研究对象,明确哪个是解释变量,哪个是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系); (3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等); (4)通过换元,将非线性回归方程模型转化为线性回归方程模型; (5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程; (6)消去新元,得到非线性回归方程; (7)得出结果后分析离差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等. 知识点四、独立性检验 1、分类变量和列联表 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表:定义:列出的两个分类变量的频数表称为列联表. 一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为 总计 总计 从列表中,依据与的值可直观得出结论:两个变量是否有关系. 2、等高条形图 (1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表数据的频率特征. (2)观察等高条形图发现与相差很大,就判断两个分类变量之间有关系. 3、独立性检验 (1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. (2)公式:,其中为样本容量. (3)独立性检验的具体步骤如下: ①计算随机变量的观测值,查下表确定临界值: 0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 ②如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”. (2)两个分类变量和是否有关系的判断标准: 统计学研究表明: 当时,认为与无关; 当时,有的把握说与有关; 当时,有的把握说与有关; 当时,有的把握说与有关. 考点一 成对数据的相关分析 题型01:成对数据间的关系判断 1.(2025上海高三阶段练习)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是(   ) A. B. C. D. 【答案】B 【难度】0.94 【知识点】判断正、负相关、相关系数的意义及辨析 【分析】根据散点图和相关系数的概念和性质辨析即可. 【详解】由散点图可知,相关系数所在散点图呈负相关,所在散点图呈正相关,所以都为正数,都为负数. 所在散点图近似一条直线上,线性相关性比较强,相关系数的绝对值越接近, 而所在散点图比较分散,线性相关性比较弱点,相关系数的绝对值越远离. 综上所得:.     故答案为:B. 2.(2025上海高三阶段练习)观察下列散点图的分布规律和特点,其中两个变量存在相关关系的有______ (1). (2). (3). (4). 【答案】(1) (2) (3) 【知识点】相关系数的意义及辨析 【分析】由相关关系对应的图形是散点图,能反映两个变量的变化规律才具有相关关系直接可以判断. 【详解】相关关系对应的图形是散点图,(1) (2) (3)都能反映两个变量的变化规律,它们都具有相关关系; (4)中的点散乱地分布在坐标平面内,不能反映两个变量的变化规律,不具有相关关系. 故填:(1) (2) (3) 3.(23-24高三下·上海浦东新·期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是(    ) A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关 B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变 C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大 D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小 【答案】D 【分析】根据相关系数的概念逐一判断. 【详解】对于A:去掉图中右下方的点后,根据图象,两个变量还是负相关,A错误; 对于BCD:去掉图中右下方的点后,相对来说数据会集中,相关程度会更高, 但因为是负相关,相关系数会更接近线性相关系数会变小,故D正确,BC错误. 故选:D. 4.(2025上海高三阶段练习)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表: 生产线条数 1 2 3 4 5 产量 21 39 64 87 104 则下列说法正确的是(    ) A.与负相关 B.与正相关 C.与不相关 D.与成正比例关系 【答案】B 【知识点】判断正、负相关 【分析】由正、负相关的概念即可判断. 【详解】由题中数据可知,y随x的增大而增大,且不成比例关系,故y与x正相关. 故选:B 5.(23-24高二下上海普陀期中)已知变量x与y的回归直线方程为,变量y与z负相关,则(    ) A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z正相关 D.x与y正相关,x与z负相关 【答案】D 【知识点】判断正、负相关 【分析】根据已知条件,结合回归方程可判断x与y正相关,再由变量y与z负相关,即可判断x与z负相关. 【详解】根据回归方程可知变量x与y正相关,又变量y与z负相关, 由正相关、负相关的定义可知,x与z负相关. 故选:D 题型02:判断线性相关的强弱 6.(2025上海高三阶段练习)给定与的一组成对数据,求得相关系数,则(    ) A.与不相关 B.与正相关 C.与负相关 D.以上都不对 【答案】C 【知识点】判断正、负相关 【分析】由相关系数的概念判断即可. 【详解】因为,所以与负相关. 故选:C. 7.(2025·上海黄浦·二模)如果两种证券在一段时间内收益数据的相关系数为0.8,那么表明(    ) A.两种证券的收益有反向变动的倾向 B.两种证券的收益有同向变动的倾向 C.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的 D.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌 【答案】B 【分析】根据正相关的定义可得出结论. 【详解】因为两种证券在一段时间内收益数据的相关系数为,所以两种证券是正相关, 那么表明两种证券的收益有同向变动的倾向,B正确,ACD错误. 故选:B. 8.(2025·上海徐汇·二模)在研究线性回归模型时,若样本数据所对应的点都在直线上,则两组数据和的线性相关系数为(    ) A. B.1 C. D.2 【答案】A 【分析】根据回归模型性质判断即可. 【详解】若样本数据所对应的点都在直线上, 则两组数据和的线性相关系数为. 故选:A. 9.(2025上海徐汇高三阶段练习)已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( ) A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强 C.离差平方和变大 D.样本相关系数r变大 【答案】B 【分析】根据已知条件,结合变量间的相关关系,结合图象分析判断即可. 【详解】由散点图可知,去掉点后,与的线性相关加强,且为负相关, 所以B正确,A错误; 由于与的线性相关加强,所以离差平方和变小,所以C错误, 由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大, 而相关系数为负的,所以样本相关系数r变小,所以D错误. 故选:B. 题型03:相关系数的计算 10.(2025·上海奉贤·二模)通过随机抽样,获得某种商品消费者年需求量与该商品每千克价格之间的一组数据调查,如下表所示: 价格(百元) 4 4 4.6 5 5.2 5.6 6 6.6 7 10 需求量(千克) 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2 1 那么线性相关系数 .(精确到)线性相关系数公式 【答案】 【分析】利用相关系数公式计算即可. 【详解】由题意可得, , 所以 , , 所以. 故答案为:. 11(2025大同中学高三阶段练习)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表: 天数x 1 2 3 4 5 6 7 一次最多答对题数y 12 15 16 18 21 24 27 参考数据:,,,,, 相关系数 由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相关系数 (结果保留两位小数) 【答案】 正 0.99 【分析】根据正相关和负相关的定义即可得出结论;根据相关系数公式求相关系数即可. 【详解】由表中数据得随的增大而增大, 所以该老师每天一次最多答对题数y与天数x之间是正相关, . 故答案为:正;. 12.(2025上海师大附中高三阶段练习)某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表: 年份 2017 2018 2019 2020 2021 2022 年份编号 1 2 3 4 5 6 接待人数万人 4.5 5.6 6.1 6.4 6.8 7.2 则接待人数与年份的相关系数约为_______(参考数据:) 【分析】根据已知数据分别计算各个量得出的值即可. 【详解】由题得, 所以, 故接待人数与年份的相关系数约为0.97. 13.(2025上海七宝中学高三阶段练习)一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为______(相关系数:) 【分析】运用相关系数公式进行求解即可. 【详解】因为,,所以, , 考点二 一元线性回归分析 题型04:回归分析的相关概念 14.(2025上海松江高三三模)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的离差为____ 【知识点】离差的计算、计算样本的中心点、根据回归方程进行数据估计 【分析】计算增加样本点后的新的样本中心点,代入经验回归方程可求得;根据经验回归方程可求得,由离差定义可得结果. 【详解】,增加两个样本点后的平均数为; ,,增加两个样本点后的平均数为, ,解得:,新的经验回归方程为:, 则当时,,样本的离差为. 15.(23-24高二下·华师大二附中期末)某市旅游局对全市各旅游景区的环境进行综合治理,投入不同数额的经费(千万元),得到各旅游景区收益的增加值(万元),对应数据如下表所示: 投人的治理经费(单位:千万元) 1 2 3 4 5 6 7 收益的增加值(单位:万元) 2 3 2 5 7 7 9 若与的回归直线方程为,则相应于点的离差是_______ 【知识点】离差的计算、根据回归方程进行数据估计、根据样本中心点求参数 【分析】先算出,代入回归直线方程为,可得,进而得到回归直线方程,当时,求出,算出离差即可. 【详解】, 所以, 当时,,因此离差为. 16..某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表,已知,则时,离差为 . 广告支出费用/万元 1 3 4 6 11 销售量万件 1.9 3.2 4.4 6.3 12.7 【答案】2.02 【知识点】离差的计算、根据样本中心点求参数 【分析】先求出样本点的中心点,然后代入回归方程求出,从而求出当时,解得,从而可求解. 【详解】由题意,, 而样本点的中心点在经验回归直线上, 代入得,解得. 所以,当时,解得, 所以离差为. 故答案为:. 17.(2025·上海浦东新·二模)研究变量,得到一组成对数据,先进行一次线性回归分析,接着增加一个数据,其中,,再重新进行一次线性回归分析,则下列说法正确的是(    ) A.变量与变量的相关性变强 B.相关系数的绝对值变小 C.线性回归方程不变 D.拟合误差变大 【答案】C 【分析】设变量,的平均数分别为,,分析可知,.对于AB:根据相关系数的计算公式和性质分析判断;对于CD:根据回归方程和拟合误差的性质分析判断. 【详解】设变量,的平均数分别为,, 则,,即,, 可知新数据的样本中心点不变,仍为, 对于AB:可得, 同理可得, 则相关系数, 可知相关系数的值不变,变量与变量的相关性不变,故AB错误; 对于C:因为,且线性回归方程过样本中心点, 即均不变,所以线性回归方程不变,故C正确; 因为即为样本中心点,即, 可知离差平方和不变, 所以拟合误差不变,故D错误; 故选:C. 18.(2025·上海长宁·二模)某书店为了分析书籍销量与宣传投入之间的关系,对宣传投入x(千元)和书籍销量y(百本)的情况进行了调研,并统计得到表中几组对应数据,同时用最小二乘法得到y关于x的线性回归方程为,则下列说法不正确的是(   ) x 3 4 5 6 y 5 6.2 7.4 m A.变量x、y之间呈正相关 B.预测当宣传投入2千元时,书籍销量约为400本 C. D.拟合误差 【答案】C 【分析】根据线性回归方程即可判断;将代入线性回归方程即可判断;由在线性回归方程上,即可求解;根据拟合误差计算公式求解即可. 【详解】因为线性回归方程为,, 所以变量x、y之间呈正相关,故正确; 当时,(百本),所以书籍销量约为400本,故正确; 由表中数据可得,, 所以,解得,故错误; 当时,,, 当时,,, 当时,,, 当时,,, 所以,故正确. 故选:. 题型05:线性回归分析 19.(2025上海高三阶段练习)已知变量关于变量的回归方程为,其一组数据如下表所示: 1 2 3 4 5 若,则的值大约为_____ 【知识点】非线性回归、线性回归 【分析】令,把转化为的线性回归方程,再用线性回归的方法处理即可 【详解】由,令,则,由题意,,,所以,解得,所以,所以,解得. 20.(2025·上海松江·二模)根据如表所示的样本数据,用最小二乘法求得线性回归方程为,则回归系数的值为 . 6 8 9 10 12 6 5 4 3 2 【答案】/ 【分析】根据线性回归方程过样本中心点进行求解即可. 【详解】首先计算. 因为回归直线过样本中心点,把代入, 可得,解得. 故答案为:. 21.(2024·上海金山·二模)下列说法不正确的是(    ). A.一组数据10,11,11,12,13,14,16,18,20,22的第60百分位数为14 B.若随机变量服从正态分布,且,则 C.若线性相关系数越接近1,则两个变量的线性相关程度越高 D.对具有线性相关关系的变量、,且回归方程为,若样本点的中心为,则实数的值是 【答案】A 【分析】利用百分位数的定义即可判断选项A,利用正态分布的性质即可判断选项B,根据线性相关系数的性质即可判断选项C,利用线性回归方程中的基本量即可判断选项D. 【详解】对A:因为,所以第百分位数为,A错误; 对B:若随机变量服从正态分布,且, 则, 则,B正确; 对C:若线性相关系数越接近,则两个变量的线性相关性越强,C正确; 对于D,样本点的中心为,所以,, 因为满足线性回归方程,所以,所以,D正确. 故选:A 22.(2024·上海徐汇·二模)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表): x 1 2 3 4 5 y 0.5 0.9 1 1.1 1.5 若已求得一元线性回归方程为,则下列选项中正确的是(    ) A. B.当时,y的预测值为2.2 C.样本数据y的第40百分位数为1 D.去掉样本点后,x与y的样本相关系数r不会改变 【答案】D 【分析】由表格数据求出样本点的中心坐标,代入可得的值由此即可判断A,进一步可得回归方程,由此即可验算B选项,由百分位数的概念即可判断C,由相关系数公式即可判断D. 【详解】,所以样本点的中心坐标为, 将它代入得,,解得,故A错误; 对于B,当时,y的预测值为,故B错误; 对于C,样本数据y的第40百分位数为,故C错误; 对于D,由相关系数公式可知,去掉样本点后,x与y的样本相关系数r不会改变,故D正确. 故选:D. 23.(2024·上海普陀·二模)为了提高学生参加体育锻炼的积极性,某校本学期依据学生特点针对性的组建了五个特色运动社团,学校为了了解学生参与运动的情况,对每个特色运动社团的参与人数进行了统计,其中一个特色运动社团开学第1周至第5周参与运动的人数统计数据如表所示. 周次 1 2 3 4 5 参与运动的人数 35 36 40 39 45 若表中数据可用回归方程来预测,则本学期第11周参与该特色运动社团的人数约为 .(精确到整数) 【答案】57 【分析】由已知求出样本点的中心的坐标,代入线性回归方程,再取求解. 【详解】,, 把代入,得. 可得线性回归方程为. 把代入,可得. 故答案为:57. 24.(2025·上海杨浦·二模)植物社团的同学观察一株植物的生长情况,为了解植物高度(单位:厘米)与生长期(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表: 生长期 3 9 11 17 植物高度 2.4 3.4 3.8 5.2 由表中数据可得回归方程中,试预测生长期是30天时,植物高度约为 厘米. 【答案】 【分析】根据表中数据求出线性回归方程,再代入即可. 【详解】由题意可得,, 所以, 所以回归方程为, 所以预测生长期是30天时,植物高度约为厘米. 故答案为:. 25.中华人民共和国体育代表团参加夏季奥运会以来,中国健儿们不断取得好成绩,到今天成长为体育大国,从2000年以来,金牌情况统计如下(不含中国香港、中国台湾): 中国体育代表团夏季奥运会获得金牌数 届数 第27届 第28届 第29届 第30届 第31届 第32届 届数代码 1 2 3 4 5 6 地点 2000年 悉尼 2004年 雅典 2008年 北京 2012年 伦敦 2016年 里约热内卢 2021年 东京 金牌数 28 32 48 38 26 38 根据以上数据,建立关于的线性回归方程,若不考虑其他因素,根据回归方程预测第33届(2024年巴黎奥运会)中国体育代表团金牌总数为—————————— (精确到0.01,金牌数精确到1,参考数据:);参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:. 【知识点】求回归直线方程、根据回归方程进行数据估计 【分析】先求出,然后由回归直线的方程公式求出方程,预测2024年对应代入回归方程即可求解. 【详解】, ,所以, 所以关于的线性回归方程为. 2024年对应,代入回归方程得, 26.(2025上海高三阶段练习)某品牌电脑专卖店的年销售量与该年广告费用有关,如表收集了4组观测数据: (万元) 1 4 5 6 (百台) 30 40 60 50 以广告费用为解释变量,销售量为预报变量对这两个变量进行统计分析. (1)已知这两个变量呈线性相关关系,试建立与之间的回归方程; (2)假如2017年该专卖店广告费用支出计划为10万元,根据你得到的模型,预测这一年的销售量. 参考公式:,. 【答案】(1); (2)75百台. 【知识点】求回归直线方程、根据回归方程进行数据估计 【分析】(1)根据回归直线方程计算公式,计算出回归直线方程. (2)根据回归直线方程进行预测. 【详解】(1)根据题意,计算, , 又,; , , 所求回归直线方程为; (2)由已知得,时,(百台), 可预测该年的销售量为75百台. 27.(24-25高三上·贵州六盘水·阶段练习)六盘水红心猕猴桃因富含维生素C及K、Ca、Mg等多种矿物质和18种氨基酸,被誉为“维C之王”.某果农通过不断学习猕猴桃先进种植技术,2017年至2023年的年利润y与年份代号x的统计数据如下表(已知该果农的年利润与年份代号之间呈线性相关关系). 年份 2017 2018 2019 2020 2021 2022 2023 年份代号x 1 2 3 4 5 6 7 年利润y(单位:千元) 29 33 36 44 48 52 59 (1)求y关于x的线性回归方程,并预测该果农2024年的年利润; (2)当某年利润的实际值大于该年利润的估计值时,该年为甲级利润年,否则为乙级利润年.现从2019年至2023年这5年中随机抽取3年,求恰有1年为甲级利润年的概率. 参考公式:回归方程中的斜率和截距的最小二乘估计公式分别为,,并计算得:,,. 【答案】(1);63千元 (2) 【知识点】求回归直线方程、计算古典概型问题的概率、根据回归方程进行数据估计 【分析】(1)先求出,然后利用公式求出和,得到线性回归方程,再将代入计算预测即可; (2)先求出2019年至2023年的年利润的估计值,得到这5年中甲级利润年的有2年,乙级利润年的有3年,然后利用概率公式求解即可. 【详解】(1)根据表中的数列,计算可得, , 所以,故, 所以关于的线性回归方程为, 当时,(千元), 所以该果农2024年的年利润预测值为63千元. (2)由(1)可知2019年至2023年的年利润的估计值分别为38,43,48,53,58(单位:千元), 其中实际利润大于相应的估计值的有2年, 故这5年中甲级利润年的有2年,乙级利润年的有3年, 所以从2019年至2023年这5年中随机抽取3年,恰有1年为甲级利润年的概率为. 题型06:非线性回归分析 28.台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:令,数据经过初步处理得: 44 4.8 10 40.3 1.612 19.5 8.06 现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数. (1)请从相关系数的角度,分析哪一个模型拟合程度更好? (2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出关于的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少? 【答案】(1)模型②的拟合程度更好 (2),13(百万辆) 【知识点】非线性回归、相关系数的意义及辨析、根据回归方程进行数据估计 【分析】(1)分别求出两种模型的相关系数,再根据相关系数的几何意义即可得出结论; (2)先利用最小二乘法求出关于的回归方程,再令,即可得解. 【详解】(1)设模型①和②的相关系数分别为,, 由题意可得:, , 所以,由相关系数的相关性质可得,模型②的拟合程度更好; (2)因为, 又由,, 得, 所以,即回归方程为. 当时,, 因此当年广告费为6(百万元)时,产品的销售量大概是13(百万辆). 29.小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20家服装店,统计得到了它们的面积x(单位:)和日均客流量y(单位:百人)的数据,并计算得,,,. (1)求y关于x的回归直线方程; (2)已知服装店每天的经济效益,该商场现有的商铺出租,根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺? 附:回归直线的斜率和截距的最小二乘估计分别为:,. 【答案】(1) (2)小李应该租的商铺 【难度】0.65 【知识点】利用给定函数模型解决实际问题、求回归直线方程、线性回归 【分析】(1)由已知条件结合回归直线公式可求出回归直线方程, (2)根据题意得,,构造函数,利用二次函数的性质可求出其最大值,从而可求出Z的最大值 【详解】(1)由已知可得,, , , 所以回归直线方程为. (2)根据题意得,. 设,令,, 则, 当,即时,取最大值, 又因为k,,所以此时Z也取最大值, 因此,小李应该租的商铺. 考点三 列联表和独立性检验 题型07:列联表 30.(2025上海高三阶段练习)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表: 男 女 合计 喜欢 a b 73 不喜欢 c 25 合计 74 则a-b-c等于    .  答案 9 解析 根据题意,可得c=120-73-25=22,a=74-22=52,b=73-52=21, ∴a-b-c=52-21-22=9. 31.(2025·上海徐汇·二模)如下是一个列联表,则 . y1 y2 总计 x1 a 35 45 x2 7 b n 总计 m 73 s 【答案】90 【分析】完善列联表即可求解. 【详解】由表格有, 故答案为:. 32.在学校食堂就餐成为了很多学生的就餐选择.学校为了解学生食堂就餐情况,在校内随机抽取了100名学生,其中男生和女生人数之比为,现将一周内在食堂就餐超过8次的学生认定为“喜欢食堂就餐”,不超过8次的学生认定为“不喜欢食堂就餐”.“喜欢食堂就餐”的人数比“不喜欢食堂就餐”人数多20人,“不喜欢食堂就餐”的男生只有10人. 男生 女生 合计 喜欢食堂就餐 不喜欢食堂就餐 10 合计 100 (1)将上面的列联表补充完整,并依据小概率值的独立性检验,分析学生喜欢食堂就餐是否与性别有关: (2)用频率估计概率,从该校学生中随机抽取10名,记其中“喜欢食堂就餐”的人数为X.事件“”的概率为,求随机变量X的期望和方差. 参考公式:,其中. a 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 【答案】(1)表格见解析,有关 (2)期望6,方差 【知识点】完善列联表、卡方的计算、二项分布的均值、二项分布的方差 【分析】(1)根据题意,补充完善列联表,进行独立性检验即可. (2)根据题意,,利用二项分布的均值方差公式求解. 【详解】(1)列联表见图, 男生 女生 合计 喜欢食堂就餐 40 20 60 不喜欢食堂就餐 10 30 40 合计 50 50 100 零假设:假设食堂就餐与性别无关, 由列联表可得, 根据小概率的独立性检验推断不成立, 即可以得到学生喜欢食堂就餐与性别有关,此推断犯错误的概率不超过. (2)由题意可知,抽取的10名学生,喜欢饭堂就餐的学生人数服从二项分布, 且喜欢饭堂就餐的频率为,则, 故其期望,方差. 题型08:等高条形图 33.如图是调查某地区男女中学生是否喜欢理科的等高条形图,从如图可以看出该地区的中学生(  ) A.性别与是否喜欢理科无关 B.女生中喜欢理科的比为80% C.男生比女生喜欢理科的可能性大 D.男生中喜欢理科的比例为80% 【解题思路】根据等高条形图,比较分析数据即可得出结论. 【解答过程】解:从图中可以看出,男生喜欢理科的比例为60%,而女生比例为仅为20%, 这两个比例差别较大,说明性别与是否喜欢理科是有关系的, 男生比女生喜欢理科的可能性更大一些. 故选:C. 34.市将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是(    ) A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数 B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数 C.样本中选择物理学科的人数较多 D.样本中男生人数少于女生人数 【答案】C 【解析】根据等高条形图图1可知样本中选择物理学科的人数较多,故C正确; 根据等高条形图图2可知样本中男生人数多于女生人数,故D错误; 样本中选择物理学科的人数多于选择历史意愿的人数,而选择物理意愿的男生比例高,选择历史意愿的女生比例低, 所以样本中选择物理意愿的男生人数多于选择历史意愿的女生人数,故A错误; 样本中女生选择历史意愿的人数不一定多于男生选择历史意愿的人数,故B错误. 故选:C. 题型09:独立性检验 35.(2024·上海金山·二模)为了考察某种药物预防疾病的效果,进行动物试验,得到如下图所示列联表: 药物 疾病 合计 未患病 患病 服用 50 未服用 50 合计 80 20 100 取显著性水平,若本次考察结果支持“药物对疾病预防有显著效果”,则()的最小值为 . (参考公式:;参考值:) 【答案】 【分析】由题意列出不等式,结合近似计算求出m的取值范围,即可得答案. 【详解】由题意可知, 则, 解得或,而, 故m的最小值为44. 故答案为:44. 36.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人. 参考数据及公式如下: 0.050 0.010 0.001 3.841 6.635 10.828 参考公式:,其中. 【答案】30 【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论. 【详解】设男生人数为,依题意可得列联表如下: 喜欢追星 不喜欢追星 总计 男生 女生 总计 根据小概率值的独立性检验,判断中学生追星与性别有关, 则, 由,解得, 由题知应为6的整数倍, 根据小概率值的独立性检验,判断中学生追星与性别有关, 则男生至少有30人, 故答案为:30. 37.(2024·上海长宁·二模)收集数据,利用列联表,分析学习成绩好与上课注意力集中是否有关时,提出的零假设为:学习成绩好与上课注意力集中 (填:有关或无关) 【答案】无关 【分析】根据题意,由零假设的定义,即可得到结果. 【详解】零假设等价于两个变量相互独立, 所以此题中的零假设为:学习成绩好与上课注意力集中无关. 故答案为:无关 38.(2025·上海长宁·二模)为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设:患慢性气管炎与吸烟没有关系,并通过计算得到统计量,则可推断 原假设.(填“拒绝”或“接受”,规定显著性水平.) 【答案】拒绝 【分析】在独立性检验中,当计算得到的统计量大于临界值时,就拒绝原假设,即可求解. 【详解】已知显著性水平,,即临界值为, 因为,所以可推断拒绝原假设. 故答案为:拒绝. 题型10:独立性检验与概率综合 39.(2025·上海金山·二模)为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下: 数学成绩总评优秀人数 数学成绩总评非优秀人数 合计 每天都整理数学错题人数 14 不是每天都整理数学错题人数 15 20 合计 40 (1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率; (2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”? 附:; 0.10 0.01 0.001 2.706 6.635 10.828 (3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布和期望. 【答案】(1)列联表见解析,0.35; (2)有; (3)分布列见解析,期望为. 【分析】(1)完善列联表,求出经验概率. (2)求出的观测值,与临界值比对得解. (3)求出的可能值及对应概率,列出分布列并求出期望. 【详解】(1)完善列联表,如下: 数学成绩总评优秀人数 数学成绩总评非优秀人数 合计 每天都整理数学错题人数 14 6 20 不是每天都整理数学错题人数 5 15 20 合计 19 21 40 每天都整理数学错题且数学成绩总评优秀的经验概率为. (2)由(1)得, 所以有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”. (3)不是每天都整理数学错题的学生有20人,其中数学成绩总评优秀人数为5, 的所有可能值为0,1,2,3, , , 所以的分布列为: 0 1 2 3 期望. 40.(2024·上海徐汇·二模)为了解中草药甲对某疾病的预防效果,研究人员随机调查了100名人员,调查数据如表.(单位:个) 未患病者 患病者 合计 未服用 中草药甲 服用 中草药甲 合计 (1)若规定显著性水平,试分析中草药甲对预防此疾病是否有效; (2)已知中草药乙对该疾病的治疗有效率数据如下:对未服用过中草药甲的患者治疗有效率为,对服用过中草药甲的患者治疗有效率为.若用频率估计概率,现从患此疾病的人员中随机选取2人(分两次选取,每次1人,两次选取的结果独立)使用中草药乙进行治疗,记治疗有效的人数为,求的分布和数学期望. 附:,. 0.100 0.050 0.010 0.001 2.706 3.841 6.635 10.828 【答案】(1)认为中草药甲对预防此疾病有效果 (2)分布列见解析,期望为 【分析】(1)计算出卡方,即可判断; (2)记表示服用中草药乙后治疗有效,表示未服用过中草药甲,表示服用过中草药甲,利用全概率公式求出,依题意可得,根据二项分布的概率公式求出所对应的概率,即可得到分布列与数学期望. 【详解】(1)提出原假设:中草药甲对预防此疾病无效,确定显著性水平, 计算,而, 的值超过了所确定的界限,从而否定原假设,即认为中草药甲对预防此疾病有效果. (2)记表示服用中草药乙后治疗有效,表示未服用过中草药甲,表示服用过中草药甲, 由题意可得,,且,, 则, 即中草药乙的治疗有效率,则, 所以, , , 所以随机变量的分布为: 0 1 2 所以随机变量的数学期望. 41.(2024·上海奉贤·二模)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次空气质量等级    1(优) 3 18 25 2(良) 6 14 3(轻度污染) 5 5 6 4(中度污染) 6 3 0 (1)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (2)若某天的空气质量等级为或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,请根据表中的数据判断:一天中到该公园锻炼的人次是否与该市当天的空气质量有关?(规定显著性水平) 人次≤400 人次>400 总计 空气质量好 空气质量不好 总计 附:,. 【答案】(1)350 (2)列联表见解析,一天中到该公园锻炼的人次与该市当天的空气质量有关 【分析】(1)根据加权平均数公式计算即得; (2)根据表格信息完成列联表,计算出的值,将其与小概率对应的比较即得结论. 【详解】(1)由题知,一天中到该公园锻炼的平均人次约为:,即一天中到该公园锻炼的平均人次的估计值为. (2)根据所给数据,计算出,则完成列联表为: 人次≤400 人次>400 总计 空气质量好 36 39 75 空气质量不好 19 6 25 总计 55 45 100 假设一天中到该公园锻炼的人次与该市当天的空气质量无关.                   ,                                         由可得,原假设不成立, 即一天中到该公园锻炼的人次与该市当天的空气质量有关. 42.(2024·上海崇明·二模)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示. 不吸烟者 吸烟者 总计 不患慢性气管炎者 120 160 280 患慢性气管炎者 15 45 60 总 计 135 205 340 (1)是否有95%的把握认为患慢性气管炎与吸烟有关? (2)常用表示在事件A发生的条件下事件B发生的优势,在统计中称为似然比.现从340人中任选一人,A表示“选到的人是吸烟者”,B表示“选到的人患慢性气管炎者”请利用样本数据,估计的值; (3)现从不患慢性气管炎者的样本中,按分层抽样的方法选出7人,从这7人里再随机选取3人,求这3人中,不吸烟者的人数X的数学期望. 附:,. 【答案】(1)有95%的把握认为患慢性气管炎与吸烟有关 (2) (3) 【分析】(1)根据的列联表中的数据,求得的值,结合附表,即可得到结论; (2)根据表格中的数据,结合条件概率的计算公式,即可求解; (2)根据分层抽样,得到不吸烟者3人,吸烟者4人, 结合题意的可能值为0,1,2,3,求得相应的概率,列出分布列,利用期望的公式求得数学期望. 【详解】(1)假设:患慢性气管炎与吸烟无关, 根据的列联表中的数据,可得,从而否定原假设, 所以有95%的把握认为患慢性气管炎与吸烟有关. (2)根据表格中的数据,可得: . (3)根题意,按分层抽样,得到不吸烟者人,吸烟者人, 这7人里再随机选取3人,可得随机变量的可能值为0,1,2,3, 则, , 则随机变量的分布列为: 所以,随机变量的数学期望为. 43..(2024·上海嘉定·二模)据文化和旅游部发布的数据显示,2023年国内出游人次达48.91亿次,总花费4.91万亿元.人们选择的出游方式不尽相同,有自由行,也有跟团游.为了了解年龄因素是否影响出游方式的选择,我们按年龄将成年人群分为青壮年组(大于等于14岁,小于40岁)和中老年组(大于等于40岁).现在S市随机抽取170名成年市民进行调查,得到如下表的数据: 青壮年 中老年 合计 自由行 60 40 跟团游 20 50 合计 (1)请补充列联表,并判断能否有的把握认为年龄与出游方式的选择有关; (2)用分层抽样的方式从跟团游中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望. 0.10 0.05 0.025 2.706 3.841 5.024 【答案】(1)答案见解析,能; (2)分布列见解析, 【分析】(1)由卡方公式计算再比较即可; (2)先用分层抽样确定青壮年和中老年人数,再用古典概率计算出相应的概率,最后利用数学期望公式求出期望即可. 【详解】(1)补充列联表如下: 青壮年 中老年 合计 自由行 60 40 100 跟团游 20 50 70 合计 80 90 170 , 所以能有的把握认为年龄与出游方式的选择有关. (2)用分层抽样的方式从跟团游中抽取14个人,所以青壮年有人,中老年有人, 随机变量的可能取值有, , , , , 分布列为: 1 3 5 7 数学期望. 1.(2024·上海卷)已知沿海地区气温和海水表层温度相关,且样本相关系数为正数,对此描述正确的是(  ) A.沿海地区气温高,海水表层温度就高 B.沿海地区气温高,海水表层温度就低 C.随着沿海地区气温由低到高,海水表层温度呈上升趋势 D.随着沿海地区气温由低到高,海水表层温度呈下降趋势 答案 C 解析 因为沿海地区气温和海水表层温度相关,且样本相关系数为正数, 所以随着沿海地区气温由低到高,海水表层温度呈上升趋势,故选C. 2. (2024·天津卷)下列图中,线性相关系数最大的是(  ) 答案 A 解析 选项A中的散点有明显的从左下角到右上角沿直线分布的趋势,且散点集中在一条直线的附近,故选项A中的线性相关系数最大,故选A. 3.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示: 时间范围学业成绩 优秀 5 44 42 3 1 不优秀 134 147 137 40 27 (1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少? (2)估计该地区初中学生日均体育锻炼的时长(精确到0.1) (3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关? (附:其中,.) 【答案】(1) (2) (3)有 【知识点】用频率估计概率、独立性检验解决实际问题、卡方的计算、由频率分布直方图估计平均数 【分析】(1)求出相关占比,乘以总人数即可; (2)根据平均数的计算公式即可得到答案; (3)作出列联表,再提出零假设,计算卡方值和临界值比较大小即可得到结论. 【详解】(1)由表可知锻炼时长不少于1小时的人数为占比, 则估计该地区29000名学生中体育锻炼时长不少于1小时的人数为. (2)估计该地区初中生的日均体育锻炼时长约为 . 则估计该地区初中学生日均体育锻炼的时长为0.9小时. (3)由题列联表如下: 其他 合计 优秀 45 50 95 不优秀 177 308 485 合计 222 358 580 提出零假设:该地区成绩优秀与日均锻炼时长不少于1小时但少于2小时无关. 其中. . 则零假设不成立, 即有的把握认为学业成绩优秀与日均锻炼时长不小于1小时且小于2小时有关. 4.(2023·全国·高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下: 对照组的小白鼠体重的增加量从小到大排序为 15.2  18.8  20.2  21.3  22.5  23.2  25.8  26.5  27.5  30.1 32.6  34.3  34.8  35.6  35.6  35.8  36.2  37.3  40.5  43.2 试验组的小白鼠体重的增加量从小到大排序为 7.8  9.2  11.4  12.4  13.2  15.5  16.5  18.0  18.8  19.2 19.8  20.2  21.6  22.8  23.6  23.9  25.1  28.2  32.3  36.5 (1)计算试验组的样本平均数; (2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表 对照组 试验组 (ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异? 附:, 0.100 0.050 0.010 2.706 3.841 6.635 【答案】(1) (2)(i);列联表见解析,(ii)能 【知识点】计算几个数的平均数、完善列联表、卡方的计算 【分析】(1)直接根据均值定义求解; (2)(i)根据中位数的定义即可求得,从而求得列联表; (ii)利用独立性检验的卡方计算进行检验,即可得解. 【详解】(1)试验组样本平均数为: (2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数, 由原数据可得第11位数据为,后续依次为, 故第20位为,第21位数据为, 所以, 故列联表为: 合计 对照组 6 14 20 试验组 14 6 20 合计 20 20 40 (ii)由(i)可得,, 所以能有的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异. 1 学科网(北京)股份有限公司 $ 2026年高考数学一轮复习考点精析与题型全解(上海专用) 专题46 成对数据的统计分析 知识点一、成对数据间的关系 1、变量之间的相关关系 当自变量取值一定时,因变量的取值带有一定的随机性,则这两个变量之间的关系叫相关关系.由于相关关系的不确定性,在寻找变量之间相关关系的过程中,统计发挥着非常重要的作用.我们可以通过收集大量的数据,在对数据进行统计分析的基础上,发现其中的规律,对它们的关系作出判断. 注意:相关关系与函数关系是不同的,相关关系是一种非确定的关系,函数关系是一种确定的关系,而且函数关系是一种因果关系,但相关关系不一定是因果关系,也可能是伴随关系. 2、相关分析:研究成对数据关系的方法称为相关分析。 3、散点图 将样本中的个数据点描在平面直角坐标系中,所得图形叫做散点图.根据散点图中点的分布可以直观地判断两个变量之间的关系. (1)如果散点图中的点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关,如图(1)所示; (2)如果散点图中的点散布在从左上角到右下角的区域内,对于两个变量的这种相关关系,我们将它称为负相关,如图(2)所示. 知识点二、相关系数 1、相关系数的性质:若相应于变量的取值,变量的观测值为,则变量与的相关系数,通常用来衡量与之间的线性关系的强弱,的范围为. (1)当时,表示两个变量正相关;当时,表示两个变量负相关. (2)越接近,表示两个变量的线性相关性越强;越接近,表示两个变量间几乎不存在线性相关关系.当时,所有数据点都在一条直线上. (3)通常当时,认为两个变量具有很强的线性相关关系. 2、相关系数的特点: (1)相关系数描述的是两个变量之间线性关系的方向与强度,是一种定量分析的方法. (2)相关系数的计算公式是关于x、y对称的,画散点图时, 不论以哪个变量作为横轴(纵轴),得到的相关系数都一样. (3)两个变量的相关系数与这两个变量的单位无关.例如,在 计算身高与体重的相关系数时,身高单位不管取“米”还是“厘米”, 结果都一样. (4)与平均数和标准差一样,相关系数不仅会受到数据量多少的影响,也会受到少数异常值的较大影响. (5)要用相关系数来描述两个随机变量的相关性,一般要求 这两个变量满足正态分布. 知识点三、一元线性回归分析 1、离差:通过观测得到的数据称为观测值,通过经验回归方程得到的称为预测值,观测值减去预测值称为离差。离差是随机误差的估计结果,分为正离差和负离差。 2、拟合误差:用离差的平方和Q=来刻画直线和点之间的拟合程度,Q=称为拟合误差。 3、回归直线方程 设所求的直线方程为,回归方程的截距和斜率是用最小二乘法计算出来的. 称为样本点的中心,回归直线过样本点的中心. 把称为回归方程,对应的直线称为回归直线,x称为自变量或解释变量;Y称为因变量或响应变量,模型的参数a和b称为回归系数,a称为截距参数,b称为斜率参数; 4、求经验回归方程的四个步骤 第一步:列表表示xi,yi,x,xiyi. 第二步:计算,,, 第三步:代入公式计算,的值. 第四步:写出经验回归方程. 5、回归分析。依据具有相关关系的成对数据求回归方程的统计方法叫回归分析.回归分析的一般步骤为画散点图→求回归直线方程→用回归直线方程进行预报. 6、非线性回归 解答非线性拟合问题,要先根据散点图选择合适的函数类型,设出回归方程,通过换元将陌生的非线性回归方程化归转化为我们熟悉的线性回归方程. 求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,还原后即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误. 建立非线性回归模型的基本步骤: (1)确定研究对象,明确哪个是解释变量,哪个是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(是否存在非线性关系); (3)由经验确定非线性回归方程的类型(如我们观察到数据呈非线性关系,一般选用反比例函数、二次函数、指数函数、对数函数、幂函数模型等); (4)通过换元,将非线性回归方程模型转化为线性回归方程模型; (5)按照公式计算线性回归方程中的参数(如最小二乘法),得到线性回归方程; (6)消去新元,得到非线性回归方程; (7)得出结果后分析离差图是否有异常.若存在异常,则检查数据是否有误,或模型是否合适等. 知识点四、独立性检验 1、分类变量和列联表 (1)分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表:定义:列出的两个分类变量的频数表称为列联表. 一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为 总计 总计 从列表中,依据与的值可直观得出结论:两个变量是否有关系. 2、等高条形图 (1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图表示列联表数据的频率特征. (2)观察等高条形图发现与相差很大,就判断两个分类变量之间有关系. 3、独立性检验 (1)定义:利用独立性假设、随机变量来确定是否有一定把握认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. (2)公式:,其中为样本容量. (3)独立性检验的具体步骤如下: ①计算随机变量的观测值,查下表确定临界值: 0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 ②如果,就推断“与有关系”,这种推断犯错误的概率不超过;否则,就认为在犯错误的概率不超过的前提下不能推断“与有关系”. (2)两个分类变量和是否有关系的判断标准: 统计学研究表明: 当时,认为与无关; 当时,有的把握说与有关; 当时,有的把握说与有关; 当时,有的把握说与有关. 考点一 成对数据的相关分析 题型01:成对数据间的关系判断 1.(2025上海高三阶段练习)对四组数据进行统计,获得如图散点图,关于其相关系数的比较,正确的是(   ) A. B. C. D. 2.(2025上海高三阶段练习)观察下列散点图的分布规律和特点,其中两个变量存在相关关系的有______ (1). (2). (3). (4). 3.(23-24高三下·上海浦东新·期中)通过随机抽样,我们绘制了如图所示的某种商品每千克价格(单位:百元)与该商品消费者年需求量(单位:千克)的散点图.若去掉图中右下方的点后,下列说法正确的是(    ) A.“每千克价格”与“年需求量”这两个变量由负相关变为正相关 B.“每千克价格”与“年需求量”这两个变量的线性相关程度不变 C.“每千克价格”与“年需求量”这两个变量的线性相关系数变大 D.“每千克价格”与“年需求量”这两个变量的线性相关系数变小 4.(2025上海高三阶段练习)为制定某种产品的生产计划,某工厂统计得到生产线条数与该种产品产量的数据如下表: 生产线条数 1 2 3 4 5 产量 21 39 64 87 104 则下列说法正确的是(    ) A.与负相关 B.与正相关 C.与不相关 D.与成正比例关系 5.(23-24高二下上海普陀期中)已知变量x与y的回归直线方程为,变量y与z负相关,则(    ) A.x与y负相关,x与z负相关 B.x与y正相关,x与z正相关 C.x与y负相关,x与z正相关 D.x与y正相关,x与z负相关 题型02:判断线性相关的强弱 6.(2025上海高三阶段练习)给定与的一组成对数据,求得相关系数,则(    ) A.与不相关 B.与正相关 C.与负相关 D.以上都不对 7.(2025·上海黄浦·二模)如果两种证券在一段时间内收益数据的相关系数为0.8,那么表明(    ) A.两种证券的收益有反向变动的倾向 B.两种证券的收益有同向变动的倾向 C.两种证券的收益之间存在完全反向的联动关系,即涨或跌是相反的 D.两种证券的收益之间存在完全同向的联动关系,即同时涨或同时跌 8.(2025·上海徐汇·二模)在研究线性回归模型时,若样本数据所对应的点都在直线上,则两组数据和的线性相关系数为(    ) A. B.1 C. D.2 9.(2025上海徐汇高三阶段练习)已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( ) A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强 C.离差平方和变大 D.样本相关系数r变大 题型03:相关系数的计算 10.(2025·上海奉贤·二模)通过随机抽样,获得某种商品消费者年需求量与该商品每千克价格之间的一组数据调查,如下表所示: 价格(百元) 4 4 4.6 5 5.2 5.6 6 6.6 7 10 需求量(千克) 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2 1 那么线性相关系数 .(精确到)线性相关系数公式 11(2025大同中学高三阶段练习)学习于才干信仰,犹如运动于健康体魄,持之已久、行之愈远愈受益.为实现中华民族伟大复兴,全国各行各业掀起了“学习强国”的高潮.某老师很喜欢“学习强国”中“挑战答题”模块,他记录了自己连续七天每天一次最多答对的题数如下表: 天数x 1 2 3 4 5 6 7 一次最多答对题数y 12 15 16 18 21 24 27 参考数据:,,,,, 相关系数 由表中数据可知该老师每天一次最多答对题数y与天数x之间是 相关(填“正”或“负”),其相关系数 (结果保留两位小数) 12.(2025上海师大附中高三阶段练习)某景区对2017-2022年景区内农家乐接待人数(单位:万人)进行了统计,得到数据如下表: 年份 2017 2018 2019 2020 2021 2022 年份编号 1 2 3 4 5 6 接待人数万人 4.5 5.6 6.1 6.4 6.8 7.2 则接待人数与年份的相关系数约为_______(参考数据:) 13.(2025上海七宝中学高三阶段练习)一唱片公司欲知唱片费用(十万元)与唱片销售量(千张)之间的关系,从其所发行的唱片中随机抽选了10张,得如下的资料:,则与的相关系数的绝对值为______(相关系数:) 考点二 一元线性回归分析 题型04:回归分析的相关概念 14.(2025上海松江高三三模)已知由样本数据组成的一个样本,得到经验回归方程为,且,增加两个样本点和后,得到新样本的经验回归方程为.在新的经验回归方程下,样本的离差为____ 15.(23-24高二下·华师大二附中期末)某市旅游局对全市各旅游景区的环境进行综合治理,投入不同数额的经费(千万元),得到各旅游景区收益的增加值(万元),对应数据如下表所示: 投人的治理经费(单位:千万元) 1 2 3 4 5 6 7 收益的增加值(单位:万元) 2 3 2 5 7 7 9 若与的回归直线方程为,则相应于点的离差是_______ 16..某种产品的广告支出费用(单位:万元)与销售量(单位:万件)之间的对应数据如下表,已知,则时,离差为 . 广告支出费用/万元 1 3 4 6 11 销售量万件 1.9 3.2 4.4 6.3 12.7 17.(2025·上海浦东新·二模)研究变量,得到一组成对数据,先进行一次线性回归分析,接着增加一个数据,其中,,再重新进行一次线性回归分析,则下列说法正确的是(    ) A.变量与变量的相关性变强 B.相关系数的绝对值变小 C.线性回归方程不变 D.拟合误差变大 18.(2025·上海长宁·二模)某书店为了分析书籍销量与宣传投入之间的关系,对宣传投入x(千元)和书籍销量y(百本)的情况进行了调研,并统计得到表中几组对应数据,同时用最小二乘法得到y关于x的线性回归方程为,则下列说法不正确的是(   ) x 3 4 5 6 y 5 6.2 7.4 m A.变量x、y之间呈正相关 B.预测当宣传投入2千元时,书籍销量约为400本 C. D.拟合误差 题型05:线性回归分析 19.(2025上海高三阶段练习)已知变量关于变量的回归方程为,其一组数据如下表所示: 1 2 3 4 5 若,则的值大约为_____ 20.(2025·上海松江·二模)根据如表所示的样本数据,用最小二乘法求得线性回归方程为,则回归系数的值为 . 6 8 9 10 12 6 5 4 3 2 21.(2024·上海金山·二模)下列说法不正确的是(    ). A.一组数据10,11,11,12,13,14,16,18,20,22的第60百分位数为14 B.若随机变量服从正态分布,且,则 C.若线性相关系数越接近1,则两个变量的线性相关程度越高 D.对具有线性相关关系的变量、,且回归方程为,若样本点的中心为,则实数的值是 22.(2024·上海徐汇·二模)为了研究y关于x的线性相关关系,收集了5组样本数据(见下表): x 1 2 3 4 5 y 0.5 0.9 1 1.1 1.5 若已求得一元线性回归方程为,则下列选项中正确的是(    ) A. B.当时,y的预测值为2.2 C.样本数据y的第40百分位数为1 D.去掉样本点后,x与y的样本相关系数r不会改变 23.(2024·上海普陀·二模)为了提高学生参加体育锻炼的积极性,某校本学期依据学生特点针对性的组建了五个特色运动社团,学校为了了解学生参与运动的情况,对每个特色运动社团的参与人数进行了统计,其中一个特色运动社团开学第1周至第5周参与运动的人数统计数据如表所示. 周次 1 2 3 4 5 参与运动的人数 35 36 40 39 45 若表中数据可用回归方程来预测,则本学期第11周参与该特色运动社团的人数约为 .(精确到整数) 24.(2025·上海杨浦·二模)植物社团的同学观察一株植物的生长情况,为了解植物高度(单位:厘米)与生长期(单位:天)之间的关系,随机统计了某4天的植物高度,并制作了如下对照表: 生长期 3 9 11 17 植物高度 2.4 3.4 3.8 5.2 由表中数据可得回归方程中,试预测生长期是30天时,植物高度约为 厘米. 25.中华人民共和国体育代表团参加夏季奥运会以来,中国健儿们不断取得好成绩,到今天成长为体育大国,从2000年以来,金牌情况统计如下(不含中国香港、中国台湾): 中国体育代表团夏季奥运会获得金牌数 届数 第27届 第28届 第29届 第30届 第31届 第32届 届数代码 1 2 3 4 5 6 地点 2000年 悉尼 2004年 雅典 2008年 北京 2012年 伦敦 2016年 里约热内卢 2021年 东京 金牌数 28 32 48 38 26 38 根据以上数据,建立关于的线性回归方程,若不考虑其他因素,根据回归方程预测第33届(2024年巴黎奥运会)中国体育代表团金牌总数为—————————— (精确到0.01,金牌数精确到1,参考数据:);参考公式:回归方程中斜率和截距的最小二乘估计公式分别为:. 26.(2025上海高三阶段练习)某品牌电脑专卖店的年销售量与该年广告费用有关,如表收集了4组观测数据: (万元) 1 4 5 6 (百台) 30 40 60 50 以广告费用为解释变量,销售量为预报变量对这两个变量进行统计分析. (1)已知这两个变量呈线性相关关系,试建立与之间的回归方程; (2)假如2017年该专卖店广告费用支出计划为10万元,根据你得到的模型,预测这一年的销售量. 参考公式:,. 27.(24-25高三上·贵州六盘水·阶段练习)六盘水红心猕猴桃因富含维生素C及K、Ca、Mg等多种矿物质和18种氨基酸,被誉为“维C之王”.某果农通过不断学习猕猴桃先进种植技术,2017年至2023年的年利润y与年份代号x的统计数据如下表(已知该果农的年利润与年份代号之间呈线性相关关系). 年份 2017 2018 2019 2020 2021 2022 2023 年份代号x 1 2 3 4 5 6 7 年利润y(单位:千元) 29 33 36 44 48 52 59 (1)求y关于x的线性回归方程,并预测该果农2024年的年利润; (2)当某年利润的实际值大于该年利润的估计值时,该年为甲级利润年,否则为乙级利润年.现从2019年至2023年这5年中随机抽取3年,求恰有1年为甲级利润年的概率. 参考公式:回归方程中的斜率和截距的最小二乘估计公式分别为,,并计算得:,,. 题型06:非线性回归分析 28.台州是全国三大电动车生产基地之一,拥有完整的产业链和突出的设计优势.某电动车公司为了抢占更多的市场份额,计划加大广告投入、该公司近5年的年广告费(单位:百万元)和年销售量(单位:百万辆)关系如图所示:令,数据经过初步处理得: 44 4.8 10 40.3 1.612 19.5 8.06 现有①和②两种方案作为年销售量y关于年广告费x的回归分析模型,其中a,b,m,n均为常数. (1)请从相关系数的角度,分析哪一个模型拟合程度更好? (2)根据(1)的分析选取拟合程度更好的回归分析模型及表中数据,求出关于的回归方程,并预测年广告费为6(百万元)时,产品的年销售量是多少? 29.小李准备在某商场租一间商铺开服装店,为了解市场行情,在该商场调查了20家服装店,统计得到了它们的面积x(单位:)和日均客流量y(单位:百人)的数据,并计算得,,,. (1)求y关于x的回归直线方程; (2)已知服装店每天的经济效益,该商场现有的商铺出租,根据(1)的结果进行预测,要使单位面积的经济效益Z最高,小李应该租多大面积的商铺? 附:回归直线的斜率和截距的最小二乘估计分别为:,. 考点三 列联表和独立性检验 题型07:列联表 30.(2025上海高三阶段练习)为了解某大学的学生是否喜欢体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表: 男 女 合计 喜欢 a b 73 不喜欢 c 25 合计 74 则a-b-c等于    .  31.(2025·上海徐汇·二模)如下是一个列联表,则 . y1 y2 总计 x1 a 35 45 x2 7 b n 总计 m 73 s 32.在学校食堂就餐成为了很多学生的就餐选择.学校为了解学生食堂就餐情况,在校内随机抽取了100名学生,其中男生和女生人数之比为,现将一周内在食堂就餐超过8次的学生认定为“喜欢食堂就餐”,不超过8次的学生认定为“不喜欢食堂就餐”.“喜欢食堂就餐”的人数比“不喜欢食堂就餐”人数多20人,“不喜欢食堂就餐”的男生只有10人. 男生 女生 合计 喜欢食堂就餐 不喜欢食堂就餐 10 合计 100 (1)将上面的列联表补充完整,并依据小概率值的独立性检验,分析学生喜欢食堂就餐是否与性别有关: (2)用频率估计概率,从该校学生中随机抽取10名,记其中“喜欢食堂就餐”的人数为X.事件“”的概率为,求随机变量X的期望和方差. 参考公式:,其中. a 0.1 0.05 0.01 0.005 0.001 2.706 3.841 6.635 7.879 10.828 题型08:等高条形图 33.如图是调查某地区男女中学生是否喜欢理科的等高条形图,从如图可以看出该地区的中学生(  ) A.性别与是否喜欢理科无关 B.女生中喜欢理科的比为80% C.男生比女生喜欢理科的可能性大 D.男生中喜欢理科的比例为80% 34.市将从2022年秋季入学的高一年级学生开始实行高考综合改革,高考采用“3+1+2”模式,其中“1”为首选科目,即物理与历史二选一.某校为了解学生的首选意愿,对部分高一学生进行了抽样调查,制作出如下两个等高条形图,根据条形图信息,下列结论正确的是(    ) A.样本中选择物理意愿的男生人数少于选择历史意愿的女生人数 B.样本中女生选择历史意愿的人数多于男生选择历史意愿的人数 C.样本中选择物理学科的人数较多 D.样本中男生人数少于女生人数 题型09:独立性检验 35.(2024·上海金山·二模)为了考察某种药物预防疾病的效果,进行动物试验,得到如下图所示列联表: 药物 疾病 合计 未患病 患病 服用 50 未服用 50 合计 80 20 100 取显著性水平,若本次考察结果支持“药物对疾病预防有显著效果”,则()的最小值为 . (参考公式:;参考值:) 36.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有 人. 参考数据及公式如下: 0.050 0.010 0.001 3.841 6.635 10.828 参考公式:,其中. 37.(2024·上海长宁·二模)收集数据,利用列联表,分析学习成绩好与上课注意力集中是否有关时,提出的零假设为:学习成绩好与上课注意力集中 (填:有关或无关) 38.(2025·上海长宁·二模)为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设:患慢性气管炎与吸烟没有关系,并通过计算得到统计量,则可推断 原假设.(填“拒绝”或“接受”,规定显著性水平.) 题型10:独立性检验与概率综合 39.(2025·上海金山·二模)为了研究高三学生每天整理数学错题的情况,某校数学建模兴趣小组的同学在本校高三年级学生中采用随机抽样的方法抽取了40名学生,调查他们平时的数学成绩和整理数学错题的情况,现统计得部分数据如下: 数学成绩总评优秀人数 数学成绩总评非优秀人数 合计 每天都整理数学错题人数 14 不是每天都整理数学错题人数 15 20 合计 40 (1)完成上述样本数据的列联表,并计算:每天都整理数学错题且数学成绩总评优秀的经验概率; (2)是否有的把握认为“数学成绩总评优秀与每天都整理数学错题有关”? 附:; 0.10 0.01 0.001 2.706 6.635 10.828 (3)从不是每天都整理数学错题的学生中随机抽取3名学生做进一步访谈,设恰好抽取到数学成绩总评优秀的人数为,求的分布和期望. 40.(2024·上海徐汇·二模)为了解中草药甲对某疾病的预防效果,研究人员随机调查了100名人员,调查数据如表.(单位:个) 未患病者 患病者 合计 未服用 中草药甲 服用 中草药甲 合计 (1)若规定显著性水平,试分析中草药甲对预防此疾病是否有效; (2)已知中草药乙对该疾病的治疗有效率数据如下:对未服用过中草药甲的患者治疗有效率为,对服用过中草药甲的患者治疗有效率为.若用频率估计概率,现从患此疾病的人员中随机选取2人(分两次选取,每次1人,两次选取的结果独立)使用中草药乙进行治疗,记治疗有效的人数为,求的分布和数学期望. 附:,. 0.100 0.050 0.010 0.001 2.706 3.841 6.635 10.828 41.(2024·上海奉贤·二模)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次空气质量等级    1(优) 3 18 25 2(良) 6 14 3(轻度污染) 5 5 6 4(中度污染) 6 3 0 (1)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (2)若某天的空气质量等级为或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,请根据表中的数据判断:一天中到该公园锻炼的人次是否与该市当天的空气质量有关?(规定显著性水平) 人次≤400 人次>400 总计 空气质量好 空气质量不好 总计 附:,. 42.(2024·上海崇明·二模)某疾病预防中心随机调查了340名50岁以上的公民,患病的关系,调查数据如表所示. 不吸烟者 吸烟者 总计 不患慢性气管炎者 120 160 280 患慢性气管炎者 15 45 60 总 计 135 205 340 (1)是否有95%的把握认为患慢性气管炎与吸烟有关? (2)常用表示在事件A发生的条件下事件B发生的优势,在统计中称为似然比.现从340人中任选一人,A表示“选到的人是吸烟者”,B表示“选到的人患慢性气管炎者”请利用样本数据,估计的值; (3)现从不患慢性气管炎者的样本中,按分层抽样的方法选出7人,从这7人里再随机选取3人,求这3人中,不吸烟者的人数X的数学期望. 附:,. 43..(2024·上海嘉定·二模)据文化和旅游部发布的数据显示,2023年国内出游人次达48.91亿次,总花费4.91万亿元.人们选择的出游方式不尽相同,有自由行,也有跟团游.为了了解年龄因素是否影响出游方式的选择,我们按年龄将成年人群分为青壮年组(大于等于14岁,小于40岁)和中老年组(大于等于40岁).现在S市随机抽取170名成年市民进行调查,得到如下表的数据: 青壮年 中老年 合计 自由行 60 40 跟团游 20 50 合计 (1)请补充列联表,并判断能否有的把握认为年龄与出游方式的选择有关; (2)用分层抽样的方式从跟团游中抽取14个人,再从14个人中随机抽取7个人,用随机变量表示这7个人中中老年与青壮年人数之差的绝对值,求的分布和数学期望. 0.10 0.05 0.025 2.706 3.841 5.024 1.(2024·上海卷)已知沿海地区气温和海水表层温度相关,且样本相关系数为正数,对此描述正确的是(  ) A.沿海地区气温高,海水表层温度就高 B.沿海地区气温高,海水表层温度就低 C.随着沿海地区气温由低到高,海水表层温度呈上升趋势 D.随着沿海地区气温由低到高,海水表层温度呈下降趋势 2. (2024·天津卷)下列图中,线性相关系数最大的是(  ) 3.(2024·上海·高考真题)为了解某地初中学生体育锻炼时长与学业成绩的关系,从该地区29000名学生中抽取580人,得到日均体育锻炼时长与学业成绩的数据如下表所示: 时间范围学业成绩 优秀 5 44 42 3 1 不优秀 134 147 137 40 27 (1)该地区29000名学生中体育锻炼时长不少于1小时人数约为多少? (2)估计该地区初中学生日均体育锻炼的时长(精确到0.1) (3)是否有的把握认为学业成绩优秀与日均体育锻炼时长不小于1小时且小于2小时有关? (附:其中,.) 4.(2023·全国·高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下: 对照组的小白鼠体重的增加量从小到大排序为 15.2  18.8  20.2  21.3  22.5  23.2  25.8  26.5  27.5  30.1 32.6  34.3  34.8  35.6  35.6  35.8  36.2  37.3  40.5  43.2 试验组的小白鼠体重的增加量从小到大排序为 7.8  9.2  11.4  12.4  13.2  15.5  16.5  18.0  18.8  19.2 19.8  20.2  21.6  22.8  23.6  23.9  25.1  28.2  32.3  36.5 (1)计算试验组的样本平均数; (2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表 对照组 试验组 (ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异? 附:, 0.100 0.050 0.010 2.706 3.841 6.635 1 学科网(北京)股份有限公司 $

资源预览图

专题46 成对数据的统计分析 讲义——2026届上海市高三数学一轮复习
1
专题46 成对数据的统计分析 讲义——2026届上海市高三数学一轮复习
2
专题46 成对数据的统计分析 讲义——2026届上海市高三数学一轮复习
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。