9.9 成对数据的统计分析-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版

2025-12-31
| 2份
| 10页
| 65人阅读
| 2人下载
教辅
河北红对勾文化传播有限公司
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 教案-讲义
知识点 统计
使用场景 高考复习-一轮复习
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 2.08 MB
发布时间 2025-12-31
更新时间 2025-12-31
作者 河北红对勾文化传播有限公司
品牌系列 红对勾·高考大一轮复习讲与练全新方案
审核时间 2025-12-31
下载链接 https://m.zxxk.com/soft/55726169.html
价格 2.00储值(1储值=1元)
来源 学科网

内容正文:

由样本方差计算总体方差公式,得总 方差为s2= {10×7+(56 10+20 62)2]+20×[4+(65-62)2]}=23. 聚焦学科素养 题目呈现1ABD2024年第一季度全市 居民人均消费支出为2084十453十 1435+356+791+583+528+163= 6393(元),故A正确;易知居住及食品 烟酒两项的人均消费支出总和为 2084+1435=3519(元),占总人均 消竟支出的3519 ×100%≈55.0%> 6393 50%,故B正确:依题意可得2023年第 一季度城乡居民人均消费支出的差额 为79244388」 1.0441.078≈3520(元),2024年 第一季度城乡居民人均消费支出的差 额为7924-4388=3536(元),由于 3520<3536,故C错误;医疗保健与 教育文化娱乐两项人均消费支出总和 占总人均消费支出的528+791 ×100%≈ 6393 20.6%,故D正确.故选ABD 题目呈现2AB亲子阅读占比71.08%, 为最大,A正确:由于71.08%十 52.66%-1=23.74%>20%,B正 确;题图中各类亲子活动占比的中位数 为 27.77%+40.14% =33.955%, 2 C错误:题图中10类亲子活动占比的 极差为71.08%-13.32%=57.76%, D错误.故选AB. 题目呈现3D①由题图可得这13个月 的PMI的最大值为52.6%,最小值为 47.0%,所以极差为52.6%一47.0% 5.6%,故①正确;②由题图可得2023 年1月到2023年3月的PMI分别为 50.1%,52.6%,51.9%,均大于50%, 故②正确:③从2023年1月到2023年 7月的PMI的值从小到大排列为48.8%, 49.0%,49.2%,49.3%,50.1%,51.9%, 52.6%,因为7×75%=5.25,所以这 7个月的PMI的第75百分位数为第六 个数51.9%,故③正确:④2023年7月 的PMI为49.3%,6月的PMI为 49.0%,所以比上月上升0.3个百分点, 故④正确.所以正确的个数为4.故选D. 题目呈现4C由题图可知,2024年母 亲周末陪伴孩子日均时长超过8小时 的占比为38.7%>3,A说法正确, 2024年父亲周末陪伴孩子日均时长超 过6小时的占比为31.5%+24.2%= 55.7%>2,B说法正确:2024年母亲 周末陪伴孩子日均时长的5个时段占 比的极差为38.7%一2.5%=36.2%, C说法错误;2024年父母周末陪伴孩子 日均时长的10个时段占比的中位数为 21.4%十19.0% =20.2%,D说法正 2 确.故选C. 题目呈现5D2021一2024年该国星级 酒店数量依次为8920,8423,7676, 7337,逐年减少,故A正确:2021—2024 年该国星级酒店营业收入最高为 1907.77亿元,故B正确:2021一2024 年该国星级酒店餐饮收入比重最高的 是2022年,故C正确:2021一2024年该 国星级酒店餐饮收入比重的极差是 41.63%一38.19%=3.44%,故D错 误.故选D. 9.9 成对数据的统计分析 》回顾·必备知识《 知识梳理 1.(1)有关系(2)增加减小 (3)一条直线 2.(2)正相关负相关(3)强 弱 3.(2)预测值 4.(2)是否独立 基础检测 1.(1)/(2)×(3)X 2.y=c·dr(c,d>0) 解析:根据散点图判断,用y=c· d严(c,d>0)的拟合效果更好. 3.97.5 解析:由已知可得X2=6.109 5.024,所以市政府断言市民收入增减 与旅游需求有关的可信度是97.5%. 4.12 解析:设被调查的男性人数为k,依题 意,得2×2列联表如下: 足球 性别 合计 喜爱 不喜爱 5k 男性 k 6 6 女性 2k 4k 2k 3 3 合计 3k 3k 3k 2 2 4k 6 则X”= 3 6 3k 3k k·2k·2 ·2 ,因为本次调查得出“在犯错误的概 2k 率不超过0.005的前提下认为喜爱足 球与性别有关”的结论,于是X≥ 7.879,即2 ≥7.879,解得k≥11.8185, 而k=61,m∈N,因此km=12. 5.BC对于A,样本相关系数r的绝对 值越大,则成对样本数据的线性相关 程度越强,故A错误:对于B,经验回归 直线一定经过点(x,y),故B正确;对 于C,决定系数R的值越接近1,则经 验回归方程拟合效果越好,故C正确; 对于D,残差平方和越小,表示经验回 归方程拟合效果越好,故D错误.故 选BC. 》提升·关键能力《… 例1D第一个散,点图中的,点是从左下 角区域分布到右上角区域,则是正相 关:第三个散点图中的点是从左上角 区域分布到右下角区域,则是负相关; 第二个散点图中的点的分布没有什么 规律,则是不相关,所以应该是 ①③②.故选D. 对点训练1A由题中散,点图可以看 出,题图1和题图3是正相关,样本相 关系数大于0,题图2和题图4是负相 关,样本相关系数小于0,题图1和题图 2的,点相对更加集中,所以线性相关性 更强,所以r1更接近1,r2更接近一1,由 此可得r2<r1<0<r3<r1.故选A 例2(1)C因为沿海地区气温和海水表 层温度相关,且样本相关系数为正数, 故随着沿海地区气温由低到高时,海 水表层温度呈上升趋势,故选C (2)B残差图越宽,说明模型的拟合 效果越差,故A错误;残差平方和越 小,说明模型的拟合效果越好,故B正 确;决定系数R2越小,说明模型的拟合 效果越差,故C错误:样本相关系数” 的绝对值越大,两个变量的线性相关 性越强,故D错误.故选B. 对点训练2(1)DR越大,则回归模型 的拟合效果越好,因为0.56>0.45> 0.23>一0.79,所以拟合效果最好的是 模型丁.故选D. (2)BD由r越接近1,数据的线性 相关关系越强知,A错误,B正确:由残 差平方和越小,则数据的线性回归模 型拟合效果越好知,C错误;由决定系 数越大,则数据的线性回归模型拟合 效果越好知,D正确.故选BD. 例3解:(1)由统计图的数据,可得x 2士3+4十6+8+10+8-5≈7, y=18+22+31+42+50+56+58- 7 222≈39: 7 又由∑(x,-x)(y,-y)=395, ∑x,-=97, 所以6- ≈4,a=y-bx≈39- 4×7=11, 所以y关于x的经验回归方程为y= 4x+11. (2)由统计图中的数据以及(1)中的经 验回归方程,可得统计表如下: x 2 3 4 6 81013 y 13 22 37 42 50 56 58 19 23 27 35 51 63 残差一 6 -5 所以该组数据残差的平方和为(一6)+ (-1)2+42+72+72+52+(-5)2= 201. 对点训练3解:(1)由表中数据可知, x- 5×(1+2+3+4+5)=3,y= 5×(3+7+9+10+11)=8 ∑(x,-x)2=10,∑0y,-y)2= =1 i=1 40,∑(x,-元)(y,-)=19, i=1 则x= ∑(x,-x)(0y,- =1 (y,-y) N=1 19 =0.95>0.75, √10×2√/10 故研发投入与产品收益的相关程度 较强. 参考答案505 22(x,-)=10. =1 x)(y,-y)=19, 19 则6=10=1.9,8=8-1.9×3=23, 故y=1.9x十2.3, 17≈9.3 令1.9r+2.3>20,解得x> 故研发投入至少9.3亿元. 例4解:(1)由散点图可以判断,随平均 温度升高,平均产卵数增长速度变快, 符合指数函数模型的增长, 所以y=ce更适合作为平均产卵数 y关于平均温度x的回归模型, (2)将y=cer两边同时取自然对数, 可得lny=lnc十dx,又之=lny,则 关于x的经验回归方程为之=lnc十dz, 由题中的数据可得∑x,一7江 =1 33.6,∑(x,-x)=∑x-72 7=1 112, x2,-z 所以d= i=1 33.6 ∑x- 112 i=1 0.3,则lnc=-dx=3.6-0.3× 27=-4.5, 所以之关于x的经验回归方程为交 0.3x一4.5,故y关于x的经验回归方 程为y=e-1s 对点训练4解:(1)令之=bi十a,而i= 12=5.5,2=0∑2,=1,28, 10-1 iz4-10i 则b= 2-107 60-10×5.5×1.28 ≈-0.13,= 385-10×5.52 -bi=1.28+0.13×5.5≈2.00, 因此之=2-0.13i,即y=e2-0.13, 所以所求经验回归方程为y=e21」 (2)由(1)知,y=e2-o131<0.08,即2 0.13i<1n0.08,解得i>2-ln0.08≈ 0.13 34.85, 所以i=35,即在新房装修完第35天 开始达到此标准. 第一章 集合、常用逻辑 用语与不等式 训练1集合 1.C由题意得A∩B={0,1}.故选C. 2.C由题意得MUN={x-3< x<4}.故选C 506红对构·讲与练·高三数学· 例5(1)A在判断两个分类变量之间是 否有关联时,需要判断假定关系H。: P(Y=1X=0)=P(Y=1X=1) 是否成立,通常称H。为零假设或原假 设,零假设H。:分类变量X和Y独立 故选A. (2)B独立性检验取决于样本,X2来 确定是否有把握认为“两个分类变量” 有关系,样本不同,所得结果会有差 异,不会犯错误的说法太绝对,A错误; 用X独立性检验推断的每个结论都会 犯随机性错误,B正确;根据普查数据, 我们可以通过相关的比率给出准确回 答,不需要用X2独立性检验,依据小概 率值推断两个分类变量的关联性,所 以X独立性检验的方法不适用于普查 数据,C错误;对于不同的小概率值,结 论可能不相同,D错误.故选B. 对点训练5(1)DX2 n(ad-bc) 《a士b(c十d)(a+c)(6+0,则分 类变量X和Y有关系时,ad与bc差距 会比较大,由 a+b c+d 三 ac+ad-ac-bc ad-bc (a+b)(c+d) (a+b)(c+d) 故。千6与。十a的值相差应该大,即 a c a+b c+d 的大小可以判断X,Y 之间有无关系,故选D. (2)AC对于A,饭前服药的100名患 者中,药效强的有80人,所以频率为 4 ,故A正确;对于B,饭前服药的有 20人药效弱,饭后服药的有70人药效 弱,所以药效弱的有90名患者,饭后服 药的频率为子,故B错误:时于C,D,因 为X”= 200×(80×70-20×30) 100×100×110×90 5000 99 ≈50.505>6.635,故在犯错误 的概率不超过0.01的条件下,可以认 为这种药物饭前和饭后服用的药效有 差异,故C正确,D错误.故选AC. 例6(1)21 解析:由题意得X= n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) 100[(60-m)(40-m)-(m-10)(m+10)]2 50X50X70×30 (2500-100m) -,并令X2= 30×50×35 练习手册 3.D由题意可得,A∩B={x1< x3}.故选D 4.D由题意得B={xlog2x<1}= (0,2),A∩B有2个子集,∴A∩B 中的元素个数为1,1∈A∩B, a任A∩B,即a任B,a≤0或 a≥2,即实数a的取值范围为(一∞, 0]U[2,十o∞).故选D. 基础版 (2500-100m) 3.841,即(2500 30×50×35 100m)2<201652.5,近似解得 -4502500-100m450,即 20.5<m29.5,注意到m≤25 m∈N”,故m的最小值为21. (2)解:①由所给数据,得该市一天的 空气质量等级为1,2,3,4的概率的估 计值如下表: 空气质量等级1 23 4 概率的估计值0.430.270.210.09 ②一天中到该公园锻炼的平均人次的 估计值为10 ×(100×20+300×35+ 500×45)=350. ③根据所给数据,可得2×2列联表如下 项目 人次≤400人次>400 空气质量好 33 37 空气质量不好 22 8 根据列联表得 X”= 100×(33×8-22×37)2 55×45×70X30 5.820>3.841. 故有95%的把握认为一天中到该公园 锻炼的人次与该市当天的空气质量 有关 对点训练6解:(1)试验组样本平均数为 20×(7.8+9.2+11.4+12.4+13.2+ 15.5+16.5+18.0+18.8+19.2+ 19.8+20.2+21.6+22.8+23.6 23.9+25.1+28.2+32.3+36.5)= 396 20=19.8. (2)(1)依题意,可知这40只小白鼠体 重的增加量的中位数是将两组数据合 在一起,从小到大排序后第20位与第 21位数据的平均数,由原数据可得第 20位数据为23.2,第21位数据为23.6, 所以m= 23.2+23.6 =23.4,故列联 2 表为 项目 m ≥m 对照组 6 14 试验组 14 6 (i)由(i)可得X 40×(6×6-14×14) =6.4>3.841, 20×20×20×20 所以能有95%的把握认为小白鼠在高 浓度臭氧环境中与在正常环境中体重 的增加量有差异. 5.C因为A={1,4},B={一1,2},当 a=1,b=-1时,x=b2-a=0,当 a=1,b=2时,x=b2-a=3,当a= 4,b=一1时,x=b2-a=-3,当 Q=4,b=2时,x=b2-a=0,所以 A☒B={0,-3,3},故A☒B中的元 素个数为3.故选C. 6.D因为A={xx2-2x-3<0= {z-1<x<3,故CRA=(-o∞,第九章概率与统计 253 C.2024年母亲周末陪伴孩子日均时长的5个 A.2021一2024年该国星级酒店数量逐年 时段占比的极差为28.8% 减少 D.2024年父母周末陪伴孩子日均时长的10 B.2021一2024年该国星级酒店营业收人最高 个时段占比的中位数为20.2% 不超过2000亿元 学生试答: C.2021一2024年该国星级酒店餐饮收入比重 最高的是2022年 第 D.2021一2024年该国星级酒店餐饮收入比 重的极差是1.54% 章 学生试答: 【题目呈现5】如图为2021一-2024年某国星 级酒店数量、营业收入及餐饮收入比重,根据该 图,下列结论错误的是 ( ) 10000 .41.63% +42009% .41.13% 8423 41.00% 39.3% 40.009% 67 39.00% 38.19% 337 38.0% 1907.71 1221.53 379.4 1177.68 37.00% 》温馨提示 36.00% 2021 2022 2023 2024 学习至此,请完成训练66 ☐星级酒店营业收入亿元 门星级酒店数量/家 一餐饮收入比重/% 9.9 成对数据的统计分析 考试 1.了解样本相关系数的统计含义.2.理解一元线性回归模型和2×2列联表,会运用这些方法解决简单 要求 的实际问题。 回顾>必备知识 》知识梳理《 (2)当r>0时,称成对样本数据 ;当 1.变量的相关关系 r<0时,称成对样本数据 (1)相关关系:两个变量 ,但又没有确 (3)r≤1;当|r|越接近1时,成对样本数据 切到可由其中的一个去精确地决定另一个的程 的线性相关程度越 ;当|r|越接近0 度,这种关系称为相关关系. 时,成对样本数据的线性相关程度越 (2)正相关、负相关:从整体上看,当一个变量的值 3.一元线性回归模型 增加时,另一个变量的相应值也呈现 (1)我们将y=bx十a称为Y关于x的经验回 的趋势,就称这两个变量正相关;当一个变量的 值增加时,另一个变量的相应值呈现 的趋势,则称这两个变量负相关. 归方程,其中 (3)线性相关:一般地,如果两个变量的取值呈 x,-) =1 现正相关或负相关,而且散点落在 附 a =y-bx. 近,我们称这两个变量线性相关。 (2)残差:观测值减去 所得的差称为 2.样本相关系数 残差 ∑(x-x)(y,-y) 4.列联表与独立性检验 (1)r= (1)关于分类变量X和Y的抽样数据的2×2列 空-2-0 联表: 254 红构·讲与练·高三数学·基础版 根据散点图,判断y=bx十a(a,b>0)和y=c· 合计 y=0 Y=1 dr(c,d>0)函数模型中, 模 X=0 型的拟合效果更好, a b a+b 3.(教材改编题)某市政府调查市民收入增减与旅 X=1 d c+d 游需求的关系时,采用独立性检验法抽查了 合计 a+c b+d n=a+b+c+d 5000人,计算发现X=6.109,根据这一数据, 九 (2)计算X2 n (ad-bc)2 市政府断言市民收入增减与旅游需求有关的可 (a+b)(c+d)(a+c)(b+d)' 信度是 % 利用X2的取值推断分类变量X和Y 附: 的方法称为X2独立性检验. 0.1 0.05 0.01 0.005 0.001 0.15 0.10 0.05 0.0250.010 0.001 2.706 3.841 6.635 7.879 10.828 2.0722.7063.841 5.0246.635 10.828 ○常用结论与知识拓展 4.(教材改编题)为了解喜爱足球是否与性别有 1.经验回归直线一定经过点(x,y). 关,随机抽取了若干人进行调查,抽取女性人数 是男性的2倍,男性喜爱足球的人数占男性人 xy:一n.xy 2.求b时,常用公式b= x-n 数的骨,女性客爱足球的人数占女性人数的了, 若本次调查得出“在犯错误的概率不超过0.005 3.回归分析和独立性检验都是基于成对样本观测 数据进行估计或推断,得出的结论都可能犯错误. 的前提下认为喜爱足球与性别有关”的结论,则 被调查的男性至少有 人 》基础检测《 1.判断下列命题是否正确,正确的在括号内画 附:X2 n (ad-bc)2 (a+b)(c+d)(a+c)(b+d) “√”,错误的画“X”, 0.10 0.05 0.01 0.005 0.001 (1)“名师出高徒”可以解释为教师的教学水平 与学生的水平成正相关关系. () 2.706 3.841 6.6357.879 10.828 (2)经验回归直线y=bx十a至少经过点(x1, 5.(多选题)(教材改编题)已知变量x,y经过随 y1),(x2y2),…,(xmy)中的一个点.( 机抽样获得的成对样本数据为(x1y1),(x2, (3)两个变量的样本相关系数越小,它们的线性 相关性越弱 y2),…,(xwyn),其经验回归方程为y=bx十 2.(教材改编题)已知关于(x,y)的一组有序数对 a,下列说法正确的是 ( 分别为(1,6),(2,11),(3,21),(4,34),(5,66), A.若样本相关系数r的值越大,则成对样本数 (6,101),(7,196),对应的散点图如下 据的线性相关程度越强 200 180 B若元=∑x,y=1∑y,则点(y)一 n n 160 140 定在经验回归直线y=bx十a上 120 100 C.决定系数R的值越接近1,表示经验回归方 60 程拟合效果越好 40 D.残差平方和越大,表示经验回归方程拟合效 20 0 果越好 第九章 概率与统计 255 提升>关键能力 考点1成对数据的统计相关性 A.r2<r<r3<r B.r4<r2<r3<r1 命题角度1依据散点图进行相关性的判断 C.r4<r2<r1<r3 【例1】两个变量的相关关系有①正相关,②负 D.r2<r4<r1<r3 第 相关,③不相关,则下列散点图从左到右分别 命题角度2 依据样本相关系数、决定系数、残差 九 反映的变量间的相关关系是 判断相关性 章 【例2】(1)(2024·上海卷)已知沿海地区气温和 海水表层温度相关,且样本相关系数为正数, 0 0 对此描述正确的是 ( A.①②③ B.②③① A.沿海地区气温高,海水表层温度就高 C.②①③ D.①③② B.沿海地区气温高,海水表层温度就低 学生试答: C.随着沿海地区气温由低到高,海水表层温度 呈上升趋势 D.随着沿海地区气温由低到高,海水表层温度 呈下降趋势 (2)在线性回归模型中,能说明模型的拟合效 果越好的是 ( A.残差图越宽 B.残差平方和越小 规律总结 C.决定系数R2越小D.样本相关系数r越大 依据散点图判断相关性的基本策略:①观察点 学生试答: 的分布趋势,若点的分布从左下角到右上角,两个变 量正相关;点的分布从左上角到右下角,两个变量负 相关.②观察点的分布状态(形状),若点的分布成 密集型带状区域且带状区域越“狭窄”,线性相关性 越强:反之,线性相关性越弱. 【对点训练1】对四组数据进行统计,获得如下散 规律总结 点图,将四组数据相应的样本相关系数进行比 1.根据样本相关系数r判断相关性:当r>0 较,正确的是 ( ) 时,正相关;当r<0时,负相关;r|越接近1,线性 25 25 相关性越强。 20 20 2.根据决定系数R来刻画拟合效果:决定系数 15 10 10 5 R2=1 越接近1,一元线性回归模型 0510152025 0510152025 样本相关系数r 样本相关系数r ∑(y-) = 图1 图2 25 25· 的拟合效果越好,即R越大,说明模型拟合的效果 20 15 越好 15 3.根据残差来刻画拟合效果:在回归分析中,对 一组给定的样本数据(x1y1),(x2y2),,(xm, 0510152025 0510152025 y)而言,若残差平方和越大,则模型的拟合效果越 样本相关系数 样本相关系数, 差;反之,则模型的拟合效果越好」 图3 图4 256对沟·讲与练·高三数学·基础版 【对点训练2】(1)某团队尝试用回归模型甲、乙、 ∑xy,-nry 丙、丁描述人的1000米跑步成绩与肺活量的 =1 ,a =y-bx. 关系,已知模型甲、乙、丙、丁对应的决定系数 R2分别为-0.79,0.23,0.45,0.56,则拟合效 学生试答 果最好的模型是 第 A.甲B.乙 C.丙 D.丁 (2)(多选题)对两组线性相关成对数据进行回 章 归分析,得到不同的统计结果,第一组和第二 组成对数据的样本相关系数、残差平方和、决 定系数分别为r1,S,R和r2,S,R,则 A.若r1>r2,则第一组成对数据的线性相关 关系比第二组的强 B.若r>r,则第一组成对数据的线性相关 关系比第二组的强 C.若S<S,则第二组成对数据的线性回归 模型拟合效果比第一组的好 D.若R<R?,则第二组成对数据的线性回归 模型拟合效果比第一组的好 规律总结 考点2回归模型及应用 1.经验回归方程的重要应用是进行估计. 命题角度1一元线性回归模型 2.牢记求经验回归方程的步骤:第一步,列表;第 【例3】某公司过去七年在芯片技术上的研发投 二步,计算正,∑x,∑x或∑(,-)(y 入x(单位:亿元)与收益y(单位:亿元)的数 据统计如图所示 y),∑(x-x);第三步,代入公式求6,再利用a ↑收益亿元 7 y一bx求a:第四步,写出经验回归方程. 60 (13,58) . 8,50)10,56) 0 【对点训练3】某中医药企业根据市场调研与模 0 (4,31).6,42) 拟,得到研发投入x(单位:亿元)与产品收益 20 (3,22) 10 (2,13) y(单位:亿元)的数据统计如下: 012345678910111213研发投入/亿元 研发投入x/亿元 12345 (1)由折线图可知y与x的关系可以用一元线 产品收益y/亿元 3791011 性回归模型拟合,请根据折线图的数据,求出y 关于x的经验回归方程;(数据均保留整数) (1)计算x,y的样本相关系数r,并判断是否 (2)利用(1)中经验回归方程,求折线图中数据 可以认为研发投人与产品收益具有较强的线 残差的平方和. 性相关程度;(若0.3<r<0.75,则线性相 关程度一般;若|r>0.75,则线性相关程度 附:经验回归直线y=bx十a中,斜率和截距的 较强) 最小二乘估计公式分别为 (2)求出y关于x的经验回归方程,并预测若 6 想收益超过20亿元,则需研发投入至少多少亿 元.(结果保留一位小数) 参考公式:经验回归直线y=bx十a中,斜率和 第九章概率与统计 257 截距的最小二乘估计公式、样本相关系数r的 参考数据(x=lny) Gy 公式分别为b= ,a=y ∑x,y ∑x = i- 5215 17713 714 27 81.33.6 x-)(y.- (1)根据散点图判断y=bx+a与y=ce(其 ba,r 中e=2.718…为自然对数的底数)哪一个更适 第 空x,-∑,-可 九 合作为平均产卵数y(单位:个)关于平均温度 章 x(单位:℃)的回归模型;(给出判断即可,不 参考数据:∑(x,-x)2=10,∑(0,-)2 必说明理由) 40,22,-x)y,-)=19. (2)由(1)的判断结果及表中数据,求出y关于 x的经验回归方程.(计算结果精确到0.1) 附:经验回归直线y=bx十a中,斜率和截距的 最小二乘估计公式分别为 6 2x,-0y,-y ∑xy,-ny = =1 -a a=y-bx, 幻学生试答 命题角度2非线性回归模型 【例4】红蜘蛛是柚子的主要害虫之一,能对柚子 树造成严重伤害,每只红蜘蛛的平均产卵数 y(单位:个)和平均温度x(单位:℃)有关,现 ·规律总结 收集了以往某地的7组数据,得到下面的散点 对于非线性回归模型的处理策略:①基本的解 图及一些统计量的值. 题思想是转化与化归思想,即将“非线性”模型转化 ↑平均产卵数/个 400L 为“线性”模型;②观察题目中参考数据的“形式特 350 征”,结合题目所给拟合函数的特征分析,通常采用 300 的方法是“换元法”和“取对数法”等 250 200 【对点训练4】某人新房刚装修完,为了监测房屋 150 100 内空气质量的情况,每天在固定的时间测一次 50 甲醛浓度(单位:mg/m3),连续测量了10天, 202224262830323436平均温度x/℃ 将所得数据绘制成散点图如下: 258亿对构·讲与练·高三数学·基础版 ↑甲醛浓度y/(mgm) 考点3列联表与独立性检验 命题角度1独立性检验的基本原理 【例5】(1)对分类变量X和Y进行独立性检验的 零假设为 () 012345678910天数i A.H。:分类变量X和Y独立 用y,表示第i(i=1,2,…,10)天测得的甲醛 B.H。:分类变量X和Y不独立 九 浓度,令,=lny,经计算得之=12.8, C.H:P(Y=1|X=0)≠P(Y=1|X=1) D.H。:分类变量X和Y相关联 =85,i=60. (2)下列关于X独立性检验的说法正确的是 () (1)由散点图可知,y与i可用指数型回归模型 A.用X2独立性检验推断的结论可靠,不会犯 进行拟合,请利用所给条件求出经验回归方 错误 程;(系数精确到0.01) B.用X2独立性检验推断的结论可靠,但会犯 (2)已知房屋内空气中的甲醇浓度的安全范围 随机性错误 是低于0.08mg/m3,则根据(1)中所得回归模 C.X2独立性检验的方法适用于普查数据 型,该新房装修完第几天开始达到此标准? D.对于不同的小概率值α,用X独立性检验推 (参考数据:ln0.08≈-2.53) 断的结论相同 附:经验回归直线y=bx十a中,斜率和截距的 学生试答: 最小二乘估计公式分别为 ∑x,-ny 2x- 规律总结 a =y-bx. 1.独立性检验的基本原理是根据观测值与期望 值的差异的大小作出推断,这种差异由X2统计量进 行刻画,其大小的标准根据推理有关联时犯错误的 概率确定. 2.独立性检验的依据是小概率原理,即小概率 事件在一次试验中几乎不可能发生.在零假设成立 的条件下,若一个不利于零假设的小概率事件在一 次试验中发生了,则有理由拒绝零假设;若在一次试 验中,此小概率事件没有发生,则没有充足的理由拒 绝零假设,通常会接受零假设. 【对点训练5】(1)在下列两个分类变量X,Y的 样本频数列联表中,可以判断X,Y之间有无关 系的是 Y X 合计 Y-Y Y-Y2 X=X a b a+b X=X2 d c+d 合计 a+c b+d a+b+c+d 第九章 概率与统计259 阅读大会的评价有差异,则m的最小值为 A. c. b a c n(ad-bc)2 a+b c+d D. atb c+d 附:X2= (a+b)(c+d)(a+c)(6+d其中 (2)(多选题)某制药公司为了研究某种治疗高 n=a+b+c+d. 血压的药物在饭前和饭后服用的药效差异,随 0.10 0.05 0.005 机抽取了200名高血压患者开展试验,其中 2.706 3.841 7.879 九 100名患者饭前服药,另外100名患者饭后服 药,随后观察药效,将试验数据绘制成如图所 (2)(2020·全国Ⅲ卷)某学生兴趣小组随机调 示的等高堆积条形图,已知X2= 查了某市100天中每天的空气质量等级和当天 n(ad-bc)2 到某公园锻炼的人次,整理数据得到下表(单 (a+b)(c+d)(a+c)b+d,且P(X2≥ 位:天) 6.635)=0.01,则下列说法正确的是( 锻炼人次 人数 空气质量等级 100 0,200 (200,400] (400,600 80H 1(优) 2 16 25 60 口药效弱 2(良) 5 10 12 40 口药效强 20H 3(轻度污染) 6 2 8 0 饭前饭后 4(中度污染) 7 2 0 A饭前服药的患者中,药效强的频率为青 ①分别估计该市一天的空气质量等级为1,2, 3,4的概率 B.药效弱的患者中,饭后服药的频率为 7 ②求一天中到该公园锻炼的平均人次的估计 值.(同一组中的数据用该组区间的中点值为 C.在犯错误的概率不超过0.01的条件下,可 代表) 以认为这种药物饭前和饭后服用的药效有 ③若某天的空气质量等级为1或2,则称这天 差异 “空气质量好”;若某天的空气质量等级为3或 D.在犯错误的概率不超过0.01的条件下,不 4,则称这天“空气质量不好”.根据所给数据, 能认为这种药物饭前和饭后服用的药效有 完成下面的2×2列联表,并根据列联表,判断 差异 是否有95%的把握认为一天中到该公园锻炼 命题角度2独立性检验的实际应用 的人次与该市当天的空气质量有关, 【例6】(1)某市举行了首届阅读大会,为调查市 项目 人次≤400 人次>400 民对阅读大会的满意度,相关部门随机抽取 空气质量好 男、女市民各50名,每位市民对大会给出满意 空气质量不好 或不满意的评价,得到下面列联表: 评价 附:X2= n(ad-bc)2 性别 合计 a+b)c+dDa+c)6+)其中 满意 不满意 n=a+b+c+d. 男 60-m m-10 50 a 0.05 0.01 0.001 女 50 3.841 6.635 10.828 m+10 40-m 合计 70 30 100 学生试答 当m≤25,m N时,若在a=0.05的情 况下,我们没有充分的证据推断男、女市民对 260沟·讲与练·高三数学·基础版 试验组的小白鼠体重的增加量从小到大排 序为 7.8 9.211.412.413.215.5 16.518.018.819.219.820.2 21.622.823.623.925.128.2 32.336.5 (1)计算试验组的样本平均数; 章 (2)(ⅰ)求40只小白鼠体重的增加量的中位 数m,再分别统计两样本中小于m与不小于m 的数据的个数,完成如下列联表: 项目 ≥m 对照组 试验组 (ⅱ)根据(ⅰ)中的列联表,能否有95%的把 规律总结 1.在2×2列联表中,如果两个变量没有关系, 握认为小白鼠在高浓度臭氧环境中与在正常 则应满足ad一bc≈0;|ad-bc|越小,说明两个变 环境中体重的增加量有差异? 量之间关系越弱;ad一bc|越大,说明两个变量之 附:X2= n(ad-be)2 间关系越强 (a+b)(c+d)(a+c)(b+d) 2.解决独立性检验的应用问题,一定要按照独 0.100 0.050 0.010 立性检验的步骤得出结论.独立性检验的一般步骤: 2.706 3.841 6.635 (1)根据样本数据制成2×2列联表. (2)根据公式X2= n(ad-bc)2 (a+b)(c+d)(a+c)(6+团计算X, (3)通过比较X2与临界值的大小关系来作统计 推断. 【对点训练6】(2023·全国甲卷文)一项试验旨 在研究臭氧效应,试验方案如下:选40只小白 鼠,随机地将其中20只分配到试验组,另外20 只分配到对照组,试验组的小白鼠饲养在高浓 度臭氧环境,对照组的小白鼠饲养在正常环 境,一段时间后统计每只小白鼠体重的增加量 (单位:g).试验结果如下: 对照组的小白鼠体重的增加量从小到大排 序为 15.218.820.221.322.523.2 25.826.527.530.132.634.3 34.835.635.635.836.237.3 》温馨提示 40.543.2 学习至此,请完成训练67

资源预览图

9.9 成对数据的统计分析-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版
1
9.9 成对数据的统计分析-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版
2
9.9 成对数据的统计分析-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版
3
9.9 成对数据的统计分析-【红对勾讲与练·讲义】2026年高考数学大一轮复习全新方案基础版
4
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。