第3节 成对数据的统计分析-【创新教程】2026年高考数学艺考生文化课百日冲关学生用书

2025-11-04
| 2份
| 8页
| 37人阅读
| 0人下载
教辅
山东鼎鑫书业有限公司
进店逛逛

资源信息

学段 高中
学科 数学
教材版本 -
年级 高三
章节 -
类型 学案
知识点 计数原理与概率统计
使用场景 高考复习
学年 2026-2027
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 ZIP
文件大小 1.36 MB
发布时间 2025-11-04
更新时间 2025-11-04
作者 山东鼎鑫书业有限公司
品牌系列 创新教程·艺考生高考总复习
审核时间 2025-08-06
下载链接 https://m.zxxk.com/soft/53349311.html
价格 2.00储值(1储值=1元)
来源 学科网

内容正文:

小题查验 1.C 2.C 3.946 跃升􀅰关键能力 考点一 1.C [根据频率分布直方图 得,(0.01+a+b+0.018+ 0.012)×10=1,解得a+b=0.06.故选 C.] 2.AC [依题意,(0.015+0.025+0.035+0.005+2a)× 10=1,解得a=0.010,选项 A,∵最高小矩形的中点横 坐标为75,∴众 数 是 75,故 A 正 确.选 项 B,设 样 本 的 71%分位数为x,又10×(0.010+0.015+0.025)=0.5, ∴0.5+(x-70)×0.035=0.71,解得x=76,故B错误. 选项C,平均数为45×0.1+55×0.15+65×0.25+75× 0.35+85×0.1+95×0.05=68.5,故 C正确.选项 D,样 本中得分低于60分的占(0.010+0.015)×10=25%, ∴该校学生中得分低于60分的约占25%,故 D错误.] 考点二 1.D [由小到大排列的结果:6,7,15,36,39,40,41,42, 43,47,49,一共11项. 下四分位数即第25百分位数,由11×25%=2􀆰75,得下 四分位数是第3项数据15.] 2.A [由直方图得,从左到右的第一、二、三、四小组的频 率分别是0􀆰10、0􀆰20、0􀆰40、0􀆰30. 第一、二、三 小 组 的 频 率 之 和 为 0􀆰10+0􀆰20+0􀆰40= 0􀆰70<0􀆰90,所以第90百分位数处在第四组[80,100] 内,为80+20×0.90-0.701.00-0.70≈93. ] 3.解析:把数据从小到大排序为12,15,24,25,31,32,34, 36,36,37,39,42,48,50共14个数, 14×25%=3􀆰5,14×75%=10􀆰5,所以第25,75百分位 数分别是第4,11项数据,即是25,39. 答案:25 39 考点三 [典例1] 解:(1)根据题意有 16+24+x+y+16+14=200, 16+24+x y+16+14= 3 2 ,{ 解得 x=80, y=50,{ ∴p=0􀆰40,q=0􀆰25. 补全频率分布直方图如图所示. (2)根据题意,抽取网购金额在(1,2]内的人数为 24 24+16×5=3 (人). 抽取网购金额在(4,5]内的人数为 1624+16×5=2 (人). 故此2人来自不同群体的概率P=C 1 3C12 C25 =35. [典例2] [解] (1)x=110 (545+533+551+522+575+ 544+541+568+596+548)=552.3, y=110 (536+527+543+530+560+533+522+550+ 576+536)=541.3, z=x-y=552.3-541.3=11, zi=xi -yi 的 值 分 别 为:9,6,8,-8,15,11,19,18, 20,12, 故s2=110 [(9-11)2+(6-11)2+(8-11)2+(-8- 11)2+(15-11)2+0+(19-11)2+(18-11)2+(20- 11)2+(12-11)2]=61. (2)由(1)知:z=11,2 s 2 10=2 6.1= 24.4 ,故有z≥ 2 s 2 10 , 所以认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理 后的橡胶产品的伸缩率有显著提高. 跟踪训练  解:(1)由表中的数据可得:􀭺x= 110× [9.8+10.3+10.0 +10.2+9.9+9.8+10.0+10.1+10.2+9.7]=10.0, 􀭵y=110× [10.1+10.4+10.1+10.0+10.1+10.3+10.6+ 10.5+10.4+10.5]=10.3, s21= 1 10 [(9.8-10.0)2 + (10.3-10.0)2 + (10.0- 10.0)2+(10.2-10.0)2 + (9.9-10.0)2 + (9.8- 10.0)2+(10.0-10.0)2+(10.1-10.0)2+(10.2- 10.0)2+(9.7-10.0)2]=0.036, s22= 1 10 [(10.1-10.3)2 +(10.4-10.3)2 +(10.1- 10.3)2+(10.0-10.3)2+(10.1-10.3)2+(10.3- 10.3)2+(10.6-10.3)2+(10.5-10.3)2+(10.4- 10.3)2+(10.5-10.3)2]=0.04; (2)由(1)中的数据可得􀭵y-􀭺x=10.3-10.0=0.3, 2 s21+s22 10 =2 0.036+0.04 10 =2 0.0076 , 则0.3= 0.09>2 0.0076= 0.0304, 所以可判断新设备生产产品的该项指标的均值较旧设 备有显著提高. 第3节 夯实􀅰必备知识 必备知识 一、1.相关关系 3.增加 增加 增加 减少 二、1.正相关 负相关 一条直线 2.相关性 不是 三、2.正相关 负相关 3.(1)[-1,1] |r|≤1 (2)越强 (3)越弱 4.线性相关程度 正负性 程度 越大 越好 七、2.实数 3.{0,1} 八、总数 九、4.χ 2≥xα 不成立 不独立 不超过α χ 2<xα 没有 独立 卡方独立性检验 思考辨析 (1)√ (2)× (3)× (4)√ (5)√ (6)× 小题查验 1.A 2.A 3.C 跃升􀅰关键能力 考点一 1.C [由散点图可知身高与体重成正相关.] 2.A [由题意不妨设,z=ky+b(k>0), ∵y=-0.1x+1,∴z=-0.1kx+(k+b), ∵-0.1<0,-0.1k<0,∴x与y负相关,x与z负相关.] 3.AB [􀭺x=3,代入ŷ=1.5x+0.5,􀭵y=5. 因为重新求得的回归直线l的斜率为1.2,所以正相关. 设新的横坐标的平均值为􀭺x′,则(n-2)􀭺x′=n􀭺x-(1.2+ 4.8)=3n-6=3(n-2),􀭺x′=3; 纵坐标的平均数为􀭵y′,则(n-2)􀭵y′=n􀭵y-(2.2+7.8)= n􀭵y-10=5n-10=5(n-2),􀭵y′=5. 设新的线性回归方程为ŷ=1.2x+b,把(3,5)代入5= 1􀆰2×3+b,得b=1􀆰4, 所以新的线性回归方程为ŷ=1􀆰2x+1􀆰4.故 A,B正确. 因为斜率 为 1􀆰2 变 小,所 以 y 的 增 加 速 度 变 慢,故 C 错误. 把x=2代入,得y=3􀆰8,3􀆰75-3􀆰8=-0􀆰05,故 D 错 误.故选 AB.] 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀅰153􀅰                                                                         参考答案 考点二 1.解:(1)由题 意,得x= 15 × (1+2+3+4+5)=3,y= 1 5× (0.3+0.3+0.5+0.9+1)=0.6,􀰑 5 i=1 x2i =1+4+9 +16+25=55. 所以b̂= 􀰑 5 i=1 xiyi-5x􀅰y 􀰑 5 i=1 x2i-5x2 =11-5×3×0.6 55-5×32 =0.2, â=y-̂bx=0.6-0.2×3=0, 所以线性回归方程为ŷ=0.2x. 线 性 相 关 系 数 r= 􀰑 5 i=1 xiyi-5x􀅰y (􀰑 5 i=1 x2i-5x2)(􀰑 5 i=1 y2i-5y2) = 11-5×3×0.6 (55-5×32)(2.24-5×0.62) = 2 4.4 ≈0.9524> 0.95, 这说明投资金额x 与所获利润y 之间的线性相关性较 强,用线性 回 归 方 程 ŷ=0.2x 对 该 组 数 据 进 行 拟 合 合理. (2)若对项目B 投资x′(1≤x′≤6)百万元,则对项目 A 投资(7-x′)百万元, 所以所获得的总利润L=0.16x′-0.49x′+1+0.49+0.2 (7 -x′)= 1.93 - 0.04(x′+1)+0.49x′+1[ ] ≤ 1.93- 2 0.04(x′+1)×0.49x′+1=1.65 , 当且仅当0.04(x′+1)=0.49x′+1 ,即x′=2.5时取等号, (一定要求出等号成立的条件) 所以对A,B 项目分别投资4.5百万元,2.5百万元时, 所获得的总利润最大. 2.解:(1)由 Wi =lgIi,则 D̂ =â+b̂W,由 表 得 b̂= ∑ 10 i=1 (Wi-W)(Di-D) ∑ 10 i=1 (Wi-W)2 =5.10.51=10. 所以â=D-̂bW=45.7-10×(-11.5)=160.7,所以D 关于W 的回归方程是D̂=10W+160.7. 即D 关于I的回归方程是D̂=10lgI+160.7. (2)点P的声音能量I=I1+I2,因为 1 I1 +4I2 =1010, 所以I=I1+I2=10-10 1 I1 +4I2( )(I1+I2)= 10-10 5+ I2 I1 + 4I1 I2( ) ≥9×10 -10(当且仅当I2 I1 = 4I1 I2 即I2 =2I1 时等号成立). 根据(1)中的回归方程,点P的声音强度D的预报值: D̂=10lg(9×10-10)+160.7=10lg9+60.7>60,所以 点P 会受到噪声污染的干扰. 考点三 [典例] 解:(1)580人中体育锻炼时长不小于1小时人数占 比P=42+3+1+137+40+27580 = 25 58 ,该地区29000名初中 学生中体育锻炼时长不小于1小时的人数约为29000×2558 =12500人. (2)该地区初中学生锻炼平均时长约为: 1 580 0.5 2 × (5+134)+0.5+12 × (44+147)[ +1+1.52 × (42+137)+1.5+22 × (3+40) +2+2.52 × (1+27)]=2729≈0.9h. (3)列联表 成绩 时长 时长[1,2) 其他时长 总计 优秀 45 50 95 不优秀 177 308 485 总计 222 358 580 提出零假设 H0:成绩优秀与日均体育锻炼时长不小于1 小时且小于2小时无关. χ 2=580× (45×308-177×50)2 95×485×222×358 ≈3.976>3.841. 有95%的把握认为学业成绩优秀与日均体育锻炼时长 不小于1小时且小于2小时有关. 跟踪训练  解:(1)在1000个样本中,超声波检查结果不正常的人 中患有该疾病的频率为180 200=0.9 , 以样本频率估计总体概率,p的估计值为0.9. (2)H0:超声波检查结果与是否患病无关, χ 2= n (ad-bc)2 (a+b)(c+d)(a+c)(b+d)= 1000×(20×20-780×180)2 800×200×200×800 = 12250 16 >10.828 , 概率小概率值α=0.001的独立性检验,应拒绝零假设 H0,即超声波检查结果与是否患病有关. 第九章  第1节 夯实􀅰必备知识 必备知识  m+n m×n 独立 依存 思考辨析 (1)× (2)√ (3)√ (4)× (5)√ 小题查验 1.D 2.C 3.D 4.480 5.9 跃升􀅰关键能力 考点一 1.C [分为以下两类: 第一类,从一个村庄出发向其他三个村庄各修一条路, 共有4种方法; 第二类,一个村最多修两条路,但是象下面这样的两个排列 对应一种修路方法,A-B-C-D,D-C-B-A,要去掉重 复的这样,因此共有有1 2A 4 4=12(种)方法. 根据分类加法计数原理,知道共有4+12=16(种),故 选 C.] 2.C [(1)对子集A 分类讨论.当A 是二元集{1,2},B 可 以为{1,2,3,4},{1,2,4},{1,2,3},{1,2}共4种情况;当 A 是三元集{1,2,3},B 可以取{1,2,4},{1,2}共有2种 情况;当A 是三元集{1,2,4},B 可以取{1,2,3},{1,2}, 共有2种情况;当A 是四元集{1,2,3,4},此时B 取{1, 2}有1种情况,根据分类加法加法计数原理得4+2+2 +1=9(种),故 符 合 此 条 件 的“理 想 配 集”有 9 个.故 选 C.] 3.C [由题意知正方形ABCD(边长为3个单位)的周长 是12, 抛掷三次骰子后棋子恰好又回到点A 处表示三次骰子 的点数之和是12, 列举出在点数中三个数字能够使得和为12的有1,5,6; 2,4,6;3,4,5;3,3,6;5,5,2;4,4,4;共有6种组合, 前三种组合1,5,6;2,4,6;3,4,5;又可以排列出 A33= 6(种)结果, 3,3,6;5,5,2;有6种结果,4,4,4;有1种结果. 根据分类加法计数原理知共有24+1=25(种)结果,故 选 C.] 考点二 [典例] [解析] (1)从E 到G 最短路径条数为 C24􀅰C29 =18.故选B. (2)有两个年级选择甲博物馆共有 C26 种情况,其余四个 年级每个年级各有5种选择情况,故有且只有两个年级 选择甲博物馆的情况有 C26×54 种,故选 D. [答案] (1)B (2)D 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀅰253􀅰 艺考生文化课百日冲关􀅰数学 第3节 成对数据的统计分析 课程标准 核心素养 考情聚焦 1.结合实例,了解样本相关系数的统计含义,了解样本 相关系数与标准化数据向量夹角的关系,会通过相 关系数比较多组成对样本数据的相关性. 2.结合具体实例,了解一元线性回归模型的含义,了解 模型参数的统计意义,了解最小二乘法原理,掌握一 元线性回归模型参数的最小二乘估计方法. 3.针对实际问题,会用一元线性回归模型进行预测. 4.通过实例,理解2×2列联表的统计意义,了解2×2 列联表独立性检验及其应用. 1.相关关系的判断,达 成直观想象和数据 分析的素养. 2.回归方程的求法及 回归分析,增强逻辑 推理、数据分析和数 学运算的素养. 3.独立性检验,增强逻 辑推理、数据分析和 数学运算的素养.    预计 2026年的高考 将以选择题、填空题的形 式考查线性回归系数或利 用线 性 回 归 方 程 进 行 预 测;在给出临界值的情况 下判 断 两 个 变 量 是 否 相 关;在解答题中与频率分 布相结合,考察线性回归 方程的建立及应用和独立 性检验的应用,难度中等 [必备知识] 一、相关关系 1.两个变量有关系,但又没有确切到由其中的一个 去精确 地 决 定 另 一 个 的 程 度,这 种 关 系 称 为       . 2.散点图 将成对样本数据用直角坐标系中的点表示出来, 由这些点组成的统计图叫做散点图. 3.正相关、负相关 如果从整体上看,当一个变量的值    时, 另一个变量的相应值也呈现    的趋势,我 们就称这两个变量正相关;如果当一个变量的值     时,另一个变量的相应值呈现     的趋势,则称这两个变量负相关. 二、线性相关与非线性相关(或曲线相关) 1.线性相关 一般地,如果两个变量的取值呈现    或     ,而且散点落在      附近,我 们就称这两个变量线性相关. 2.非线性相关(或曲线相关) 一般地,如果两个变量具有    ,但     线性相关,那么我们就称这两个变量非线性相关或 曲线相关. 三、样本相关系数 1.样本相关系数 对于变量x和变量y,设经过随机抽样获得的成 对样本数据为(x1,y1),(x2,y2),􀆺,(xn,yn),其 中x1,x2,􀆺,xn 和y1,y2,􀆺,yn 的均值分别为 􀭺x 和􀭵y,记r= ∑ n i=1 (xi-􀭺x)(yi-􀭵y) ∑ n i=1 (xi-􀭺x)2 ∑ n i=1 (yi-􀭵y)2 = ∑ n i=1 xiyi-n􀭺x􀭵y ∑ n i=1 x2i-n􀭺x2 ∑ n i=1 y2i-n􀭵y2 . 我们称r为变量x 和变量y 的样本相关系数. 2.样本相关系数的意义 样本相关系数r是一个描述成对样本数据的数 字特征,它的正负性和绝对值的大小可以反映成 对样本数据的变化特征:当r>0时,称成对样本 数据        ;当 r<0 时,称 成 对 样 本 数 据    . 3.相关系数r具有的性质 (1)样本相关系数r的取值样本范围为    , 即    ; (2)当|r|越接近1时,成对样本数据的线性相关程 度    ; (3)当|r|越接近0时,成对样本数据的线性相关程 度    . 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀅰271􀅰 艺考生文化课百日冲关􀅰数学 4.两个随机变量的相关性与样本相关系数r之间 的关系 两个随机变量的相关性可以通过成对样本数据 进行分析,而样本相关系数r可以反映两个随机 变量之间的        :r的符号反映了 相关关系的    ;|r|的大小反映了两个变 量线性相关的    ,即散点集中于一条直线 的程度.一般地,样本容量    ,用样本相关 系数估计两个变量的相关系数的效果    . 四、一元线性回归模型 称下式为Y 关于x 的一元线性回归模型. Y=bx+a+e, E(e)=0,D(e)=σ2.{ 其中,Y 称为因变量或响应变量,x 称为自变量 或解释变量;a和b为模型的未知参数,a称为截 距参数,b称为斜率参数;e是Y 与bx+a之间的 随机误差. 说明: (1)模型中的Y 也是随机变量,其值虽然不能由变 量x的值确定,但是却能表示为bx+a与e的 和(叠加),前一部分由x所确定,后一部分是随 机的. (2)如果e=0,那么Y 与x 之间的关系就可用一元 线性函数模型来描述. 五、一元线性回归模型参数的最小二乘法  我们将ŷ=̂bx+̂a称为Y 关于x 的经验回归方 程,也称经验回归函数或经验回归公式,其图形 称为经验回归直线,这种求经验回归方程的方法 叫做最小二乘法,求得的b̂,̂a叫做b,a的最小二 乘估计.其中: b̂= ∑ n i=1 (xi-􀭺x)(yi-􀭵y) ∑ n i=1 (xi-􀭺x)2 = ∑ n i=1 xiyi-n􀭺x􀭵y ∑ n i=1 x2i-n􀭺x2 , â=􀭵y-̂b􀭺x ì î í ï ï ï ï 六、刻画回归效果的方式———残差分析 残差 对于响应变量Y,通过观测得到的数据 称为观测值,通过经验回归方程得到的 ŷ称为预测值,观测值减去预测值称为 残差. 残差图 利用图形来分析残差特性,作图时纵坐 标为残差,横坐标可以选为样本编号,或 身高数据,或体重估计值等,这样作出的 图形称为残差图. 残差 图法 残差点比较均匀地落在水平的带状区域 内,说明选用的模型比较适合,这样的带 状区域的宽度越窄,说明模型拟合精度 越高. 意义 一般地,建立经验回归方程后,通常需要 对模型刻画数据的效果进行分析,借助 残差分析还可以对模型进行改进,使我 们能根据改进模型作出更符合实际的预 测与决策. 残差平 方和 残差平方和为∑ n i=1 (yi-̂yi)2,残差平方和 越小,模型拟合效果越好. 决定系 数R2 R2=1- ∑ n i=1 (yi-̂yi)2 ∑ n i=1 (yi-􀭵y)2 ,R2 越大,残差平 方和越小,模型的拟合效果越好;R2 越 小,残差平方和越大,即模型的拟合效果 越差. 􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 1.相关关系与函数关系的异同 共同点:二者都是指两个变量间的关系; 不同点:函数关系是一种确定性关系,体现的是因 果关系,而相关关系是一种非确定性关系,体现的 不一定是因果关系,也可能是伴随关系. 2.相关系数:r= 􀰐 n i=1 xiyi-n􀭺x􀭵y (􀰐 n i=1 x2i-n􀭺x2)(􀰐 n i=1 y2i-n􀭵y2) ,当 r>0时,两变量正相关,当r<0时,两变量负相关, 当|r|≤1且|r|越接近于1,相关程度越高,当|r| ≤1且|r|越接近于0,相关程度越低. 七、分类变量 1.分类变量:用一种特殊的随机变量,以区别不同 的现象或性质,这类随机变量称为分类变量. 2.取值:分类变量的取值可以用    表示. 3.范围:本节主要讨论取值于    的分类变量的 关联性问题. 八、2×2列联表 将如下表所示这种形式的数据统计表称为2× 2列联表,它给出了成对分类变量数据的交叉 分类频数. 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀅰371􀅰                                                   上篇:第八章 统计与成对数据的统计分析 性别 锻炼 不经常(Y=0) 经常(Y=1) 合计 女生 (X=0) 192 331 523 男生 (X=1) 128 473 601 合计 320 804 1124 它包含了X 和Y 如下信息:最后一行的前两个 数分别是事件{Y=0}和{Y=1}中样本点的个 数;最后一列的前两个数分别是事件{X=0}和 {X=1}中样本点的个数;中间的四个格中的数 是表格的核心部分,给出了事件{X=x,Y=y} (x,y=0,1)中样本点的个数;右下角格中的数 是样本空间中样本点的    . 九、独立性检验 1.零假设H0:分类变量X 和Y 独立. 2.公式:χ2= n(ad-bc)2 (a+b)(c+d)(a+c)(b+d). 3.临界值:忽略χ2 的实际分布与该近似分布的误 差后,对于任何小概率值α,可以找到相应的正实 数xα,使下面关系式成立:P(χ2≥xα)=α. 我们称xα 为α的临界值,这个临界值可作为判断 χ2 大小的标准.概率值α越小,临界值xα 越大. 4.独立性检验 基于小概率值α的检验规则是: 当    时,我们就推断H0     ,即认为X 和Y     ,就推断犯错误的概率    ; 当    时,我们    充分证据推断 H0 不成立,可以认为X 和Y     . 这种利用χ2 的取值推断分类变量 X 和Y 是否 独立的方法称为χ2 独立性检验,读作“         ”,简称独立性检验. [自主诊断] [思考辨析]  判断下列说法是否正确,正确的在它后面的括号 里打“√”,错误的打“×”. (1)利用样本点的散点图可以直观判断两个变量 的关系是否可以用线性关系去表示. (  ) (2)经验回归直线ŷ=̂bx+̂a恒过样本中心点(􀭺x, 􀭵y),且至少过一个样本点. (  ) (3)在一元线性回归模型中,e是bx+a与y 的随 机误差,它是一个可观测的量. (  ) (4)事件X,Y 关系越密切,则由观测数据计算得 到的χ2 的观测值越大. (  ) (5)在残差图中,残差点分布的带状区域的宽度 越窄,其模型拟合的精度越高. (  ) (6)由独立性检验可知,在犯错误的概率不超过1% 的前提下认为物理成绩优秀与数学成绩有关,某人 数学成绩优秀,则他有99%的可能物理优秀. (  ) [小题查验] 1.(2024􀅰天津卷)下列图中,线性相关系数最大 的是 (  ) 2.(2025􀅰济宁三模)根据变量Y1 和x的成对样本 数 据, 由 一 元 线 性 回 归 模 型 ① Y1=b1x+a1+e1 E(e1)=0,D(e1)=σ21{ ,得到经验回归模型ŷ= b̂1x+̂a1,对应的残差如图(1)所示.根据变量Y2 和x的成对样本数据,由一元线性回归模型② Y2=b2x+a2+e2 E(e2)=0,D(e2)=σ22{ ,得到经验回归模型ŷ= b̂2x+̂a2,对应的残差如图(2)所示,则 (  ) A.模型 ① 的 误 差 满 足 一 元 线 性 回 归 模 型 的 E(e1)=0的假设,不满足D(e1)=σ21 的假设 B.模型①的误差不满足一元线性回归模型的 E(e1)=0的假设,满足D(e1)=σ21 的假设 C.模型②的误差满足一元线性回归模型的 E (e2)=0的假设,不满足D(e2)=σ22 的假设 D.模型②的误差不满足一元线性回归模型的 E(e2)=0的假设,满足D(e2)=σ22 的假设 3.(2024􀅰上海卷)已知沿海地区气温和海水表层 温度相关,且样本相关系数为正数,对此描述正 确的是 (  ) A.沿海地区气温高,海水表层温度就高 B.沿海地区气温高,海水表层温度就低 C.随着沿海地区气温由低到高,海水表层温度 呈上升趋势 D.随着沿海地区气温由低到高,海水表层温度 呈下降趋势 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀅰471􀅰 艺考生文化课百日冲关􀅰数学 考点一 相关关系的判断(自主练透) 1.(2025􀅰扬州三模)某校50名学生的身高与体重 的散点图如下:根据身高和体重散点图,下列说法 正确的是 (  ) A.身高越高,体重越重 B.身高越高,体重越轻 C.身高与体重成正相关 D.身高与体重成负相关 2.已知变量x和y 满足关系y=-0.1x+1,变量y 与z正相关.下列结论中正确的是 (  ) A.x与y 负相关,x与z负相关 B.x与y 正相关,x与z正相关 C.x与y 正相关,x与z负相关 D.x与y 负相关,x与z正相关 3.(多选题)已知由样本数据点集合{(xi,yi)|i=1, 2,􀆺,n},求得的回归直线方程为 ŷ=1􀆰5x+ 0􀆰5,且 􀭺x=3,现发现两个数据点(1􀆰2,2􀆰2)和 (4􀆰8,7􀆰8)误差较大,去除后重新求得的回归直 线l的斜率为1􀆰2,则 (  ) A.变量x与y 具有正相关关系 B.去除后的回归方程为ŷ=1.2x+1.4 C.去除后y的估计值增加速度变快 D.去除后相应于样本点(2,3.75)的残差为0.05 (1)画散点图:点的分布从左下角到右上角,两个 变量正相关;点的分布从左上角到右下角,两 个变量负相关. (2)相 关 系 数:r>0 时,正 相 关;r<0 时,负 相关. (3)线性回归方程中:̂b>0时,正相关;̂b<0时, 负相关. 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 考点二 回归分析(多维探究) [命题角度1] 线性回归分析 􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋 1.(2025􀅰盐城市二模)某公司对项目A 进行生产 投资,所获得的利润有如下统计数据表: 项目A 投资 金额x/百万元 1 2 3 4 5 所获利润 y/百万元 0.3 0.3 0.5 0.9 1 (1)请用线性回归模型拟合y与x 的关系,并用 相关系数加以说明; (2)该公司计划用7百万元对A,B 两个项目进 行投资,若公司对项目B投资x′(1≤x′≤6)百万 元所获 得 的 利 润 y′近 似 满 足:y′=0.16x′- 0.49 x′+1+0.49 ,求A,B两个项目投资金额分别为 多少时,所获得的总利润最大? 附:①对于一组数据(x1,y1),(x2,y2),􀆺,(xn,yn), 其回归直线ŷ=̂bx+̂a的斜率和截距的最小二乘估 计公式分别为̂b= 􀰑 n i=1 xiyi-nx􀅰y 􀰑 n i=1 x2i-nx2 ,̂a=y-̂bx. ②线性相关系数r= 􀰑 n i=1 xiyi-nx􀅰y (􀰑 n i=1 x2i-nx2)(􀰑 n i=1 y2i-n􀭵y2 .一 般地,相关系数r的绝对值在0.95以上(含0.95)认 为线性相关性较强;否则,线性相关性较弱. 参考数据:对项目A 投资的统计数据表中􀰑 5 i=1 xiyi =11,􀰑 5 i=1 y2i=2.24,4.4≈2.1. 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀅰571􀅰                                                   上篇:第八章 统计与成对数据的统计分析    (1)在分析实际中两个变量的相关关系时,可根 据样本数据作出散点图来确定两个变量之 间是否具有相关关系,也可计算相关系数r 进行判断.若具有线性相关关系,则可通过 线性回归方程估计和预测变量的值. (2)正确运用计算b̂,̂a的公式和准确的计算,是 求线性回归方程的关键.并充分利用回归直 线ŷ=̂bx+̂a必过样本点的中心(x,y)进行 求值. [命题角度2]非线性回归分析 􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋 2.噪声污染已经成为影响 人们身体健康和生活质 量的严重问题.为了了解 声音强度 D 与声音能量 I之间的关系,将测量得 到的声音强度Di 和声音能量Ii(i=1,2,􀆺,10) 数据做初步处理,得到下面的散点图及一些统计 量的值. I D W ∑ 10 i=1 (Ii-I)2 1.04×10-11 45.7 -11.5 1.56×10-21 ∑ 10 i=1 (Wi-W)2 ∑ 10 i=1 (Ii-I)􀅰(Di-D) ∑ 10 i=1 (Wi-W)􀅰 (Di-D) 0.51 6.88×10-11 5.1 表中Wi=lgIi,W= 1 10∑ 10 i=1 Wi. (1)根据表中数据,求声音强度D 关于声音能量 I的回归方程D̂=̂a+̂blgI; (2)当声音强度大于60分贝时属于噪音,会产生 噪声污染.城市中某点 P 共受到两个声源的影 响,这两个声源的声音能量分别是I1 和I2,且 1 I1 +4I2 =1010.已知点P 的声音能量等于声音能量 I1 与I2 之和,请根据(1)中的回归方程,判断P 点是否受到噪声污染的干扰,并说明理由. 附:对于一组数据 (u1,v1),(u2,v2),􀆺,(un, vn),其回归直线v̂=̂α+̂βu的斜率和截距的最小 二乘估计分别为β̂= ∑ n i=1 (ui-u)(vi-v) ∑ n i=1 (ui-u)2 ,̂α=̂v- β̂u.    非线性回归分析问题的处理方法 (1)描点,选模.画出已知数据的散点图,把它与 已经学过的各种函数(幂函数、指数函数、对 数函数等)图象作比较,挑选一种跟这些散 点拟合最好的函数. (2)解模.先对变量进行适当地变换,再利用线 性回归模型来解模. (3)比较检验.通过回归分析比较所建模型的 优劣. 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀅰671􀅰 艺考生文化课百日冲关􀅰数学 考点三 独立性检验(师生共研) [典例] (2024􀅰上海卷)为了解某地初中学生体 育锻炼时长与学业成绩的关系,从该地区29000 名学生中随机抽取580人,得到日均体育锻炼时 长(单位:小时)与学业成绩的数据如表所示: 时间范围 [0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5) 学业 成绩 优秀 5 44 42 3 1 不优秀 134 147 137 40 27 (1)该地区29000名学生中日均体育锻炼时长 不小于1小时的人数约为多少? (2)估计该地区初中学生日均体育锻炼时长(精 确到0.1小时). (3)是否有95%的把握认为学业成绩优秀与日 均体育锻炼时长不小于1小时且小于 2小时 有关? 附:χ2= n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,n=a+b+ c+d.P(χ2≥3.841)≈0.05. [尝试解答]    􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋   􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋   􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋   􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋   􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋   􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋   􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋􀪋    (1)在2×2列联表中,如果两个变量没有关系, 则应满足ad-bc≈0.|ad-bc|越小,说明两 个变量之间关系越弱;|ad-bc|越大,说明两 个变量之间关系越强. (2)解决独立性检验的应用问题,一定要按照独 立性检验的步骤得出结论.独立性检验的一 般步骤: ①根据样本数据制成2×2列联表; ②根据公式􀱽2= n (ad-bc)2 (a+b)(a+c)(b+d)(c+d) 计算χ2 的观测值xα; ③比较x0 与临界值的大小关系,作统计推断. 提醒:准确计算􀱽2 的值是正确判断的前提. [跟踪训练]  (2025􀅰全国一卷)为研究某疾病与超声波检查 结果的关系,从做过超声波检查的人群中随机调 查了1000人,得到如下列联表: 组别 超声波检查结果 正常 不正常 合计 患该疾病 20 180 200 未患该疾病 780 20 800 合计 800 200 1000 (1)记超声波检查结果不正常者患有该疾病的概 率为p,求p的估计值; (2)根据小概率值α=0.001的独立性检验,分析 超声波检查结果是否与患该疾病有关. P(χ2≥k) 0.050 0.010 0.001 k 3.841 6.635 10.828 附:χ2= n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) 学习至此,请完成配套训练 课时冲关五十 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀪋 􀅰771􀅰                                                   上篇:第八章 统计与成对数据的统计分析

资源预览图

第3节 成对数据的统计分析-【创新教程】2026年高考数学艺考生文化课百日冲关学生用书
1
第3节 成对数据的统计分析-【创新教程】2026年高考数学艺考生文化课百日冲关学生用书
2
第3节 成对数据的统计分析-【创新教程】2026年高考数学艺考生文化课百日冲关学生用书
3
所属专辑
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。