内容正文:
单元复习课件
第9章统计
苏教版选择性必修二·高二
学习内容导览
单元知识图谱
2
单元复习目标
1
3
考点串讲
针对训练
5
题型剖析
4
6
课堂总结
能区分正相关、负相关、不相关,会根据散点图判断变量相关类型;理解变量的相关性,会计算相关系数并判断相关关系的强弱。
掌握2×2列联表构造,熟记卡方公式,会依据临界值表完成独立性检验。
熟记样本中心点、线性回归系数计算公式,熟练求回归直线方程,理解回归直线必过样本中心点;
单元学习目标
第9章 统计
│
├─ 9.1 线性回归分析
│ ├─ 9.1.1 变量的相关性
│ │ ├─ 散点图
│ │ ├─ 正相关、负相关、不相关
│ │ └─ 相关系数 r(公式与判断标准)
│ └─ 9.1.2 线性回归方程
│ ├─ 最小二乘法思想
│ ├─ 回归方程 = a + bx
│ ├─ 系数计算公式
│ └─ 预测与应用
9.2 独立性检验
├─ 2×2列联表
├─ 独立性检验的基本思想
├─ 卡方统计量 χ² 公式
└─ 临界值与结论判断
单元知识图谱
知识模块 关键公式 核心注意点
相关系数 |r|越接近1,线性相关越强;r>0正相关,r<0负相关
回归方程 ,其中 , 回归直线必过样本中心点
独立性检验 与临界值比较:χ²≥3.841→有95%把握;χ²≥6.635→有99%把握
【知识串联讲解要点】
考点串讲
考点一:变量的相关性(9.1.1)
判断方法 内容
①散点图 点从左下到右上→正相关;左上到右下→负相关;散乱无规律→不相关
②相关系数 正相关,负相关;越接近,线性相关程度越强
1. 相关系数 r
项目 内容
相关系数计算公式
核心取值范围
线性相关程度判断 越接近,变量的线性相关程度越强;越接近,线性相关程度越弱
正负相关判定 时,变量为正相关;时,变量为负相关
2、易错提醒:
相关≠因果,相关只是统计规律,不能直接判定变量有因果关系。
考点串讲
考点二:线性回归方程(9.1.2,本章计算重点)
项目 内容
样本均值
回归系数
回归方程 ,直线必过样本中心点
实际应用 已知,代入求,为的预报值
易错提醒 ①,公式顺序不可颠倒;②预报值为估计值,不等于真实数据
考点串讲
考点三:独立性检验(9.2)
项目 内容
①列列联表
②公式
③临界判定常用: :有95%把握认为两变量有关:有99%把握认为两变量有关:无充分证据判定有关
考点串讲
题型一:对相关性和回归方程的理解
例1. (2026高三下·杭州模拟)对四组数据进行统计,获得以下散点图,将四组数据相应的相关系数进行比较,正确的是()
的研究
:散点从左下到右上,正相关,点最集中,相关性最强,:散点从左下到右上,正相关,点分散程度大于,
的研究
散点从左上到右下,负相关,(点更集中,负相关更强,数值更小)
结论
,选A
题型剖析
题型一:对相关性和回归方程的理解
例2. “明数理”数学兴趣小组通过调查,整理出天津市三月份每日最高气温与最低气温的数据,绘制了气温与日期关系的散点图,并进行统计学分析,下列说法正确的是
A.小明根据散点图判断气温与日期无相关关系
B.小华利用最小二乘法计算最高气温与日期的经验回归方程为y=-0.69x+2.92,其中x为日期(3月1日为x=1,3月31日为x=31)
C.小红计算出最低气温与日期的相关系数为0.9397,以此判断两者的相关程度很弱
D.小强判断无论是最高气温与日期,还是最低气温与日期都正线性相关
A
散点整体向上→气温和日期存在正线性相关关系,并非无相关关系,因此小明的判断错误。
B
回归方程y=-0.69x+2.92斜率为负→负相关,和图像正相关矛盾,错
C
相关系数r=0.9397,|r|接近1→高度线性相关,不是相关程度弱,错
D
日期变大,最高、最低气温整体上升,都呈正线性相关,正确
题型剖析
题型一:对相关性和回归方程的理解
例3. (2026·河西模拟)某研究小组为了探究变量x与y之间的线性相关关系,收集了5组数据( )(i=1,2,3,4,5),并绘制成如图所示的散点图(点A,B,C,D,E)。经计算,这5组数据的样本相关系数为r。若去掉点E(10,2)后,剩余4组数据的样本相关系数为r',则下列结论正确的是()A.0<r<r'<1 B.r'<r<0 C.r<1<r' D.0<r'<r<1
正相关
A,B,C,D四点呈明显正相关,E(10,2)是异常偏离点,去掉E后相关系数由r变为r'。 变量x,y正相关:r>0,r'>0
比较
异常点E削弱线性相关性,去掉E后相关性变强,|r'|>|r|,即0<r<r'<1
题型剖析
题型一:对相关性和回归方程的理解
例4.下列说法中不正确的是()
A.一组数据47,48,49,53,54,56,58,59的上四分位数为57
B.在成对样本数据分析中相关系数r=0,表示两个变量之间没有线性相关关系
C.根据线性回归方程得到预测值为=33.993时的观测值为34,则残差为0.007
D.将总体划分为三层,通过分层抽样,得到三层的样本平均数和样本方差分别为,和,若,则总体方差( )
选项A
数据:47,48,49,53,54,56,58,59,共n=8 上四分位数位置:i=×8=6,取第6项和第7项平均:=57,A正确
选项B
相关系数r=0⇔无线性相关(可能有非线性相关),B正确
选项C
残差公式:,=33.993,e=34-33.993=0.007,C正确
选项D
分层抽样总方差不能直接写成(无样本量相等条件),D错误
题型剖析
题型二:相关系数及回归方程计算
例5. (2026·成都模拟)2025年,我国能源安全保障能力再上新台阶,全口径发电量占全球总发电量的30.4%,稳居世界第一,为智能算力的爆发性电力需求持续提供稳定保障.某学习小组收集了2021年至2025年我国全口径发电量相关数据,根据数据制作了如下数据表格和散点图.
年份 2021 2022 2023 2024 2025
年份代码
我国全口径发电量(单位:万亿千瓦时)
注:年份代码1-5分别对应2021-2025 (1) 由散点图看出,可用线性回归模型拟合y与x的关系,请用相关系数加以说明; (2) 建立y关于x的经验回归方程,并预测2026年我国全口径发电量.
参考数据:.
参考公式:
,相关系数.
题型剖析
(1) 应用相关系数
基本量
:
公式
应用
∵r非常接近1,∴y与x高度正线性相关,可用线性回归模型拟合。
(2) 求回归方程+预测
①求𝒃 ̂:
②求:
方程 ̂:
经验回归方程:
估值 ̂:
③2026对应年份代码x=6:=0.536×6+7.892=3.216+7.892=11.108
预测:2026年发电量约11.108万亿千瓦时。
题型二:相关系数及回归方程计算
例6. (2026·长安模拟)直播带货是一种直播和电商相结合的销售手段,目前已被广大消费者所接受.针对这种现状,某公司决定逐月加大直播带货的投入,直播带货金额稳步提升,以下是该公司2023年前5个月的带货金额:
1.计算变量x,y的相关系数r(结果精确到0.01).
2.求变量x,y之间的线性回归方程,并据此预测2023年6月份该公司的直播带货金额.
月份
带货金额万元
参考数据:
参考公式:
,相关系数.
题型剖析
(1) 求相关系数r
(2) 求回归方程+预测
① ② 回归方程:
③6月对应: (万元)
回归直线必过 ,可用于检验计算是否正确
2. 预测时x的取值应在样本数据范围内或附近,不可随意外推
3. 区分”回归方程”与”预测值”:前者是关系式,后者是代入后的结果
反思感悟
题型三:独立性检验
例7. (2026·湖南模拟)在脑机接口技术实验中,研究人员为验证不同思维任务下,两个大脑的信号同步性是否独立,研究人员选取了200组观测数据,聚焦于“逻辑推理”与“创造性想象”两类任务,记录了两位受试者脑电信号的同步情况,得到了如下列联表:
思维任务类型 信号同步 信号不同步 合计
逻辑推理 42 58 100
创造性想象 28 72 100
合计 70 130 200
1.分别计算两类任务中信号同步的频率,根据频率,你认为思维任务类型与信号同步性有关吗?简述理由。
2.根据小概率值α=0.01的独立性检验,分析思维任务类型与信号同步性有关吗?
附:
0.050 0.010 0.001
3.841 6.635 10.828
题型剖析
(1) 频率计算与定性判断
逻辑推理任务信号同步频率:=0.42
创造性想象任务信号同步频率:=0.28 ∵ 两个频率0.42与0.28相差较大, ∴ 直观判断:思维任务类型与信号同步性有关。
(2) 独立性检验
设
临界值=6.635,∵≈4.396<6.635, ∴ 没有充分证据推翻原假设,即在α=0.01下,不能认为思维任务类型与信号同步性有关。
题型三:独立性检验
例8. (2026·成都模拟)国民体质是国家和社会发展的重要基础.为贯彻落实《“健康中国2030”规划纲要》《体育强国建设纲要》,2025年国家体育总局开展了第六次全国国民体质监测工作,旨在提高国民体质和健康水平,促进国家经济建设和社会发展.《国民体质测定标准(2023年修订)》将体质情况综合评级为优秀、良好、合格和不合格四个等级.某地区为了解国民体质情况是否与爱好运动有关,从该地区体质达到“合格”及以上的人群中随机抽取了200人进行问卷调查,得到如下列联表:
附:
0.050 0.010 0.001
3.841 6.635 10.828
组别 合格 良好及以上 合计
爱好运动
不爱好运动
合计
1.求b,c的值,并依据小概率值α=0.01的独立性检验,分析体质情况是否与爱好运动有关;2.在体质情况综合评级为“合格”的对象中,按是否爱好运动进行分层,用比例分配的分层随机抽样方法,从样本中抽取6人作进一步调查,再从这6人中随机抽取2人线下访谈,记这2人中“爱好运动”的人数为,求的分布列及数学期望.
题型剖析
(1) 求b,c与独立性检验
① 求b,c
b=150-80=70, 不爱好运动总人数:200-150=50,c=50-10=40
组别 合格 良好及以上 合计
爱好运动
不爱好运动
合计 120 80
② 计算卡方
, 在下,拒绝独立性原假设,认为体质情况与爱好运动有关。
(2) 分布列与期望
分布列
数学期望
E(X)=
1.对于变量x与y,当x取值一定时,y的取值带有一定的随机性,x,y之间的这种非确定性关系称为( )
A. 函数关系 B. 线性关系 C. 相关关系 D. 回归关系
关系类型 定义 特征
函数关系 y由x唯一确定 确定性关系,无随机性
相关关系 y受x影响但x不能唯一确定y 非确定性关系,有随机性
线性关系 相关关系的一种特殊形式 散点大致呈直线分布
回归关系 不是标准统计术语 回归分析是研究相关关系的方法
答案:C. 相关关系
针对训练
2.两个变量的相关关系有①正相关,②负相关,③不相关,则下列散点图从左到右分别反映的变量间的相关关系是( )
A. ①②③ B. ②③① C. ②①③ D. ①③②
散点图 特征描述 对应关系
图(1) 点从左下向右上分布,呈上升趋势 ① 正相关
图(2) 点杂乱无章,无明显趋势 ③ 不相关
图(3) 点从左上向右下分布,呈下降趋势 ② 负相关
答案:D. ①③②
针对训练
3.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用过血清的人一年中的感冒记录进行比较,提出假设H₀:这种血清不能起到预防感冒的作用。利用2×2列联表计算得 χ²≈3.918,经查临界值表知 P(χ²≥3.841)≈0.05。对此,有以下四个结论,正确的是( )
有95%的把握可以认为”这种血清能起到预防感冒的作用”
B. 若某人未使用该血清,那么他在一年中有95%的可能性得感冒
C. 这种血清预防感冒的有效率为95%
D. 这种血清预防感冒的有效率为5%
针对训练
项目 内容
原假设 H₀ 血清不能预防感冒(即”使用血清”与”是否感冒”独立)
计算结果 χ² ≈ 3.918
临界值 χ²₀.₀₅ = 3.841(对应P=0.05)
比较 3.918 > 3.841
第一步:理解独立性检验的逻辑
第二步:做出统计推断
由于 χ² ≈ 3.918 > 3.841,说明: 在犯错误的概率不超过 5% 的前提下,可以拒绝 H₀ 即有 95%的把握 认为”使用血清”与”是否感冒”有关联 也就是有 95%的把握 认为”这种血清能起到预防感冒的作用”
第三步:逐项分析
选项 判断 理由
A ✅ 正确 符合独立性检验结论的规范表述
B ❌ 错误 95%是统计推断的置信度,不是个人得感冒的概率
C ❌ 错误 独立性检验不能得出”有效率”的具体数值
D ❌ 错误 同理,不能得出有效率的具体数值
4.在一组样本数据 (n≥2, 不全相等)的散点图中,若所有样本点 (i=1, 2, …, n)都在直线 上,则这组样本数据的相关系数为( )
A. -1 B. 0 C. D. 1
情况 r 的值
完全正线性相关(所有点在一条上升直线上) r = 1
完全负线性相关(所有点在一条下降直线上) r = -1
无线性相关 r = 0
结论: 选 D.
针对训练
5.有甲、乙两个班级进行数学考试,按照大于或等于85分为优秀,85分以下为非优秀统计成绩,得到如下列联表:
班级 优秀 非优秀 合计
甲班 10 b
乙班 c 30
合计 105
已知在全部105人中随机抽取1人,成绩优秀的概率为 ,则下列说法正确的是( )
A. 列联表中 c 的值为30,b 的值为35
B. 列联表中 c 的值为20,b 的值为45
C. 根据列联表中的数据,有95%的把握认为”成绩与班级有关系”
D. 根据列联表中的数据,没有95%的把握认为”成绩与班级有关系”
针对训练
第一步:求 b 和 c 的值
由题意,优秀的概率为 2/7,总人数为105人。优秀总人数:"优秀人数"=105×=30
所以:10+c=30⇒ c=20.非优秀总人数:"非优秀人数"=105-30=75
所以:b+30=75⇒b=45
班级 优秀 非优秀 合计
甲班 10 45 55
乙班 20 30 50
合计 30 75 105
判断A、B选项: A:c=30, b=35 ❌ 错误 B:c=20, b=45 ✅ 正确
第二步:独立性检验
提出假设: H₀:成绩与班级无关
计算 χ² 值:
,代值得,
≈6.109
查表比较:≈6.109>3.841
所以有 95%的把握 认为”成绩与班级有关系”。
判断C、D选项: C:有95%的把握认为”成绩与班级有关系” ✅ 正确 D:没有95%的把握 ❌ 错误
最终答案B、C
1. 三大主干回顾
相关性:散点图+相关系数判正负相关;
线性回归:记准公式,回归直线必过,用方程做数值预报;
独立性检验:列2×2列联表→算→对比临界值下统计结论。
课堂总结
2.常见错误提醒
相关系数与回归系数混淆
忘记样本中心点在回归直线上
χ² 计算公式中交叉项位置出错
结论表述不严谨(不说“因果”,说“有关/无关”)
课堂总结
3.方法口诀
相关分析看散点,r值正负定方向;
回归方程过中心,代入预测要当心;
独立性检验四步走,卡方计算要记熟;
统计结论不绝对,把握程度来表达。
课堂总结
感谢聆听!
$