第八章 成对数据的统计分析 章末综合提升-【金版新学案】2025-2026学年高中数学选择性必修第三册同步课堂高效讲义配套课件PPT(人教A版)
2026-03-25
|
84页
|
56人阅读
|
3人下载
教辅
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学人教A版选择性必修第三册 |
| 年级 | 高二 |
| 章节 | 小结 |
| 类型 | 课件 |
| 知识点 | - |
| 使用场景 | 同步教学-单元练习 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | PPTX |
| 文件大小 | 7.53 MB |
| 发布时间 | 2026-03-25 |
| 更新时间 | 2026-03-25 |
| 作者 | 山东正禾大教育科技有限公司 |
| 品牌系列 | 金版新学案·高中同步导学 |
| 审核时间 | 2026-02-15 |
| 下载链接 | https://m.zxxk.com/soft/56471694.html |
| 价格 | 4.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
该高中数学单元复习课件系统梳理了成对数据的统计分析核心内容,涵盖相关与回归(线性相关条件、样本相关系数、回归模型及最小二乘法)和独立性检验(分类变量、列联表、卡方检验),通过知识框架图将知识点逻辑串联,帮助学生构建完整的统计分析知识网络。
其亮点在于采用“分层探究-教考衔接-精准检测”的复习策略,如通过氮氧化物排放量折线图分析线性相关性,结合高考真题溯源教材,培养学生数学眼光和逻辑推理能力。分层例题与检测题设计满足不同学生需求,助力教师精准教学,有效巩固统计分析知识与应用能力。
内容正文:
章末综合提升
第八章 成对数据的统计分析
体系构建
1
分层探究
2
教考衔接
3
内容索引
单元检测卷
4
体系构建
返回
返回
分层探究
返回
探究点一 线性回归分析
氮氧化物是一种常见的大气污染物,下图为我国2016年至2024年氮氧化物排放量(单位:万吨)的折线图,其中年份代码1~9分别对应年份2016~2024.
已知yi≈12 000,≈1 100,
≈7.7,tiyi≈51 800.
(1)可否用线性回归模型拟合y与t的关系?请分别根据折线图和相关系数加以说明.
典例
1
解:从折线图看,各点落在一条直线附近,因而可以用线性回归模型拟合
y与t的关系,依题意,知=(1+2+3+4+5+6+7+8+9)=5,
相关系数r=≈=-≈-0.97.
故可以用线性回归模型拟合y与t的关系.
(2)若根据所给数据建立回归模型=-138t+2 023,可否用此模型来预测2026年和2036年我国的氮氧化物排放量?请说明理由.
附:相关系数r=.
解:可以预测2026年的氮氧化物排放量,但不可以
预测2036年的氮氧化物排放量.
理由如下:
①2026年与所给数据的年份较接近,因而可以认为
短期内氮氧化物排放量将延续该趋势,故可以用此模型进行预测;
②2036年与所给数据的年份相距过远,而影响氮氧化物排放量的因素有很多,这些因素在短期内可能保持不变,但从长期看很有可能会变化,因而用此模型预测可能是不准确的.
规律方法
解决回归分析问题的一般步骤
第1步:画散点图.根据已知数据画出散点图;
第2步:判断变量的相关性并求线性回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出线性回归方程;
第3步:实际应用.依据求得的线性回归方程解决实际问题.
对点练1.某机构统计了新驾驶员一年内扣除的驾照分x(单位:分)及该年对应的新驾驶员数量y(单位:万人),得到如下数据表格:
已知x与y线性相关.
(1)求y关于x的线性回归方程;
新驾驶员一年内扣除的驾照分x(分) 3 4 5 6 7
新驾驶员数量y(万人) 1 1.1 1.5 1.9 2.2
解:由=×(3+4+5+6+7)=5,=×(1+1.1+1.5+1.9+2.2)=1.54,
有==0.32,=1.54-0.32×5=-0.06,
故y关于x的线性回归方程为=0.32x-0.06.
(2)求y与x的相关系数(精确到0.01).
参考数据:=135,=12.91,xiyi=41.7,≈0.493.
参考公式:相关系数r=,对于一组具有线性相关关系的数据(xi,yi)(i=1,2,…,n),其回归直线=x+的斜率和截距的最小二乘估计公式分别为==,=-.
新驾驶员一年内扣除的驾照分x(分) 3 4 5 6 7
新驾驶员数量y(万人) 1 1.1 1.5 1.9 2.2
解:y与x的相关系数
r=
=
=≈2×0.493≈0.99.
新驾驶员一年内扣除的驾照分x(分) 3 4 5 6 7
新驾驶员数量y(万人) 1 1.1 1.5 1.9 2.2
探究点二 独立性检验
为了解某校男生1 000米测试成绩与身高的关系,从该校2 000名男生中随机抽取100人,得到测试成绩与身高的数据如下表所示:
(1)该校2 000名男生中身高在175 cm及以上的人数约为多少?
典例
2
身高范围 (cm)
测试成绩 [160,165) [165,170) [170,175) [175,180) [180,185)
合格 3 12 18 22 15
不合格 2 9 5 5 9
解:样本中,身高在175 cm及以上的频率为=0.51,
用该频率估计该校男生身高在175 cm及以上的概率,
则该校2 000名男生中身高在175 cm及以上的人数约为2 000×0.51=
1 020(人).
身高范围 (cm)
测试成绩 [160,165) [165,170) [170,175) [175,180) [180,185)
合格 3 12 18 22 15
不合格 2 9 5 5 9
(2)根据表中数据,依据小概率值α=0.05的独立性检验,分析体育成绩合格与身高在[170,180)范围内是否有关.
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.01 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
解:列2×2列联表如下:
零假设为H0:体育成绩合格与身高在[170,180)范围内无关联.
根据列联表中的数据,经计算得到χ2=≈4.762>3.841=x0.05,
根据小概率值α=0.05的独立性检验,可以推断H0不成立,因此可以认为体育成绩合格与身高在[170, 180)范围内有关,此判断犯错误的概率不大于0.05.
身高在[170,180) 身高不在[170,180) 合计
合格 40 30 70
不合格 10 20 30
合计 50 50 100
规律方法
独立性检验问题的一般步骤
第1步:认真读题,指出相关数据,得出2×2列联表;
第2步:根据2×2列联表中的数据,计算统计量χ2;
第3步:通过统计量χ2与已知临界值的比较判断“X与Y有关系”的把握的大小.
对点练2.近年来,解放军强军兴军的深刻变化,感召了越来越多的高中优秀青年学子献身国防,投身军营.2024年高考,很多高考毕业学生报考了军事类院校.从某地区内学校的高三年级中随机抽取了900名学生,其中男生500人,女生400人,通过调查,有报考军事类院校意向的男生、女生各100名.
(1)完成给出的列联表,并分别估计该地区高三男、女学生有报考军事类院校意向的概率;
有报考意向 无报考意向 合计
男生
女生
合计
解:根据已知条件,填写2×2列联表如下:
男生有报考军事类院校意向的概率为=,
女生有报考军事类院校意向的概率为=.
有报考意向 无报考意向 合计
男生 100 400 500
女生 100 300 400
合计 200 700 900
(2)根据小概率值α=0.10的独立性检验,能否认为学生有报考军事类院校的意愿与性别有关.
α 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001
xα 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828
解:零假设为H0:学生有报考军事类院校的意愿与性别无关联.
根据列联表中的数据,经计算得到χ2=≈3.214>2.706=x0.10,
根据小概率值α=0.10的独立性检验,推断H0不成立,因此可以认为学生有报考军事类院校的意愿与性别有关,此判断犯错误的概率不大于0.10.
返回
参考公式及数据:χ2=,n=a+b+c+d.
教考衔接
返回
(2024·天津卷)下列图中,线性相关系数最大的是
真题
1
√
选项A中的散点有明显的从左下角到右上角沿直线分布的趋势,且散点集中在一条直线的附近.故选项A中的线性相关系数最大.故选A.
溯源:(人教A版P100图8.1-5)
点评:教材中图8.1-5旨在通过相关系数大小之间的关系让学生感悟散点图的直观显示,而真题直接抛弃了数据关系,直接给出变量间的直观显示,反推相关系数的大小之间的关系,二者考查本质几乎相同,体现了真题来源于教材而高于教材的命题规则.
(2024·上海卷)已知气候温度和海水表层温度相关,且相关系数为正数,对此描述正确的是
A.气候温度高,海水表层温度就高
B.气候温度高,海水表层温度就低
C.随着气候温度由低到高,海水表层温度呈上升趋势
D.随着气候温度由低到高,海水表层温度呈下降趋势
真题
2
√
对于A,B,当气候温度高,海水表层温度变高变低不确定,故A,B错误.对于C,D,因为相关系数为正,故随着气候温度由低到高时,海水表层温度呈上升趋势,故C正确,D错误.故选C.
溯源:(人教A版P96T3)下表给出了一些地区的鸟的种类数与该地区的海拔高度的数据,鸟的种类数与海拔高度是否存在相关关系?如果是,那么这种相关关系有什么特点?
点评:教材习题让学生观察到随着海拔高度的降低,鸟的种类数量有减少的趋势,两变量正相关,而真题考查气候问题与海水温度之间的相关关系,二者都是研究变量间的相关关系,是教材习题的变式的典范.
地区 A B C D E F G H I J K
海拔高度/m 1 250 1 158 1 067 457 701 731 610 670 1 493 762 549
鸟的种类/种 36 30 37 11 11 13 17 13 29 4 15
(2024·全国甲卷(理))某工厂进行生产线智能化升级改造.升级改造后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据
如下:
(1)填写如下列联表:
能否有95%的把握认为甲、乙两车间产品的优级品率存在差异?能否有
99%的把握认为甲、乙两车间产品的优级品率存在差异?
真题
3
优级品 合格品 不合格品 总计
甲车间 26 24 0 50
乙车间 70 28 2 100
总计 96 52 2 150
优级品 非优级品
甲车间
乙车间
解:填写如下列联表:
则完整的2×2列联表如下:
优级品 非优级品
甲车间 26 24
乙车间 70 30
优级品 非优级品 总计
甲车间 26 24 50
乙车间 70 30 100
总计 96 54 150
χ2==4.687 5.
因为χ2=4.687 5>3.841,所以有95%的把握认为甲、乙两车间产品的优级品率存在差异;
因为χ2=4.687 5<6.635,所以没有99%的把握认为甲、乙两车间产品的优级品率存在差异.
(2)已知升级改造前该工厂产品的优级品率p=0.5.设为升级改造后抽取的n件产品的优级品率.如果>p+1.65,则认为该工厂产品的优级品率提高了.根据抽取的150件产品的数据,能否认为生产线智能化升级改造后,该工厂产品的优级品率提高了?(≈12.247)
附:χ2=,n=a+b+c+d.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
解:由题意可知==0.64,
又p+1.65=0.5+1.65×≈0.5+1.65×≈0.57,
所以>p+1.65,所以能认为生产线智能化升级改造后,该工厂产品的优级品率提高了.
α 0.050 0.010 0.001
xα 3.841 6.635 10.828
溯源:(人教A版P132例3)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到了如下数据:抽到接受甲种疗法的患儿67名,其中未治愈15名,治愈52名;抽到接受乙种疗法的患儿69名,其中未治愈6名,治愈63名.试根据小概率值α=0.005的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
(P134练习T1)对于例3中的抽样数据,采用小概率值α=0.05的独立性检验,分析乙种疗法的效果是否比甲种疗法好.
点评:教材例题与习题采用不同的小概率值,研究同一对成对数据之间的关联性,而真题也同样从95%的把握和99%的把握研究两个变量之间关联性问题,典型的换汤不换药,这也是教材习题的另一种变式.
返回
单元检测卷
返回
1.关于回归分析,下列说法错误的是
A.回归分析是研究两个具有相关关系的变量的方法
B.运用最小二乘法求得的回归直线一定过点(,)
C.回归模型中一定存在随机误差
D.散点图能明确反映变量间的关系
对于A,回归分析是研究两个具有相关关系的变量的方法,故A说法正确;对于B,运用最小二乘法求得的回归直线一定过点(,),故B说法正确;对于C,因为相关关系是一种非确定关系,所以回归模型中一定存在随机误差,故C说法正确;对于D,散点图反映的是两个变量间的关系,但存在误差,故D说法错误.故选D.
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
2.根据分类变量X与Y的成对样本数据,计算得到χ2=6.147,依据小概率值α=0.01的独立性检验(x0.01=6.635),可推断
A.变量X与Y不独立
B.变量X与Y不独立,此推断犯错误的概率不超过0.01
C.无法判断变量X与Y是否独立
D.变量X与Y独立
√
零假设为H0:变量X与Y独立.因为χ2=6.147<6.635=x0.01,所以依据小概率值α=0.01的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,即认为变量X与Y独立.故选D.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
3.已知一组数据(xi,yi)(1≤i≤10且i∈Z)的线性回归方程为=7x+a,若xi=70,yi=500,则a的值为
A.-1 B.0
C.1 D.2
√
由于xi=70,yi=500,所以=7,=50.将(7,50)代入=7x+a,所以7×7+a=50,解得a=1.故选C.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
4.有甲、乙两种过滤水中重金属的设备,为了检验使用这两种设备与过滤后水中重金属含量的关系,各过滤了15瓶受重金属污染的相同水体,调查得出以下数据:
根据以上数据,则χ2=
A. B.
C. D.
√
重金属含量高 重金属含量低
设备甲 6 9
设备乙 1 14
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
依题意,得如下2×2列联表:
所以χ2==.故选A.
重金属含量高 重金属含量低 合计
设备甲 6 9 15
设备乙 1 14 15
合计 7 23 30
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
5.为了了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到统计数据表:
根据上表可得线性回归方程=0.76x+.据此估计,该社区一户年收入为15万元家庭的年支出为
A.11.4万元 B.11.8万元
C.12.0万元 D.12.2万元
√
年收入x/万元 8.2 8.6 10.0 11.3 11.9
年支出y/万元 6.2 7.5 8.0 8.5 9.8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
因为==10,==8,所以=-0.76=8-0.76×10=0.4,所以=0.76x+0.4.当 x=15时,y=0.4+0.76×15=11.8.故选B.
年收入x/万元 8.2 8.6 10.0 11.3 11.9
年支出y/万元 6.2 7.5 8.0 8.5 9.8
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
6.假设有两个分类变量X与Y,它们的可能取值分别为和,其2×2列联表为
则下列选项中使X与Y的关系最弱的m的取值为
A.8 B.9
C.14 D.19
√
Y
X y1 y2 总计
x1 10 18 28
x2 m 26 m+26
总计 m+10 44 m+54
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
在两个分类变量的列联表中,当的值越小时,认为两个分类变量有关的可能性越小.令=0,得10×26=18m,解得m≈14.4,又m为整数,所以当m=14时,X与Y的关系最弱.故选C.
Y
X y1 y2 总计
x1 10 18 28
x2 m 26 m+26
总计 m+10 44 m+54
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
7.已知由样本数据(xi,yi)(i=1,2,3,…,10)组成的一个样本,变量x,y具有线性相关关系,其线性回归方程为=x+,并计算出变量x,y之间的相关系数为-0.96,xi=-8,yi=-15,则线性回归直线经过
A.第一、二、三象限 B.第二、三、四象限
C.第一、二、四象限 D.第一、三、四象限
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
由相关系数为-0.96,知x,y负相关,所以<0.又xi=-8,yi=-15,求得样本中心点为(-0.8,-1.5),由于(-0.8,-1.5)在经验回归直线上,且点在第三象限,所以经验回归直线经过第二、三、四象限.故选B.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
8.假设有两个变量X和Y的2×2列联表如下:χ2==n(-)(-).对于同一样本,以下数据能说明X和Y有关系的可能性最大的一组是
A.a=45,c=15 B.a=40,c=20
C.a=35,c=25 D.a=30,c=30
Y
X y1 y2 总计
x1 a 10 a+10
x2 c 30 c+30
总计 60 40 100
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
根据独立性检验的方法和2×2列联表可得,当相差越大,则分类变量X和Y有关系的可能性越大,即a,c相差越大,相差越大.由各选项可得A满足条件.故选A.
Y
X y1 y2 总计
x1 a 10 a+10
x2 c 30 c+30
总计 60 40 100
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
9.下面各图中,散点图与样本相关系数r符合的有
√
√
√
对于A,散点图上所有点都在一条斜率小于0的直线上,所以样本相关系数r=-1,故A正确;对于B,散点图上所有点都在一条斜率大于0的直线上, 所以样本相关系数r=1,故B错误;对于C,散点图上所有点从左到右是向下的带状分布,所以-1<r<0,故C正确;对于D,散点图中x,y之间几乎不存在线性相关关系,所以样本相关系数r=0,故D正确. 故选ACD.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
10.某公司过去五个月的广告费支出x (单位:万元)与销售额y(单位:万元)之间有下列对应数据:
工作人员不慎将表格中y的第一个数据丢失.已知y与x具有线性相关关系,且线性回归方程为=6.5x+17.5,则下列说法正确的有
A.销售额y与广告费支出x正相关
B.丢失的数据(表中▲处)为30
C.该公司广告费支出每增加1万元,销售额一定增加6.5万元
D.若该公司下月广告费支出为8万元,则销售额约为75万元
广告费支出x / 万元 2 4 5 6 8
销售额y/ 万元 ▲ 40 60 50 70
√
√
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
对于A,由线性回归方程为=6.5x+17.5,可知=6.5,则销售额y与广告费支出x正相关,故A正确;对于B,设丢失的数据为m,由表中的数据可得=5,=,把点(5,)的坐标代入线性回归方程,可得=6.5×5+17.5,解得m=30,故B正确;对于C,该公司广告费支出每增加1万元,销售额不一定增加6.5万元,故C不正确;对于D,若该公司下月广告费支出为8万元,则销售额约为6.5×8+17.5=69.5(万元),故D不正确.故选AB.
广告费支出x / 万元 2 4 5 6 8
销售额y/ 万元 ▲ 40 60 50 70
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
11.某中学为更好地开展素质教育,现对外出研学课程是否和性别有关做了一项调查,其中被调查的男生和女生人数相同,且男生中选修外出研学课程的人数占男生总人数的,女生中选修外出研学课程的人数占女生总人数的.如果依据α=0.05的独立性检验认为选修外出研学课程与性别有关,但依据小概率α=0.01的独立性检验认为选修外出研学课程与性别无关,则调查人数中男生可能有
附:
χ2=,其中n=a+b+c+d.
A.150人 B.225人 C.300人 D.375人
√
√
α 0.05 0.01
xα 3.841 6.635
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
设男生人数为5n(n∈N*),根据题意可得2×2列联表如下:
则χ2==,根据小概率值α=0.05的独立性检验,认为选修外出研学课程与性别有关,但根据α=0.01的独立性检验,认为选修外出研学课程与性别无关,则3.841≤<6.635,解得38.025 9≤n<65.686 5,则190.129 5≤5n<328.432 5.故选BC.
k
男生 女生 合计
选修外出研学课程 3n
不选修外出研学课程 2n
合计 5n 5n 10n
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
12.某单位通过对数据的统计与分析得知,日用电量y(单位:度)与当天的平均气温x (单位:℃)之间具有线性相关关系,且y关于x 的线性回归方程为=-2x+60.据此可以预测,当某天的平均气温为-4 ℃时,日用电量的度数估计为_____.
68
由线性回归方程知,当某天的平均气温为-4 ℃时,日用电量的度数估计为-2×(-4)+60=68.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
13.为了考察某种药物预防疾病的效果,进行动物试验,得到了如下的列联表:
依据小概率α=0.01的独立性检验认为这种药物对预防疾病_____效果(填“有”或“无”).
是否服用药 是否患病 总计
患病 未患病
服用药 10 46 56
没服用药 22 32 54
总计 32 78 110
有
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
因为χ2=≈6.979>6.635,所以根据小概率值α=0.01的独立性检验认为这种药物对预防疾病有效果.
是否服用药 是否患病 总计
患病 未患病
服用药 10 46 56
没服用药 22 32 54
总计 32 78 110
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
14.将某保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中6个区域,统计这些区域内的某种水源指标xi和某植物分布的数量yi(i=1,2,…,6),得到样本(xi,yi),且其相关系数r=,记y关于x的线性回归方程为=+x.经计算可知:=9,=550,(yi-)2=256,则=_____.
参考公式:=,r=.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
因为=9,=550,所以(xi-)2=-6=550-6×92=64,由r===,解得(xi-)(yi-)=120,所以===.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
15.(本小题满分13分)某水果店对某个新品种水果进行试销,需了解试销价格x(单位:元/斤)对销售量y(单位:斤)的影响情况,现得到5对销售数据,并对得到的数据进行初步处理,得到如图所示的散点图.
(1)由散点图看出,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明;(结果精确到0.01)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:依题意,得==5,==14,
(xi-)2=10,(yi-)2=112,(xi-)(yi-)=-32,
所以r==≈-0.96,
由样本相关系数r≈-0.96,可以推断y与x这两个变量负相关,且线性相关程度很强,从而可以用线性回归模型拟合y与x的关系.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)求y关于x的线性回归方程.
参考数据:≈8.367.
解:由(1)可得==-=-3.2,=-=14-
(-3.2)×5=30,
所以=-3.2x+30.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
16.(本小题满分15分)为了给学生提供更为丰富的校园文化生活,学校增设了两门全新的课程A,B,学生根据自己的兴趣爱好在这两门课程中任选一门进行学习.学校统计了学生的选课情况,得到如下表格.
(1)根据上表,依据小概率值α=0.005的独立性检验,分析选择课程与性别是否有关联.
选择课程A 选择课程B
男生 40 60
女生 20 80
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:零假设为H0:选择课程与性别无关.
根据列联表中的数据,经计算得到
χ2==≈9.524>7.879=x0.005.
根据小概率值α=0.005的独立性检验,我们推断H0不成立,即认为选择课程与性别有关联,此推断犯错误的概率不大于0.005.
选择课程A 选择课程B
男生 40 60
女生 20 80
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)现从男生的样本中,按分层抽样的方法选出5人组成一个小组,再从这5名男生中抽取3人做问卷调查,求这3人中选择课程B的人数比选择课程A的人数多的概率.
附:χ2=.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:选出的5名男生中,选择课程A的人数为5×=2,
选择课程B的人数为5×=3,
这3人中选择课程B的人数比选择课程A的人数多有如下两种可能:
选择课程B有3人,选择课程A有0人,此种有种选法;
选择课程B有2人,选择课程A有1人,此种有种选法;
记“这3人中选择课程B的人数比选择课程A的人数多”为事件M,
所以P(M)==.
α 0.05 0.01 0.005 0.001
xα 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
17.(本小题满分15分)为更好探索有机农业的发展,返乡新农人小王在试验田按有机标准改良土壤,经过了三年置换期后,在2017年采用轮作等方式种植有机胡萝卜,并记录了2017-2023年这7年的有机胡萝卜的亩产量,得到数据如下表.
(1)从这7年的有机胡萝卜的亩产数据中任取3年的数据,若至少有2年的亩产量不低于0.5吨/亩,求3年的亩产量都高于0.5吨/亩的概率;
年份 2017 2018 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5 6 7
亩产量y(吨/亩) 0.4 0.5 0.8 1.1 1.5 1.7 0.2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:由表知,这7年的有机胡萝卜的亩产数据中,有5年的亩产量不低于0.5吨/亩,2年的亩产量低于0.5吨/亩, 记A=“这7年中任取3年,至少有2年的亩产量不低于0.5吨/亩”,B=“这7年中任取3年,3年的亩产量都高于0.5吨/亩”,
年份 2017 2018 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5 6 7
亩产量y(吨/亩) 0.4 0.5 0.8 1.1 1.5 1.7 0.2
则P(A)==,P(AB)==,
所以P(B|A)===.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)已知这7年间有一年由于天气原因,导致胡萝卜损失很大.若剔除天气因素导致的异常,经计算,y与x有线性关系,求出该线性回归方程,并预测在排除气候因素影响的情况下,2025年小王的有机胡萝卜的亩产量.
附:=,=-.
解:由表可知,2023年的数据异常,剔除2023年的数据,
则剩余6年的数据中,==3.5,==1,
年份 2017 2018 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5 6 7
亩产量y(吨/亩) 0.4 0.5 0.8 1.1 1.5 1.7 0.2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(xi-)(yi-)=(1-3.5)(0.4-1)+(2-3.5)(0.5-1)+(3-3.5)(0.8-1)+(4-3.5)(1.1-1)+(5-3.5)(1.5-1)+(6-3.5)(1.7-1)=4.9,
(xi-)2=(1-3.5)2+(2-3.5)2+(3-3.5)2+(4-3.5)2+(5-3.5)2+(6-3.5)2=17.5,
所以===0.28,
年份 2017 2018 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5 6 7
亩产量y(吨/亩) 0.4 0.5 0.8 1.1 1.5 1.7 0.2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
所以=-=1-0.28×3.5=0.02,
所以y与x的经验回归方程为=0.28x+0.02.
当x=9时,=0.28×9+0.02=2.54(吨/亩).
所以在排除气候因素影响的情况下,预测2025年小王的有机胡萝卜的亩产量为2.54吨/亩.
年份 2017 2018 2019 2020 2021 2022 2023
年份代码x 1 2 3 4 5 6 7
亩产量y(吨/亩) 0.4 0.5 0.8 1.1 1.5 1.7 0.2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
18.(本小题满分17分)为了了解高中学生课后自主学习数学时间x(分钟/每天)和他们的数学成绩y(分)的关系,某实验小组做了调查,得到一些数据(表一).
表一:
(1)请用相关系数说明该组数据中变量y与变量x之间的关系可以用线性回
归模型拟合(结果精确到0.001);
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:==50,
==87,
r=
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
=
=,
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
又xiyi=22 820,xi的方差为200,yi的方差为230.8,≈1 074,
则r===≈≈0.996.
r值非常接近于1,故变量y与变量x之间的关系可以用线性回归模型拟合.
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)求y关于x的经验回归方程,并由此预测每天课后自主学习数学时间为100分钟时的数学成绩;
解:====1.07,
=-=87-1.07×50=33.5,
故=1.07x+33.5,当x=100时,=140.5,
故预测每天课后自主学习数学时间为100分钟时的数学成绩为140.5分.
编号 1 2 3 4 5
学习时间x 30 40 50 60 70
数学成绩y 65 78 85 99 108
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(3)基于上述调查,某校提倡学生周六在校自主学习.经过一学期的实施后,抽样调查了220位学生.按照是否参与周六在校自主学习以及成绩是否有进步统计,得到2×2列联表(表二).依据小概率值α=0.001的独立性检验分析“周六在校自主学习与成绩进步”是否有关联.
表二:
没有进步 有进步 合计
参与周六在校自主学习 35 130 165
未参与周六在校自主学习 25 30 55
合计 60 160 220
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(参考数据:xiyi=22 820,yi=435,xi的方差为200,yi的方差为230.8,≈1 074)
附:r=,=,=-,
χ2=.
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:零假设为H0:周六在校自主学习与成绩进步无关.
根据列联表中的数据,经计算得到
χ2=
==
≈12.22>10.828=x0.001,
根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为周六在校自主学习与成绩进步有关联,此推断犯错误的概率不大于0.001.
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
19.(本小题满分17分)直播带货是扶贫助农的一种新模式,这种模式是利用主流媒体的公信力,聚合销售主播的力量助力打通农产品产销链条,切实助力农民增收.我国南方某蜜桔种植县通过网络平台直播销售蜜桔,其中每箱蜜桔重5千克,单价为40元/箱,已知最近5天单日直播总时长x(即所有主播的直播时长之和,单位:小时)与蜜桔的单日销售量y(单位:百箱)之间的统计数据如下表:
可用线性回归模型拟合y与x之间的关系.
(1)试求变量y与x的线性回归方程=x+;
直播总时长x 8 9 11 12 15
单日销售量y 67 63 80 80 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:依题意,得==11,==75,
又xiyi=4 218,=635,
所以=====3.1,
所以=-=75-3.1×11=40.9,
所以经验回归方程为=3.1x+40.9.
直播总时长x 8 9 11 12 15
单日销售量y 67 63 80 80 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(2)若每位主播每天直播的时间不超过4小时,要使每天直播带货销售蜜桔的总金额超过60万元,则至少要请几位主播进行直播?
解:依题意,得40×100·=4 000(3.1x+40.9)>600 000,
解得x>≈35.2,又=8.8,
所以至少要请9位主播进行直播.
直播总时长x 8 9 11 12 15
单日销售量y 67 63 80 80 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
(3)直播带货大大提升销量的同时,也增加了坏果赔付的成本.该蜜桔平均每箱按80个计算,若客户在收到货时有坏果,则每个坏果要赔付1元.现有甲、乙两款包装箱,若采用甲款包装箱,成本为t(1≤t≤5)元/箱,且每箱坏果的个数X服从P(X=i)=,若采用乙款包装箱,成本为t元/箱,
直播总时长x 8 9 11 12 15
单日销售量y 67 63 80 80 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
且每箱坏果的个数Y服从P(Y=i)=请运用概率统计的相关知识分析,选择哪款包装箱获得的利润更大?
附:=,=-,xiyi=4 218,=635.
直播总时长x 8 9 11 12 15
单日销售量y 67 63 80 80 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
解:对于乙款包装箱,
由m+m+m+=1,所以m=.
设采用甲款包装箱每箱获得的利润的均值为E1,
则E1=40-E(X)-t=40-1×[0×+1×+2×()2+3×()3+4×()4+5×()5]-t=-t.
设采用乙款包装箱每箱获得的利润的均值为E2,
则E2=40-E(Y)-t=40-1×[0×+1×()2+2×()3+3×()4]-t=-t.
直播总时长x 8 9 11 12 15
单日销售量y 67 63 80 80 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
令-t=-t,解得t=.
因为1≤t≤5,所以令-t>-t解得t∈(,5],
令-t<-t解得t∈[1,).
综上所述,当t=时,采用两款包装箱获得的利润一样;
当t∈(,5]时,采用甲款包装箱获得的利润更大;
当t∈[1,)时,采用乙款包装箱获得的利润更大.
返回
直播总时长x 8 9 11 12 15
单日销售量y 67 63 80 80 85
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
谢 谢 观 看 !
第
八
章
成
对
数
据
的
统
计
分
析
返回
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。