专题09 成对数据的统计分析(2大考点30题)(期末真题汇编,上海专用)高二数学下学期
2026-06-05
|
3份
|
49页
|
163人阅读
|
6人下载
资源信息
| 学段 | 高中 |
| 学科 | 数学 |
| 教材版本 | 高中数学沪教版选择性必修第二册 |
| 年级 | 高二 |
| 章节 | 第8章 成对数据的统计分析 |
| 类型 | 题集-试题汇编 |
| 知识点 | 统计案例 |
| 使用场景 | 同步教学-期末 |
| 学年 | 2026-2027 |
| 地区(省份) | 上海市 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 1.59 MB |
| 发布时间 | 2026-06-05 |
| 更新时间 | 2026-06-05 |
| 作者 | 赢未来学科培优教研室 |
| 品牌系列 | 好题汇编·期末真题分类汇编 |
| 审核时间 | 2026-06-05 |
| 下载链接 | https://m.zxxk.com/soft/58225344.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
**基本信息**
聚焦成对数据统计分析,精选上海多校高二期末试题,覆盖一元线性回归分析与2×2列联表两大核心考点,共30题,注重实际情境应用与数据分析能力考查。
**题型特征**
|题型|题量|知识覆盖|命题特色|
|----|----|----------|----------|
|单选题|9|相关系数、百分位数、回归方程性质|结合广告支出与销售额、光照时长与种子发芽等现实数据,考查概念辨析与数据敏感性|
|填空题|15|回归方程参数计算、离差、独立性检验|设置蟋蟀鸣叫频率与气温、汽车维修费用等生活化情境,强化计算与应用|
|解答题|6|列联表补全、独立性检验、分布列与期望|以新能源汽车性能评分、空气质量与锻炼人次为背景,综合考查统计推断与决策能力,贴合高考命题趋势|
内容正文:
专题09 成对数据的统计分析(2大考点30题)
2大高频考点概览
考点01一元线性回归分析
考点02 2x2列联表
地 城
考点01
一元线性回归分析
一、单选题
1.(24-25高二下·上海实验学校·期末)为了判断某地超市的销售额与广告支出之间的相关关系,现随机抽取6家超市,得到其广告支出与销售额数据如下表,则下列说法中正确的是( )
超市
A
B
C
D
E
F
广告支出x万元
1
2
4
6
10
13
销售额y万元
14
21
29
30
37
43
A.广告支出数据的极差为13
B.销售额数据的第80百分位数为43
C.预测当某超市广告支出为15万元时,销售额一定是48万元
D.若去掉超市A这一组数据,则销售额y与广告支出x之间的线性相关程度会加强
【答案】D
【分析】对于A,由极差的定义验算即可;对于B,由百分位数的定义判断即可;对于CD,由线性回归方程的意义判断即可.
【详解】对于A,极差为,故A错误;
对于B,销售额数据按照从小到大的顺序排列为共个数据,
因为,所以销售额数据的第百分位数为,故B错误;
对于C,线性回归方程反应之间关系的一种拟合,不具有确定性,故C错误;
对于D,若去掉超市A这一组数据,因为超市的数据偏离其他数据较远,去掉后其他数据更集中,所以相关程度会更高,故D正确.
故选:D.
2.(24-25高二下·上海川沙中学·期末)下列关于统计概率知识的判断,则下列结论正确的是( )
①若样本数据,,…,的方差为4,则数据,,…,的标准差为4;
②在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1;
③若事件,满足,则事件与事件相互独立;
④某医院住院的位新冠患者的潜伏天数分别为,则该样本数据的第百分位数为.
A.只有一个正确 B.只有两个正确
C.只有一个错误 D.四个题是错误的
【答案】B
【分析】利用方差的运算性质得①正确,利用相关系数的性质得②错误,利用条件概率公式和相互独立事件的判断方法可得③错误,利用百分位数的求法可得④错误,即可求解.
【详解】对于命题①,因为样本数据,,…,的方差为4,则数据,,…,的方差为,
标准差为,所以命题①正确,
对于命题②,相关关系越强,相关系数越接近于1,所以命题②错误,
对于命题③,因为,得到,
则事件与事件相互独立,所以命题③正确,
对于命题④,将数据从小排到大得到,
又,所以该样本数据的第百分位数为,故命题④错误,
故选:B.
3.(24-25高二下·上海浦东新区上海师范大学附属中学·期末)已知线性相关系数r是描述成对数据线性相关程度的统计量,也称为皮尔逊相关系数;一元线性回归分析是基于拟合误差Q取最小值的假设进行的,最终可得回归方程(回归直线).现有5个数据点,小明对它们进行了一元线性回归分析,得到线性相关系数和回归方程,随后发现自己漏掉了一个数据点且恰好.重新计算6个数据点得到线性相关系数和回归方程,对于下面两个说法:
①一定小于 ②与一定重合
则( )
A.①正确②错误 B.①正确②正确 C.①错误②正确 D.①错误②错误
【答案】C
【分析】根据相关系数的定义,以及得到回归直线方程的过程,即可判断选项.
【详解】当增加一个与回归直线完全拟合的数据点后,这个点没有产生新的拟合误差,整体数据点与回归直线的拟合程度变得更好,所以,不一定,故①错误;
回归方程是基于5个数据点通过最小二乘法(使拟合误差取最小值)得到的,当加入新的数据点,因为它在回归直线上,它不会改变原来使取得最小的直线的位置,所以与一定重合,故②正确.
故选:C
4.(24-25高二下·上海晋元高级中学·期末)下列说法正确的是( )
A.若随机变量,则
B.经验回归直线至少经过点中的一个
C.一组数据11,12,12,13,14,15,16,18,20,22的第80百分位数为19
D.若,,,则事件A与事件B相互独立
【答案】C
【分析】根据二项分布方差公式,求出二项分布方差,判断A的正误,根据回归直线性质,判断B的正误,根据第百分位数定义,求出第80百分位数,判断C的正误,根据独立事件的判定方法,判断D的正确.
【详解】对A,,故A错误;
对B,经验回归直线必过样本中心点,但不一定过样本点,故B错误;
对C,数据组共10个数据,故第80百分位数为从小到大第8,9个数据的平均数,即,故C正确;
对D,,,故,故事件与事件不相互独立,故D错误;
故选:C.
5.(24-25高二下·上海浦东新区上海南汇中学·期末)某兴趣小组研究光照时长和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,如下表所示.若去掉最后一组数据后,下列说法正确的是( )
光照时长
1
2
3
8
10
种子发芽数量y(颗)
4
6
5
11
2
A.相关系数r的绝对值变小 B.相关变量具有负相关关系
C.拟合误差变大 D.解释变量与响应变量的相关性变强
【答案】D
【分析】观察图象,较其他的点偏离回归直线最大,去掉后,回归效果更好,结合相关系数、正负相关性、残差平方和以及相关性逐项分析判断.
【详解】观察图象知:较其他的点偏离回归直线最大,因此去掉后,回归效果更好,
对于A,相关系数越接近于1,线性相关性越强,
因此去掉后,相关系数的绝对值变大,A错误;
对于B,由表格数据可知越大,越大,所以相关变量具有正相关关系,B错误;
对于C,因为残差平方和越大,拟合效果越差,因此去掉后,残差平方和变小,拟合误差变小,C错误;
对于D,由选项A知,去掉后,相关系数的绝对值变大,
因此解释变量与响应变量的相关性变强,D正确.
故选:D
6.(24-25高二下·上海建平中学·期末)通过随机抽样,收集了若干朵鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的回归方程为,根据以上信息,下列命题正确的是( )
A.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为5.8612cm
B.若从样本中抽取一部分,则这部分的相关系数一定是0.8642
C.花瓣长度和花萼长度负相关
D.花瓣长度和花萼长度存在一次函数关系
【答案】A
【分析】根据散点图的特点及回归方程可判断ACD选项,根据相关系数的定义可以判断B选项.
【详解】当时,,故A正确,
部分数据的相关系数未必和总体相同,故B错误;
从散点图可以看出花瓣长度和花萼长度正相关,故C错误;
花瓣长度和花萼长度之间不存在函数关系,为相关关系,只是用一次函数近似拟合它们的关系,
故D错误.
故选:A.
7.(24-25高二下·上海奉贤区·期末)已知变量与负相关,且由观测数据得到样本的平均数,,则由观测数据得到的回归方程可能是( )
A. B. C. D.
【答案】B
【分析】利用负相关及回归直线经过样本中心点,逐项判断.
【详解】对于AC,回归直线、的斜率分别为0.4,2,都为正,变量与正相关,AC不是;
对于B,回归直线斜率,变量与负相关,
当时,,B可能是;
对于D,回归直线斜率,变量与负相关,
当时,,D不是.
故选:B
8.(23-24高二下·上海南洋中学·期末)为了研究关于的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程,则下列选项中正确的是( )
1
2
3
4
5
0.5
0.9
1
1.1
1.5
A. B.与的样本是负相关
C.当时,的预估值为2.2 D.去掉样本点后,与的样本相关系数不会改变
【答案】D
【分析】由表格数据求出样本点的中心坐标,代入可得的值由此即可判断A;由的正负即可判断B;.根据回归方程代入计算即可判断C,由相关系数公式即可判断D.
【详解】,所以样本点的中心坐标为,
将它代入得,解得,故A错误;
因为,所以与的样本是正相关,故B错误;
当时,的预估值为,故C错误;
由相关系数公式可知,去掉样本点后,与的样本相关系数不会改变,故D正确.
故选:D.
9.(23-24高二下·上海晋元高级中学·期末)下列命题为真命题的有( )个.
①若随机变量的方差为,则;
②对于随机事件A与B,若,则事件A与B独立;
③相关系数越大,两组数据的相关程度越强.
A.0 B.1 C.2 D.3
【答案】B
【分析】①,由方差的性质计算;②,由对立事件概率公式和条件概率公式得到;③,相关系数越大,两组数据的相关程度越强.
【详解】对于①,若随机变量的方差为,则,①错误;
对于②,,故,
,即,则事件A与B独立,②正确;
对于③,相关系数越大,两组数据的相关程度越强,③错误.
故选:B
二、填空题
10.(24-25高二下·上海七宝中学·期末)一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据表格可得回归方程,则实数的值为__________.
零件数x(个)
2
3
4
5
加工时间y(分钟)
30
a
40
50
【答案】36
【分析】根据回归方程经过样本中心点,代入即可求得的值.
【详解】根据表中数据可知,,
因为回归方程经过样本中心点,
代入回归直线方程可得,解得,
故答案为:36.
11.(24-25高二下·上海浦东新区上海南汇中学·期末)由表格数据得到的线性回归方程为,则此回归方程在样本点处的离差是_______
x
3
4
5
6
y
2.5
4
4.5
【答案】/
【分析】先计算出样本的中心点坐标,将其代入中可求得m的值,再结合离差的定义求解即可.
【详解】因为,,且线性回归方程恒过,
所以,解得,
将代入回归方程得,
所以此回归方程在样本点处的离差是.
故答案为:
12.(23-24高二下·上海奉贤区·期末)①事件A和事件B互斥,则;
②数据2,3,6,7,8,10,13,15的第50百分位数为7;
③在线性回归模型中,拟合误差越小,表示回归的效果越好;
④随机变量X的方差,则.
其中正确命题的序号为_________.
【答案】①③
【分析】由互斥的并事件的概率判断①,利用百分位数的定义计算可判断②,拟合误差越小,表示回归的效果越好可判断③,利用方差的性质计算可判断④.
【详解】对于①,事件A和事件B互斥,则,故①正确;
对于②,因为,所以数据2,3,6,7,8,10,13,15的第50百分位数为,故②不正确;
对于③,在线性回归模型中,拟合误差越小,表示回归的效果越好,故③正确;
对于④,随机变量X的方差,则,故④错误.
故答案为:①③.
13.(23-24高二下·上海长宁区·期末)某单位为了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与气温.由表中数据所得回归直线方程为,据此预测当气温为5℃时,用电量的度数约为______度.
气温(℃)
14
12
8
6
用电量(度)
22
26
34
38
【答案】40
【分析】先求解,代入方程求得,然后可得气温为时用电量的度数.
【详解】,
,
所以,所以当时,.
故答案为:40.
14.(23-24高二下·上海南汇中学·期末)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃ )存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y关于x的线性回归方程.
x(次数/分钟)
20
30
40
50
60
y(℃)
25
27.5
29
32.5
36
则当蟋蟀每分钟鸣叫62次时,该地当时的气温预报值为_________.
【答案】
【分析】根据给定数表求出样本的中心点,再求出值并求出预报值.
【详解】依题意,,,
于是,解得,则y关于x的线性回归方程为,
当时,,
所以该地当时的气温预报值为(℃).
故答案为:
15.(23-24高二下·上海曹杨第二中学·期末)某新能源汽车销售公司统计了某款汽车行驶里程x(单位:万千米)对应维修保养费用y(单位:万元)的四组数据,这四组数据如下表:
行驶里程万千米/万千米
1
2
4
5
维修保养费用万元/万元
0.50
0.90
2.30
2.70
若用最小二乘法求得回归直线方程为,则估计该款汽车行驶里程为10万千米时的维修保养费是______.
【答案】5.66
【分析】先利用线性回归方程必过样本中心点,求出,再用回归方程进行估计.
【详解】因为,,
由利用线性回归方程必过样本中心点,得:,
所以当时,.
故答案为:5.66
地 城
考点02
2x2列联表
一、填空题
16.(24-25高二下·上海大同中学·期末)已知,.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到,则根据小概率值的独立性检验,分析喜欢该体育运动与性别________(选填“有关”或“无关”).
【答案】有关
【分析】根据题中所给数据,结合独立性检验的基本思想即可求解.
【详解】∵,∴根据小概率值的独立性检验,喜欢该体育运动与性别有关.
故答案为:有关.
17.(24-25高二下·上海进才中学·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
【答案】
【分析】设男生人数为,依题意可得列联表;根据表格中的数据,代入求观测值的公式,求出观测值同临界值进行比较,列不等式即可得出结论.
【详解】因为抽取个学生,女生人数是男生人数的,
所以抽取个男生,个女生,为了便于计算,我们令,
设男生人数为,依题意可得列联表如下:
喜欢追星
不喜欢追星
总计
男生
女生
总计
根据小概率值的独立性检验,判断中学生追星与性别有关,
则,由,解得,
由题知应为6的整数倍,
而根据小概率值的独立性检验,判断中学生追星与性别有关,
则男生至少有30人,
故答案为:30.
18.(23-24高二下·上海海事大学附属北蔡高级中学·期末)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为______(填有或没有)的把握认为改款盲盒与性别有关.()
【答案】有
【分析】根据列联表数据和的计算公式求出即可根据小概率值的独立性检验得到结论.
【详解】零假设为改款盲盒与性别无关联.
由列联表数据计算得,
所以根据小概率值的独立性检验,推断不成立,故有的把握认为改款盲盒与性别有关.
故答案为:有.
19.(23-24高二下·上海晋元高级中学·期末)某研究小组为了研究中学生的身体发育情况,在某学校随机抽取30名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,取显著性水平为,我们可以认为该学校15至16周岁的30名男生的身高是否偏高与体重是否超重________.(填入有关或无关)
身高
体重
超重
不超重
总计
偏高
12
3
15
不偏高
5
10
15
总计
17
13
30
附表:
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中
【答案】有关
【分析】根据列联表,计算的值并与比较即得结论.
【详解】零假设为假设该学校15至16周岁的30名男生的身高是否偏高与体重是否超重无关,
由,
由小概率值的独立性检验,零假设不成立,
即认为该学校15至16周岁的30名男生的身高是否偏高与体重是否超重有关,这个判断犯错误的概率不超过0.05.
故答案为:有关.
二、解答题
20.(24-25高二下·上海向明中学·期末)某汽车生产企业对其生产的四款新能源汽车进行市场调研,从购买者中选取50名车主对车辆进行性能评分,每款车都有、、、、、5分五个等级,各评分的相应人数统计结果如下表所示.
性能评分汽车款式
基础版
基础版1
2
2
3
1
0
基础版2
4
4
5
3
1
豪华版
豪华版1
1
3
5
4
1
豪华版2
0
0
3
5
3
(1)约定当得分为或时,认为该款车型性能优秀,否则认为性能一般,根据上述样本数据,完成以下列联表,取显著性水平,能否认为汽车的性能与款式有关?说明理由.
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
优秀
13
合计
(2)为进一步提升产品品质,现从样本评分为的6位基础版车主中,有放回地随机抽取2人征求意见,并做进一步打分.若基础版1的车主会打1分,而基础版2的车主会打4分,设随机变量为总得分,求的方差.
附:;,
,,.
【答案】(1)列联表见解析,汽车的性能与款式有关,理由见解析
(2)
【分析】(1)由题意根据数据关系写出列联表,再提出原假设,确定显著性水平,计算值,做出统计决断;
(2)用,分别表示在第次抽取中,企业获得的得分,则,故,再求的分布列,由方程公式求,再求,可得结论.
从而求解分布列和期望.
【详解】(1)由题意,列联表如下:
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
12
32
优秀
5
13
18
合计
25
25
50
(1)提出原假设:两种款式的汽车的性能没有显著差异,
(2)确定显著性水平,
(3)计算,
(4)统计决断:由于,而,的值超过了所确定的界限,从而否定原假设,即认为汽车的性能与款式有关;
(2)评分为的位基础版车主中,基础版的车主有位,基础版的车主有位,
用,分别表示在第次抽取中,企业获得的得分,
则,且相互独立,则,
又随机变量的取值有,
,,
所以的分布列为,
所以,,
随机变量的取值有,
,,
所以的分布列为,
所以,,
所以
21.(24-25高二下·上海洋泾中学·期末)2024年末公司的一经发布,引发全球轰动,其科技水准直接对标公司的.某调研公司随机抽取公司和公司各25名客户,对其使用时产生的技术成本进行调研,并绘制成如图所示的茎叶图.(茎为十位数,叶为个位数)
(1)请根据茎叶图判断,与哪家公司的技术成本较低?并说明理由;
(2)若将技术成本小于80称为低成本运营,反之称为高成本运营.结合图表数据,补全下方列联表;
低成本运营
高成本运营
公司
公司
(3)根据(2)中的列联表,能否有95%的把握认为运营成本与公司有关?
附:,.
【答案】(1)D公司技术成本较低;A公司平均技术成本为83.4,D公司平均技术成本为75.96
(2)8,17;17,8
(3),有95%把握
【分析】(1)计算出两家公司的技术成本,再比较即可得出结论;
(2)根据低成本运营的定义即可得解;
(3)计算卡方,对比临界值即可得解.
【详解】(1)A公司平均技术成本为:,
公司平均技术成本为:,
所以D公司技术成本较低;
(2)由题意补全下方列联表:
低成本运营
高成本运营
公司
8
17
公司
17
8
(3)由(2)可知,
,
有95%的把握认为运营成本与公司有关.
22.(24-25高二下·上海莘庄中学·期末)某学生兴趣小组从一年365天中随机调查了100天中每天的空气质量等级和当天到莘庄公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)一年365天中到莘庄公园锻炼的人次大于400人的约有多少天(精确到1天);
(2)估计一天中到莘庄公园锻炼的平均人次;
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.判断是否有95%的把握认为一天中到莘庄公园锻炼的人次不超过400人与当天的空气质量有关?()
【答案】(1)天
(2)天
(3)有把握,理由见解析
【分析】(1)算出天中到莘庄公园锻炼的人次大于400人的天数后可求365天中到莘庄公园锻炼的人次大于400人的天数;
(2)写出各锻炼人次区间对应的频数,利用中间值作代表,利用公式求解即可;
(3)先根据题目中给的数据补充列联表,利用公式求出,再与临界值比较即可.
【详解】(1)由题设可得天中到莘庄公园锻炼的人次大于400人的约有天,
故天中到莘庄公园锻炼的人次大于400人的约有天.
(2)锻炼人次为的有天,
锻炼人次为的有天,
锻炼人次为有天,
利用中间值作代表,一天中到该莘庄公园锻炼的平均人次的估计值为:
.
(3)根据所给数据,可得列联表:
人次≤400
人次>400
合计
空气质量好
33
37
70
空气质量不好
22
8
30
合计
55
45
100
设一天中到该公园锻炼的人次与该市当天的空气质量无关,
根据列联表得,
因为,,由小概率事件原理否定,
故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
23.(24-25高二下·上海华东师范大学第二附属中学·期末)某学生兴趣小组随机调查了某市天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表单位:天
锻炼人次
空气质量等级
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为,,,的概率;并求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(2)若某天的空气质量等级为或,则称这天“空气质量好”若某天的空气质量等级为或,则称这天“空气质量不好”
①根据所给数据,完成下面的列联表,并计算第一行第一列数据的预期值.
②根据上一小问的列联表,判断是否有的把握认为一天中到该公园锻炼的人次超过400人与该市当天的空气质量有关.
锻炼人次
空气质量
人次
人次
空气质量好
空气质量不好
【答案】(1)概率见解析;350;
(2)①列联表见解析;38.5;②有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
【分析】(1)用频率估计概率,结合平均数计算公式求解即可;
(2)①得出列联表,进一步求得预期值.②计算卡方值,对比临界值即可判断.
【详解】(1)由所给数据,该市一天的空气质量等级为,,,的概率的估计值如下表:
空气质量等级
概率的估计值
一天中到该公园锻炼的平均人次的估计值为.
(2)根据所给数据,可得列联表:
锻炼人次空气质量
人次
人次
空气质量好
33
37
空气质量不好
22
8
第一行第一列数据的预期值为.
根据列联表得的观测值.由于,
故有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
24.(24-25高二下·上海建平中学·期末)某经销商在某地5个位置对甲乙两种类型的网络进行掉线次数测试,得到数据如表所示:
A
B
C
D
E
甲
4
3
8
6
12
乙
5
7
4
4
3
(1)如果在测试中掉线次数超过5次,则网络状况为“糟糕”,否则为“良好”,根据小概率值的独立性检验,能否说明网络状况与网络的类型有关?
(2)若该经销商要在上述接受测试的甲地5个地区中任选3个,求A,B两个地区同时被选到的概率;
(3)若该经销商要在上述接受测试的甲地5个地区中任选3个,以X表示所选位置中网络状况为“糟糕”的位置个数,求随机变量X的分布及数学期望.
附:其中.
α
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.01
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)能
(2)
(3)分布见解析,数学期望为1.8
【分析】(1)根据题干信息,填写列联表,再代入公式计算,下结论即可.
(2)在5个地区中任选3个,有种选法,其中A,B两个地区同时被选到的选法有种,再根据古典概型列式计算即可.
(3)根据题意知,随机变量的所有可能取值为1,2,3,再根据超几何分布求解对应概率,计算数学期望即可.
【详解】(1)根据题意列出列联表如下:
糟糕
良好
合计
甲
3
2
5
乙
1
4
5
合计
4
6
10
零假设:网络状况与网络类型无关,则,
根据小概率值的独立性检验,零假设不成立,即网络状况与网络的类型有关.
(2)在5个地区中任选3个,有种选法,
其中两个地区同时被选到的选法有种,
因此所求概率.
(3)随机变量的所有可能取值为1,2,3,
.
故的分布列为:
1
2
3
P
.
25.(24-25高二下·上海奉贤区·期末)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断是否有99%的把握认为我市市民网购与性别有关?
(2)现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)表格见解析;有
(2)
【分析】(1)完成列联表,由列联表,得,然后根据独立性检验判断即可;
(2)由题知抽取10人中,经常网购的有人,偶尔或不用网购的有人,由可计算选取的3人中至少有2人经常网购的概率.
【详解】(1)完成列联表:
经常网购
偶尔或不用网购
合计
男性
50
50
100
女性
70
30
100
合计
120
80
200
由列联表得,,
有99%的把握认为我市市民网购与性别有关.
(2)由题知女市民中利用分层抽样的方法抽取10人中,
经常网购的有人,偶尔或不用网购的有人,
选取的3人中至少有2人经常网购的概率,
所以所求概率为.
26.(24-25高二下·上海第三女子中学·期末)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示.
不吸烟者
吸烟者
总计
不患慢性气管炎者
120
160
280
患慢性气管炎者
15
45
60
总计
135
205
340
(1)是否有的把握认为患慢性气管炎与吸烟有关?
(2)常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.现从340人中任选一人,表示“选到的人是吸烟者”,表示“选到的人患慢性气管炎者”请利用样本数据,估计的值;
附:.
【答案】(1)有的把握认为患慢性气管炎与吸烟有关:
(2)
【分析】(1)利用卡方计算公式求解并判断即可;
(2)利用条件概率公式进行化简,再计算交事件发生的概率,最后比较频数即可.
【详解】(1)假设:患慢性气管炎与吸烟无关,
根据的列联表中的数据,可得,
从而否定原假设,所以有的把握认为患慢性气管炎与吸烟有关.
(2)根据表格中的数据,可得:
27.(23-24高二下·上海奉贤区·期末)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示.
不吸烟者
吸烟者
总计
不患慢性气管炎者
120
160
280
患慢性气管炎者
15
45
60
总计
135
205
340
(1)是否有95%的把握认为患慢性气管炎与吸烟有关?
(2)现从不患慢性气管炎者的样本中,按分层抽样的方法选出7人,从这7人里再随机选取3人,求这3人中,不吸烟者的人数X的数学期望.
附:,.
【答案】(1)有的把握认为患慢性气管炎与吸烟有关
(2)
【分析】(1)利用表格中的数据计算的观测值,再与临界值比对得解.
(2)求出的可能值及对应的概率,进而求出数学期望.
【详解】(1)零假设:患慢性气管炎与吸烟无关,
,
由,而,从而否定原假设,
即有的把握认为患慢性气管炎与吸烟有关.
(2)按分层抽样,不吸烟者3人,吸烟者4人,
的可能值为0,1,2,3,
,,,,
所以.
28.(23-24高二下·上海实验学校·期末)随着互联网的高速发展和新媒体形式的不断丰富,微短剧作为一种新兴的文化载体,正逐渐成为拓展文化消费空间的重要途径.某媒体为了了解微短剧消费者的年龄分布,随机调查了200名消费者,得到如下列联表:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
45
不是微短剧消费者
合计
100
200
(1)补全列联表,并根据显著性水平的独立性检验,能否认为“是微短剧消费者”与“年龄不超过40岁”有关联?
(2)记2020~2024年的年份代码依次为1,2,3,4,5,下表为2020~2023年中国微短剧市场规模及2024年中国微短剧预测的市场规模(单位:亿元)与的统计数据:
年份代码x
1
2
3
4
5
市场规模y
9.4
36.8
101.7
373.9
m
根据上表数据求得关于的经验回归方程为,求表中m的值,并求相关系数,判断该经验回归方程是否有价值.
参考公式:,其中,.
回归方程,其中,相关系数.若,则认为经验回归方程有价值.
【答案】(1)列联表见解析,有关联;
(2),,有价值;
【分析】(1)先补全列联表,再计算卡方,根据独立性检验原则即可判断;
(2)根据回归直线过样本点中心可求得,再根据相关系数公式求得,从而可判断.
【详解】(1)补全列联表如下:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
15
45
不是微短剧消费者
70
85
155
合计
100
100
200
假设“是微短剧消费者”与“年龄不超过40岁”无关联,
因为,
根据小概率值的独立性检验,推断不成立,
即认为“是微短剧消费者”与“年龄不超过40岁”有关联,此推断犯错误的概率不超过0.05.
(2)由x的取值依次为1,2,3,4,5,可得,
因为经验回归方程为,可得,
则,求得,
所以,
所以,,
所以,
因为,所以该经验回归方程有价值.
29.(23-24高二下·上海南汇中学·期末)某汽车生产企业对其生产的四款新能源汽车进行市场调研,从购买者中选取50名车主对车辆进行性能评分,每款车都有1分、2分、3分、4分、5分五个等级,各评分的相应人数统计结果如下表所示.
评分款式
1分
2分
3分
4分
5分
基础版
基础版1
2
2
3
1
0
基础版2
4
4
5
3
1
豪华版
豪华版1
1
3
5
4
1
豪华版2
0
0
3
5
3
(1)求这四款车得分的平均数.
(2)约定当得分不小于4时,认为该款车型性能优秀,否则认为性能一般,根据上述样本数据,完成以下2×2列联表,取显著性水平,能否认为汽车的性能与款式有关?说明理由.
汽车性能
汽车款式
合计
基础版
豪华版
一般
优秀
合计
(3)为进一步提升产品品质,现从样本评分不大于2的基础版车主中,随机抽取3人征求意见,设随机变量X表示其中基础版1车主的人数,求X的分布和期望.
附: ;
【答案】(1)
(2)答案见解析
(3)分布列见解析,
【分析】(1)利用平均数的定义求解即可;
(2)利用题意写出列联表,再结合公式求解即可;
(3)利用超几何分布计算概率,从而求解分布列和期望.
【详解】(1)由题意,这四款车得分的平均数为,
所以这四款车得分的平均数为3.
(2)由题意,列联表如下:
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
12
32
优秀
5
13
18
合计
25
25
50
则,
所以能在犯错误概率不超过的前提下认为汽车的性能与款式有关.
(3)由题意可得:样本评分不大于2的基础版车主中,基础版1车主有4人,基础版2车主有8人,
从这12人中随机抽取3人,其中含基础版1的人数服从超几何分布,则的所有可能取值为
则,,
,,
所以的分布列为:
0
1
2
3
则.
30.(23-24高二下·上海曹杨第二中学·期末)某校准备在体育锻炼时间提供三项体育活动供学生选择.为了解该校学生对“三项体育活动中要有篮球”这种观点的态度(态度分为同意和不同意),随机调查了200名学生,得到的反馈数据如下:(单位:人)
男生
女生
合计
同意
70
50
120
不同意
30
50
80
合计
100
100
200
(1)能否有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关?
(2)假设现有足球、篮球、跳绳这三项体育活动供学生选择.
①若甲、乙两名学生从这三项运动中随机选一种假设他们选择各项运动的概率相同并且相互独立互不影响.记事件为“学生甲选择足球”,事件为“甲、乙两名学生都没有选择篮球”,求,并判断事件,是否独立,请说明理由.
②若该校所有学生每分钟跳绳个数.根据往年经验,该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟跳绳个数比开始时个数均增加10个,若该校有1000名学生,请预估经过训练后该校每分钟跳169个以上的学生人数(结果四舍五入到整数).
参考公式和数据:,其中,.若,,,.
【答案】(1)有关
(2)①,不独立,理由见解析;②977
【分析】(1)计算出卡方,即可判断;
(2)①求出,,,再由条件概率公式求出,由相互独立事件的定义即可判断;②由已知,经过训练后每人每分钟跳绳个数,根据正态分布的性质求出,从而估计出人数.
【详解】(1)提出假设:学生对该问题的态度与性别无关.
根据列联表中的数据可求得,.
因为当成立时,的概率约为,
所以有的把握认为,学生对该观点的态度与性别有关.
(2)①因为事件为“学生甲选择足球”,事件为“甲、乙两名学生都没有选择篮球”,
所以事件为“学生甲选择足球,学生乙不选择篮球”,
所以,,,
所以,
因为,所以事件、不独立.
②记经过训练后每人每分钟跳绳个数为,
由已知,经过训练后每人每分钟跳绳个数.
因为,所以.
所以(人).
所以经过训练后该校每分钟跳个以上人数约为.
/
学科网(北京)股份有限公司
$
专题09 成对数据的统计分析(2大考点30题)
1.D地 城
考点01
一元线性回归分析
2.B
3.C
4.C
5.D
6.A
7.B
8.D
9.B
10.36
11./
12.①③
13.40
14.
15.5.66
16.有关地 城
考点02
2x2列联表
17.
18.有
19.有关
20.(1)列联表见解析,汽车的性能与款式有关,理由见解析
(2)
21.(1)D公司技术成本较低;A公司平均技术成本为83.4,D公司平均技术成本为75.96
(2)8,17;17,8
(3),有95%把握
22.(1)天
(2)天
(3)根据所给数据,可得列联表:
人次≤400
人次>400
合计
空气质量好
33
37
70
空气质量不好
22
8
30
合计
55
45
100
设一天中到该公园锻炼的人次与该市当天的空气质量无关,
根据列联表得,
因为,,由小概率事件原理否定,
故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
23.(1)由所给数据,该市一天的空气质量等级为,,,的概率的估计值如下表:
空气质量等级
概率的估计值
一天中到该公园锻炼的平均人次的估计值为.
(2)根据所给数据,可得列联表:
锻炼人次空气质量
人次
人次
空气质量好
33
37
空气质量不好
22
8
第一行第一列数据的预期值为.
根据列联表得的观测值.由于,
故有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.
24.(1)能
(2)
(3)随机变量的所有可能取值为1,2,3,
.
故的分布列为:
1
2
3
P
.
25.(1)完成列联表:
经常网购
偶尔或不用网购
合计
男性
50
50
100
女性
70
30
100
合计
120
80
200
由列联表得,,
有99%的把握认为我市市民网购与性别有关.
(2)
26.(1)有的把握认为患慢性气管炎与吸烟有关:
(2)
27.(1)有的把握认为患慢性气管炎与吸烟有关
(2)
28.(1)补全列联表如下:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
15
45
不是微短剧消费者
70
85
155
合计
100
100
200
假设“是微短剧消费者”与“年龄不超过40岁”无关联,
因为,
根据小概率值的独立性检验,推断不成立,
即认为“是微短剧消费者”与“年龄不超过40岁”有关联,此推断犯错误的概率不超过0.05.
(2),,有价值;
29.(1)
(2)由题意,列联表如下:
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
12
32
优秀
5
13
18
合计
25
25
50
则,
所以能在犯错误概率不超过的前提下认为汽车的性能与款式有关.
(3)由题意可得:样本评分不大于2的基础版车主中,基础版1车主有4人,基础版2车主有8人,
从这12人中随机抽取3人,其中含基础版1的人数服从超几何分布,则的所有可能取值为
则,,
,,
所以的分布列为:
0
1
2
3
则.
30.(1)有关
(2)①因为事件为“学生甲选择足球”,事件为“甲、乙两名学生都没有选择篮球”,
所以事件为“学生甲选择足球,学生乙不选择篮球”,
所以,,,
所以,
因为,所以事件、不独立.
②记经过训练后每人每分钟跳绳个数为,
由已知,经过训练后每人每分钟跳绳个数.
因为,所以.
所以(人).
所以经过训练后该校每分钟跳个以上人数约为.
/
学科网(北京)股份有限公司
$
专题09 成对数据的统计分析(2大考点30题)
2大高频考点概览
考点01一元线性回归分析
考点02 2x2列联表
地 城
考点01
一元线性回归分析
一、单选题
1.(24-25高二下·上海实验学校·期末)为了判断某地超市的销售额与广告支出之间的相关关系,现随机抽取6家超市,得到其广告支出与销售额数据如下表,则下列说法中正确的是( )
超市
A
B
C
D
E
F
广告支出x万元
1
2
4
6
10
13
销售额y万元
14
21
29
30
37
43
A.广告支出数据的极差为13
B.销售额数据的第80百分位数为43
C.预测当某超市广告支出为15万元时,销售额一定是48万元
D.若去掉超市A这一组数据,则销售额y与广告支出x之间的线性相关程度会加强
2.(24-25高二下·上海川沙中学·期末)下列关于统计概率知识的判断,则下列结论正确的是( )
①若样本数据,,…,的方差为4,则数据,,…,的标准差为4;
②在研究成对数据的相关关系时,相关关系越强,相关系数越接近于1;
③若事件,满足,则事件与事件相互独立;
④某医院住院的位新冠患者的潜伏天数分别为,则该样本数据的第百分位数为.
A.只有一个正确 B.只有两个正确
C.只有一个错误 D.四个题是错误的
3.(24-25高二下·上海浦东新区上海师范大学附属中学·期末)已知线性相关系数r是描述成对数据线性相关程度的统计量,也称为皮尔逊相关系数;一元线性回归分析是基于拟合误差Q取最小值的假设进行的,最终可得回归方程(回归直线).现有5个数据点,小明对它们进行了一元线性回归分析,得到线性相关系数和回归方程,随后发现自己漏掉了一个数据点且恰好.重新计算6个数据点得到线性相关系数和回归方程,对于下面两个说法:
①一定小于 ②与一定重合
则( )
A.①正确②错误 B.①正确②正确 C.①错误②正确 D.①错误②错误
4.(24-25高二下·上海晋元高级中学·期末)下列说法正确的是( )
A.若随机变量,则
B.经验回归直线至少经过点中的一个
C.一组数据11,12,12,13,14,15,16,18,20,22的第80百分位数为19
D.若,,,则事件A与事件B相互独立
5.(24-25高二下·上海浦东新区上海南汇中学·期末)某兴趣小组研究光照时长和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,如下表所示.若去掉最后一组数据后,下列说法正确的是( )
光照时长
1
2
3
8
10
种子发芽数量y(颗)
4
6
5
11
2
A.相关系数r的绝对值变小 B.相关变量具有负相关关系
C.拟合误差变大 D.解释变量与响应变量的相关性变强
6.(24-25高二下·上海建平中学·期末)通过随机抽样,收集了若干朵鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的回归方程为,根据以上信息,下列命题正确的是( )
A.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为5.8612cm
B.若从样本中抽取一部分,则这部分的相关系数一定是0.8642
C.花瓣长度和花萼长度负相关
D.花瓣长度和花萼长度存在一次函数关系
7.(24-25高二下·上海奉贤区·期末)已知变量与负相关,且由观测数据得到样本的平均数,,则由观测数据得到的回归方程可能是( )
A. B. C. D.
8.(23-24高二下·上海南洋中学·期末)为了研究关于的线性相关关系,收集了5组样本数据(见下表).若已求得一元线性回归方程,则下列选项中正确的是( )
1
2
3
4
5
0.5
0.9
1
1.1
1.5
A. B.与的样本是负相关
C.当时,的预估值为2.2 D.去掉样本点后,与的样本相关系数不会改变
9.(23-24高二下·上海晋元高级中学·期末)下列命题为真命题的有( )个.
①若随机变量的方差为,则;
②对于随机事件A与B,若,则事件A与B独立;
③相关系数越大,两组数据的相关程度越强.
A.0 B.1 C.2 D.3
二、填空题
10.(24-25高二下·上海七宝中学·期末)一车间为规定工时定额,需要确定加工零件所花费的时间,为此进行了4次试验,测得的数据如下,根据表格可得回归方程,则实数的值为__________.
零件数x(个)
2
3
4
5
加工时间y(分钟)
30
a
40
50
11.(24-25高二下·上海浦东新区上海南汇中学·期末)由表格数据得到的线性回归方程为,则此回归方程在样本点处的离差是_______
x
3
4
5
6
y
2.5
4
4.5
12.(23-24高二下·上海奉贤区·期末)①事件A和事件B互斥,则;
②数据2,3,6,7,8,10,13,15的第50百分位数为7;
③在线性回归模型中,拟合误差越小,表示回归的效果越好;
④随机变量X的方差,则.
其中正确命题的序号为_________.
13.(23-24高二下·上海长宁区·期末)某单位为了解用电量y度与气温x℃之间的关系,随机统计了某4天的用电量与气温.由表中数据所得回归直线方程为,据此预测当气温为5℃时,用电量的度数约为______度.
气温(℃)
14
12
8
6
用电量(度)
22
26
34
38
14.(23-24高二下·上海南汇中学·期末)蟋蟀鸣叫可以说是大自然优美、和谐的音乐,殊不知蟋蟀鸣叫的频率x(每分钟鸣叫的次数)与气温y(单位:℃ )存在着较强的线性相关关系.某地观测人员根据下表的观测数据,建立了y关于x的线性回归方程.
x(次数/分钟)
20
30
40
50
60
y(℃)
25
27.5
29
32.5
36
则当蟋蟀每分钟鸣叫62次时,该地当时的气温预报值为_________.
15.(23-24高二下·上海曹杨第二中学·期末)某新能源汽车销售公司统计了某款汽车行驶里程x(单位:万千米)对应维修保养费用y(单位:万元)的四组数据,这四组数据如下表:
行驶里程万千米/万千米
1
2
4
5
维修保养费用万元/万元
0.50
0.90
2.30
2.70
若用最小二乘法求得回归直线方程为,则估计该款汽车行驶里程为10万千米时的维修保养费是______.
地 城
考点02
2x2列联表
一、填空题
16.(24-25高二下·上海大同中学·期末)已知,.在检验喜欢某项体育运动与性别是否有关的过程中,某研究员搜集数据并计算得到,则根据小概率值的独立性检验,分析喜欢该体育运动与性别________(选填“有关”或“无关”).
17.(24-25高二下·上海进才中学·期末)针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一次调查.在全校学生中随机抽取(是正整数)个学生,其中女生人数是男生人数的,男生追星的人数占男生人数的,女生追星的人数占女生人数的,若根据小概率值的独立性检验,判断中学生追星与性别有关,则男生至少有________人.
参考数据及公式如下:
0.050
0.010
0.001
3.841
6.635
10.828
参考公式:,其中.
喜欢追星
不喜欢追星
总计
男生
女生
总计
18.(23-24高二下·上海海事大学附属北蔡高级中学·期末)盲盒里面通常装的是动漫、影视作品的周边,或者设计师单独设计出来的玩偶.由于盒子上没有标注,购买者只有打开才会知道自己买到了什么,因此这种惊喜吸引了众多年轻人,形成了“盲盒经济”.某销售网点为了调查是否购买该款盲盒与性别的关系,得到如下列联表:
女生
男生
总计
购买
40
20
60
未购买
70
70
140
总计
110
90
200
则认为______(填有或没有)的把握认为改款盲盒与性别有关.()
19.(23-24高二下·上海晋元高级中学·期末)某研究小组为了研究中学生的身体发育情况,在某学校随机抽取30名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,取显著性水平为,我们可以认为该学校15至16周岁的30名男生的身高是否偏高与体重是否超重________.(填入有关或无关)
身高
体重
超重
不超重
总计
偏高
12
3
15
不偏高
5
10
15
总计
17
13
30
附表:
0.1
0.05
0.01
0.005
2.706
3.841
6.635
7.879
其中
二、解答题
20.(24-25高二下·上海向明中学·期末)某汽车生产企业对其生产的四款新能源汽车进行市场调研,从购买者中选取50名车主对车辆进行性能评分,每款车都有、、、、、5分五个等级,各评分的相应人数统计结果如下表所示.
性能评分汽车款式
基础版
基础版1
2
2
3
1
0
基础版2
4
4
5
3
1
豪华版
豪华版1
1
3
5
4
1
豪华版2
0
0
3
5
3
(1)约定当得分为或时,认为该款车型性能优秀,否则认为性能一般,根据上述样本数据,完成以下列联表,取显著性水平,能否认为汽车的性能与款式有关?说明理由.
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
优秀
13
合计
(2)为进一步提升产品品质,现从样本评分为的6位基础版车主中,有放回地随机抽取2人征求意见,并做进一步打分.若基础版1的车主会打1分,而基础版2的车主会打4分,设随机变量为总得分,求的方差.
附:;,
,,.
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
12
32
优秀
5
13
18
合计
25
25
50
21.(24-25高二下·上海洋泾中学·期末)2024年末公司的一经发布,引发全球轰动,其科技水准直接对标公司的.某调研公司随机抽取公司和公司各25名客户,对其使用时产生的技术成本进行调研,并绘制成如图所示的茎叶图.(茎为十位数,叶为个位数)
(1)请根据茎叶图判断,与哪家公司的技术成本较低?并说明理由;
(2)若将技术成本小于80称为低成本运营,反之称为高成本运营.结合图表数据,补全下方列联表;
低成本运营
高成本运营
公司
公司
(3)根据(2)中的列联表,能否有95%的把握认为运营成本与公司有关?
附:,.
低成本运营
高成本运营
公司
8
17
公司
17
8
22.(24-25高二下·上海莘庄中学·期末)某学生兴趣小组从一年365天中随机调查了100天中每天的空气质量等级和当天到莘庄公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次空气质量等级
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)一年365天中到莘庄公园锻炼的人次大于400人的约有多少天(精确到1天);
(2)估计一天中到莘庄公园锻炼的平均人次;
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.判断是否有95%的把握认为一天中到莘庄公园锻炼的人次不超过400人与当天的空气质量有关?()
人次≤400
人次>400
合计
空气质量好
33
37
70
空气质量不好
22
8
30
合计
55
45
100
23.(24-25高二下·上海华东师范大学第二附属中学·期末)某学生兴趣小组随机调查了某市天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表单位:天
锻炼人次
空气质量等级
1(优)
2
16
25
2(良)
5
10
12
3(轻度污染)
6
7
8
4(中度污染)
7
2
0
(1)分别估计该市一天的空气质量等级为,,,的概率;并求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(2)若某天的空气质量等级为或,则称这天“空气质量好”若某天的空气质量等级为或,则称这天“空气质量不好”
①根据所给数据,完成下面的列联表,并计算第一行第一列数据的预期值.
②根据上一小问的列联表,判断是否有的把握认为一天中到该公园锻炼的人次超过400人与该市当天的空气质量有关.
锻炼人次
空气质量
人次
人次
空气质量好
空气质量不好
空气质量等级
概率的估计值
锻炼人次空气质量
人次
人次
空气质量好
33
37
空气质量不好
22
8
24.(24-25高二下·上海建平中学·期末)某经销商在某地5个位置对甲乙两种类型的网络进行掉线次数测试,得到数据如表所示:
A
B
C
D
E
甲
4
3
8
6
12
乙
5
7
4
4
3
(1)如果在测试中掉线次数超过5次,则网络状况为“糟糕”,否则为“良好”,根据小概率值的独立性检验,能否说明网络状况与网络的类型有关?
(2)若该经销商要在上述接受测试的甲地5个地区中任选3个,求A,B两个地区同时被选到的概率;
(3)若该经销商要在上述接受测试的甲地5个地区中任选3个,以X表示所选位置中网络状况为“糟糕”的位置个数,求随机变量X的分布及数学期望.
附:其中.
α
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.01
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
糟糕
良好
合计
甲
3
2
5
乙
1
4
5
合计
4
6
10
1
2
3
P
25.(24-25高二下·上海奉贤区·期末)随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到下表(单位:人)
经常网购
偶尔或不用网购
合计
男性
50
100
女性
70
100
合计
(1)完成上表,并根据以上数据判断是否有99%的把握认为我市市民网购与性别有关?
(2)现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;
参考公式:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
经常网购
偶尔或不用网购
合计
男性
50
50
100
女性
70
30
100
合计
120
80
200
26.(24-25高二下·上海第三女子中学·期末)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示.
不吸烟者
吸烟者
总计
不患慢性气管炎者
120
160
280
患慢性气管炎者
15
45
60
总计
135
205
340
(1)是否有的把握认为患慢性气管炎与吸烟有关?
(2)常用表示在事件发生的条件下事件发生的优势,在统计中称为似然比.现从340人中任选一人,表示“选到的人是吸烟者”,表示“选到的人患慢性气管炎者”请利用样本数据,估计的值;
附:.
27.(23-24高二下·上海奉贤区·期末)某疾病预防中心随机调查了340名50岁以上的公民,研究吸烟习惯与慢性气管炎患病的关系,调查数据如表所示.
不吸烟者
吸烟者
总计
不患慢性气管炎者
120
160
280
患慢性气管炎者
15
45
60
总计
135
205
340
(1)是否有95%的把握认为患慢性气管炎与吸烟有关?
(2)现从不患慢性气管炎者的样本中,按分层抽样的方法选出7人,从这7人里再随机选取3人,求这3人中,不吸烟者的人数X的数学期望.
附:,.
28.(23-24高二下·上海实验学校·期末)随着互联网的高速发展和新媒体形式的不断丰富,微短剧作为一种新兴的文化载体,正逐渐成为拓展文化消费空间的重要途径.某媒体为了了解微短剧消费者的年龄分布,随机调查了200名消费者,得到如下列联表:
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
45
不是微短剧消费者
合计
100
200
(1)补全列联表,并根据显著性水平的独立性检验,能否认为“是微短剧消费者”与“年龄不超过40岁”有关联?
(2)记2020~2024年的年份代码依次为1,2,3,4,5,下表为2020~2023年中国微短剧市场规模及2024年中国微短剧预测的市场规模(单位:亿元)与的统计数据:
年份代码x
1
2
3
4
5
市场规模y
9.4
36.8
101.7
373.9
m
根据上表数据求得关于的经验回归方程为,求表中m的值,并求相关系数,判断该经验回归方程是否有价值.
参考公式:,其中,.
回归方程,其中,相关系数.若,则认为经验回归方程有价值.
年龄不超过40岁
年龄超过40岁
合计
是微短剧消费者
30
15
45
不是微短剧消费者
70
85
155
合计
100
100
200
29.(23-24高二下·上海南汇中学·期末)某汽车生产企业对其生产的四款新能源汽车进行市场调研,从购买者中选取50名车主对车辆进行性能评分,每款车都有1分、2分、3分、4分、5分五个等级,各评分的相应人数统计结果如下表所示.
评分款式
1分
2分
3分
4分
5分
基础版
基础版1
2
2
3
1
0
基础版2
4
4
5
3
1
豪华版
豪华版1
1
3
5
4
1
豪华版2
0
0
3
5
3
(1)求这四款车得分的平均数.
(2)约定当得分不小于4时,认为该款车型性能优秀,否则认为性能一般,根据上述样本数据,完成以下2×2列联表,取显著性水平,能否认为汽车的性能与款式有关?说明理由.
汽车性能
汽车款式
合计
基础版
豪华版
一般
优秀
合计
(3)为进一步提升产品品质,现从样本评分不大于2的基础版车主中,随机抽取3人征求意见,设随机变量X表示其中基础版1车主的人数,求X的分布和期望.
附: ;
汽车性能
汽车款式
合计
基础版
豪华版
一般
20
12
32
优秀
5
13
18
合计
25
25
50
0
1
2
3
30.(23-24高二下·上海曹杨第二中学·期末)某校准备在体育锻炼时间提供三项体育活动供学生选择.为了解该校学生对“三项体育活动中要有篮球”这种观点的态度(态度分为同意和不同意),随机调查了200名学生,得到的反馈数据如下:(单位:人)
男生
女生
合计
同意
70
50
120
不同意
30
50
80
合计
100
100
200
(1)能否有的把握认为学生对“三项体育活动中要有篮球”这种观点的态度与性别有关?
(2)假设现有足球、篮球、跳绳这三项体育活动供学生选择.
①若甲、乙两名学生从这三项运动中随机选一种假设他们选择各项运动的概率相同并且相互独立互不影响.记事件为“学生甲选择足球”,事件为“甲、乙两名学生都没有选择篮球”,求,并判断事件,是否独立,请说明理由.
②若该校所有学生每分钟跳绳个数.根据往年经验,该校学生经过训练后,跳绳个数都有明显进步.假设经过训练后每人每分钟跳绳个数比开始时个数均增加10个,若该校有1000名学生,请预估经过训练后该校每分钟跳169个以上的学生人数(结果四舍五入到整数).
参考公式和数据:,其中,.若,,,.
/
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。