内容正文:
专题04 统计
(易错必刷30题6种题型专项训练)
题型一 用2×2列联表分析两分类变量间的关系 题型二 用等高堆积条形图分析两分类变量间的关系
题型三 有关“相关的检验” 题型四 有关“无关的检验”
题型五 独立性检验的综合应用 题型六 求回归直线方程
题型一 用2×2列联表分析两分类变量间的关系
1.(24-25高二下·辽宁·期中)为了了解性别与视力之间的关系,一个调查机构得到列联表如图,则当取下面何值时,性别与视力无关的可能性最大( )
男
女
近视
240
200
不近视
50
A.40 B.60 C.100 D.240
2.(24-25高二下·陕西汉中·阶段练习)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
合计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由计算值推断,得到的正确结论是( )
A.有以上的把握认为“爱好该项运动和性别有关”
B.有以上的把握认为“爱好该项运动和性别无关”
C.有以上的把握认为“爱好该项运动和性别有关”
D.有以上的把握认为“爱好该项运动和性别无关
3.(24-25高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
4.(2025高三·全国·专题练习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
5.(2024·宁夏银川·一模)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
合计
附:
P(K2≥k0)
0.05
0.025
0.010
0.005
k0
3.841
5.024
6.635
7.879
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”
题型二 用等高堆积条形图分析两分类变量间的关系
6.(22-23高二下·四川泸州·期末)2023年1月9日,中国在文昌航天发射场使用长征七号改运载火箭(下简称长七改火箭),成功发射实践二十三号卫星,中国航天实现2023年宇航发射“开门红”.为了解某中学高二学生对此新闻事件的关注程度,从该校高二学生中随机抽取了50名学生进行调查,调查样本中有20名女生.如图是根据样本的调查结果绘制的等高条形图(阴影区域表示关注“长七改火箭”的部分).
关注
没关注
合计
男
女
合计
0.150
0.100
0.050
0.010
0.005
2.072
2.706
3.841
6.635
7.879
(1)请你依据列联表的独立性检验,判断该校高二学生是否有95%的把握认为对“长七改火箭”的关注程度与性别有关?
(2)现从关注“长七改火箭”的同学中按照性别进行分层抽样抽取7人,求从7人中抽取两人,这两人都是男生的概率.
附:,其中.
7.(22-23高二下·吉林长春·阶段练习)某校组织在校学生观看学习“天宫课堂”,并对其中1000名学生进行了一次“飞天宇航梦”的调查,得到如下的两个等高条形图,其中被调查的男女学生比例为.
(1)求m,n的值(结果用分数表示);
(2)完成以下表格,并根据表格数据,依据小概率值的独立性检验,能否判断学生性别和是否有飞天宇航梦有关?
有飞天宇航梦
无飞天宇航梦
合计
男
女
合计
(3)在抽取的样本女生中,按有无飞天宇航梦用分层抽样的方法抽取5人.若从这5人中随机抽取3人进一步调查,求抽到有飞天宇航梦的女生人数X的分布列及数学期望.
附临界值表及参考公式:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
,.
8.(2024·全国·模拟预测)杭州亚运会开幕式于2023年9月23日在杭州奥体中心体育场举行.为了解某高校大一学生对亚运会开幕式的关注程度,从该校大一学生中随机抽取了200名学生进行调查,调查对象中有60名女生.下图是根据调查结果绘制的等高条形图(阴影区域表示关注亚运会开幕式的部分).
(1)完成下面的列联表,并计算回答是否有的把握认为“对亚运会开幕式的关注与性别有关”.
关注
没关注
总计
男生
女生
总计
(2)从上述关注亚运会开幕式的学生中,按分层抽样的方法抽出18人,然后从这18人中随机选出3人赠送开幕式门票,记被抽取的3人中获得“赠送亚运会开幕式门票”的女生人数为随机变量,求的分布列及数学期望.
附:,其中.
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
9.(21-22高二·全国·单元测试)某学校高二年级为调查本年度参加学业水平考试的学生是否需要年级提供帮助,从高二年级随机调查了50名学生,其中有20名男同学,如图是根据样本的调查结果绘制的等高条形图.
(1)根据已知条件与等高条形图完成下面的列联表:
单位:名
男同学
女同学
总计
需要帮助
不需要帮助
总计
(2)根据(1)中的列联表,依据的独立性检验,分析该校高二年级学生本年度学业水平考试需要年级提供帮助是否与性别有关.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
10.(21-22高二下·广西南宁·期末)疫苗是指用各种病原微生物制作的用于预防接种的生物制品,接种疫苗是预防和控制传染病最经济、有效的公共卫生干预措施.某制药厂对预防某种疾病的两种疫苗开展临床对比试验.若使用后的抗体呈阳性,则认为疫苗有效.在100名受访者中,60名接种灭活疫苗,剩余40名接种核酸疫苗,根据临床试验数据绘制等高条形图如图所示.已知在接种灭活疫苗的受访者中有6人抗体为阴性.
(1)求等高条形图中a的值;
(2)根据所给数据,完成下面的列联表:
抗体情况
灭活疫苗
核酸疫苗
总计
抗体为阳性
抗体为阴性
总计
100
(3)判断能否有90%的把握认为两种疫苗的预防效果存在差异?
参考公式:,其中
0.15
0.10
0.05
2.072
2.706
3.841
题型三 有关“相关的检验”
11.(24-25高二下·内蒙古巴彦淖尔·期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据:以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
P
0.10
0.05
0.01
k
2.706
3.841
6.635
A.有90%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.01的前提下,可以认为是否是篮球迷与性别有关
12.(24-25高二下·辽宁·期中)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下面表中所示:
男
女
合计
需要
50
25
s
不需要
200
225
425
合计
250
t
500
(1)求s,t;
(2)能否有99%的把握认为该地老年人是否需要帮助与性别有关?
(3)根据(2)的结论,你能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
附:,
0.050
0.010
0.001
k
3.841
6.635
10.828
13.(2025·浙江绍兴·模拟预测)为了研究DeepSeek(AI学习助手)对学生数学成绩的影响,将20名学生均分为两组,分别为使用组(使用DeepSeek)和非使用组.一段时间后,测得20名学生的数学成绩变化如下(单位:分):
使用组
1
1
2
2
3
3
3
4
非使用组
0
0
1
1
2
3
(1)从使用组中随机抽取两名学生,设其中成绩进步的人数为,求的分布列和数学期望;
(2)求20名学生数学成绩变化的中位数,并分别统计两组中低于与不低于的人数,完成如下列联表:
低于
不低于
总计
使用组
非使用组
总计
(3)根据(2)中的列联表,能否有的把握认为使用DeepSeek与数学成绩变化有显著关联?
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
14.(23-24高二下·吉林通化·期末)某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加班级工作
不太主动参加班级工作
合计
学习积极性高
18
b
25
学习积极性一般
a
19
c
合计
24
d
50
参考数据:
P(K2≥k0)
0.025
0.010
0.005
0.001
k0
5.024
6.635
7.879
10.828
(1)求a,b,c,d的值
(2)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(3)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.
题型四 有关“无关的检验”
15.(2025·甘肃金昌·二模)某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20.下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.有的把握认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
16.(24-25高二下·天津·期中)通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
17.(24-25高二下·全国·课后作业)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
运动
性别
总计
男
女
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
下列结论正确的是( )
A.认为“爱好该项运用与性别有关”,犯错误的概率不超过0.01
B.认为“爱好该项运用与性别无关”,犯错误的概率不超过0.01
C.认为“爱好该项运动与性别有关”,犯错误的概率不超过0.001
D.认为“爱好该项运动与性别无关”,犯错误的概率不超过0.001
18.(24-25高三下·浙江湖州·阶段练习)中国春节档电影《哪吒之魔童闹海》票房突破百亿,是中国第一部冲入全球影史票房前5的作品.同学小华在某影院用简单随机抽样的方法调查了200位观影人观看该电影的次数,并对他们的观影次数作出统计,具体如下:
年龄(岁)
少年组(18及以下)
青年组(19-35)
中年组(36-60)
老年组(61及以上)
调查人数
70
80
30
20
少年组、青年组、中年组、老年组分别有,,,的人看了2次该电影,其余的人都只看了1次.
(1)求这200位观众观看该电影的平均次数;
(2)小华记少年组与青年组为“组”,记中年组和老年组为“组”.请完成以下列联表,依据小概率值的独立性检验,能否认为观影次数与年龄层次有关联?
观影次数
年龄层次
合计
组
组
1次
2次
合计
附表:
0.1
0.05
0.01
2.706
3.841
6.635
参考公式:,.
题型五 独立性检验的综合应用
19.(2025·天津河东·二模)2024年12月26日,Deep Seek—V3首个版本正式上线,截至2025年2月9日,Deep Seek APP的累计下载量已超1.1亿次,AI成为当下的热门话题.立德中学高中数学社团以16至40岁人群使用Deep Seek频率为课题,分小组自主选题进行调查研究,下列说法正确的是( )
A.甲小组开展了Deep Seek每周使用频次与年龄的相关性研究,经计算样本相关系数,可以推断两个变量正线性相关,但相关程度很弱
B.乙小组利用最小二乘法得到Deep Seek每周使用频次y关于年龄x的经验回归方程为,可以推断年龄为30岁的群体每周使用频次一定为17次
C.丙小组用决定系数来比较模型的拟合效果,经验回归方程①和②的分别约为0.733和0.998,因此经验回归方程②的刻画效果比经验回归方程①的好很多
D.丁小组研究性别因素是否影响Deep Seek使用频次,根据小概率值的独立性检验,计算得到,可以认为不同性别的Deep Seek使用频次没有差异
20.(24-25高三下·山东青岛·开学考试)下表反映了12月份(共21个工作日)中,李华同学在每天的数学课上携带教材的情况,以及数学课上坐在李华同桌位置的同学,只有梓晴、陈伟和刘瑞可以作为李华的同桌.
日期
1
2
3
4
5
6
7
8
9
10
11
教材
无
有
有
无
有
有
无
有
有
无
无
同桌
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
梓晴
梓晴
陈伟
日期(续)
12
13
14
15
16
17
18
19
20
21
教材(续)
有
有
有
无
无
有
有
无
无
有
同桌(续)
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
从表格信息,我们可以推断( ):(附:)
A.有不小于95%的把握认为李华与梓晴同桌时上数学课有更大的概率携带教材
B.有不小于99%的把握认为李华与梓晴同桌时上数学课有更大的概率携带教材
C.有不小于95%的把握认为李华与刘瑞、陈伟同桌时上数学课有相等的概率携带教材
D.若强制刘瑞或陈伟与李华同桌,可能一定程度上提升李华上数学课携带教材的概率
21.(22-23高三下·重庆北碚·阶段练习)一医疗团队为研究治疗某种疾病的新药能否有助于7天内治愈该疾病病人,在已患病的500例病人中,随机分为两组,实验组服用该新药,对照组不服用该药,在其他治疗措施相同的情况下,统计7天内痊愈病例数,得到如下数据:
7天内未痊愈
7天内痊愈
对照组
30
170
实验组
20
280
根据表格数据,下列结论正确的是( )
参考公式及数据:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
A.在犯错误的概率不大于0.01的前提下,可以认为服用该新药与7天内治愈病人无关
B.在犯错误的概率不大于0.001的前提下,可以认为服用该新药与7天内治愈病人无关
C.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
D.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
22.(2025·甘肃甘南·模拟预测)某新能源汽车公司对其销售的、两款汽车的售后服务向消费者进行满意度调查,从购买这两款汽车的消费者中各随机抽取了名,调查结果统计如下表:
满意程度
汽车款式
合计
款
款
满意
不满意
合计
(1)补全列联表,并根据小概率值的独立性检验,能否认为消费者对A、B两款汽车的售后服务的满意度有差异?
(2)用频率估计概率,现从购买、款汽车的消费者中随机抽取人,表示这名消费者中对款汽车的售后服务持满意态度的人数,求的分布列和数学期望.
附:,.
题型六 求回归直线方程
23.(2025·重庆·三模)随机询问80名不同职业的人在购买食品时是否看营养说明,得到如下调查结果:
职业
买食品时是否看营养说明
合计
不看营养说明
看营养说明
从事与医疗相关行业
12
28
40
从事与医疗无关行业
18
22
40
合计
30
50
80
(1)从这80名受访者中随机抽出1人,已知此人在购买食品时要看营养说明,求这名受访者从事与医疗无关行业的概率;
(2)依据小概率的独立性检验,能否推断两个群体在购买食品时是否看营养说明存在差异?
参考公式:
独立性检验中常用小概率值和相应临界值:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
24.(2025·黑龙江哈尔滨·三模)某学校校庆时统计连续天进入学校参加活动的校友数(单位:千人)如下:
日期
月日
月日
月日
月日
月日
第天
参观人数
(1)由上表数据看出,可用线性回归模型拟合与的关系,请用相关系数加以说明(保留小数点后两位);(若,则认为与的线性相关性很强),并求出关于的线性回归方程;
(2)校庆期间学校开放号门、号门和号门供校友出入,校友从号门、号门和号门进入学校的概率分别为、、,且出学校与进学校选择相同门的概率为,选择与入校不同两门的概率各为.假设校友从号门、号门、号门出入学校互不影响,现有甲、乙、丙、丁名校友于月日回母校参加活动,设为人中从号门出学校的人数,求的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
25.(2025·甘肃白银·三模)某材料实验室研究了某种金属材料在不同冷却速率下的凝固点温度,以及冷却环境对材料热物性的影响.下表为某金属材料凝固点温度(单位:)随冷却速率(单位:)变化的统计数据.
10
20
30
40
50
650
640
600
590
580
(1)一般认为当时,经验回归方程的拟合效果非常好;当时,经验回归方程的拟合效果良好.试问该经验回归方程的拟合效果是非常好还是良好?说明你的理由.
(2)请利用所给数据求该金属凝固点温度与冷却速率之间的经验回归方程,并预测冷却速率为时,该金属的凝固点温度.
参考公式:;
相关系数.
参考数据:.
26.(24-25高二下·辽宁·期中)已知与及与的成对数据如下,且关于的回归直线方程为,
(1)求关于的回归直线方程;
(2)由散点图发现可以用指数型函数模型拟合与的关系,请建立关于的回归方程(,的值精确到);
(3)又得到一组新数据,,根据这对数据残差的绝对值的大小判断(1)、(2)两个方程哪个拟合效果更好.
参考数据:
其中,.
参考公式:对于一组数据,,,,
其回归直线方程为,其中,.
27.(2025·湖南·三模)我国新能源汽车的卓越性能赢得全球人民的信赖,某品牌新能源汽车凭借科研创新、广告宣传和可靠售后保障,在全球赢得了很好的营销局面.下表为2017年—2024年(年份代码分别记为:1,2,3,4,5,6,7,8)该品牌新能源汽车的科研经费投入和全球市场规模统计.
年份代码i
1
2
3
4
5
6
7
8
科研经费(单位:百亿元)
2
3
6
10
13
15
18
21
市场规模(单位:百万辆)
1
1
2
2.5
3.5
3.5
4.5
6
参考数据:,,,.
参考公式:相关系数.
(1)根据样本数据,推断两个变量是否线性相关,并计算样本相关系数,推断它们的线性相关程度(结果精确到0.01,当越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱);
(2)已知在国内,新能源车主购买的新能源汽车为该品牌新能源汽车的概率为p(),从国内新能源车主中随机抽取5人,记这5人中选择购买该品牌的人数为随机变量X,若,求随机变量X的数学期望和方差
28.(24-25高二下·辽宁·期中)某课外实验小组通过实验统计了某种子的发芽率y%与土壤的湿度x%的相关数据如下表:
x
40
45
50
55
60
y
50
56
64
72
83
(1)求y关于x的相关系数r(精确到0.001),并判断它们是否具有较强的线性相关关系?
(2)求y关于x的回归直线方程,并预测当土壤的湿度为70%时,种子的发芽率y%的值.
参考公式及数据:对于一组数据,,…,,回归直线方程的斜率和截距的最小二乘估计公式分别为,,相关系数,,,.
29.(24-25高二下·河南南阳·期中)某人工智能公司从2018至2024年的利润情况如下表所示:
年份
2018
2019
2020
2021
2022
2023
2024
年份代码x
1
2
3
4
5
6
7
利润y(单位:亿元)
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)根据表中的数据,推断变量y与x之间是否线性相关.计算y与x之间的相关系数(精确到0.01),并推断它们的相关程度;
(2)求出y关于x的经验回归方程,并预测该人工智能公司2025年的利润;
参考数据:
参考公式:对于一组数据,①相关系数为:;
②经验回归直线x的斜率和截距的最小二乘估计公式分别,
30.(24-25高二下·山东烟台·期中)某种产品销售价格x(万元/吨)和销售量y(吨)的变化情况如表:
x
5
5.5
6
6.5
7
y
13
11
10
9
7
(1)计算y与x的相关系数r,并说明y与x的关系是否可用线性回归模型拟合;(一般地,若,则可认为线性相关程度较高,可用线性回归模型拟合.)
(2)若该产品每吨成本为4万元,请利用y与x的回归.关系预测:销售价格定为多少时该产品的销售利润最大?(结果精确到0.01)
参考公式:对于一组数据,
其相关系数;其回归直线的斜率和截距的最小二乘估计分别为:,.
参考数据:,.
1 / 1
1 / 1
学科网(北京)股份有限公司
$$
专题04 统计
(易错必刷30题6种题型专项训练)
题型一 用2×2列联表分析两分类变量间的关系 题型二 用等高堆积条形图分析两分类变量间的关系
题型三 有关“相关的检验” 题型四 有关“无关的检验”
题型五 独立性检验的综合应用 题型六 求回归直线方程
题型一 用2×2列联表分析两分类变量间的关系
1.(24-25高二下·辽宁·期中)为了了解性别与视力之间的关系,一个调查机构得到列联表如图,则当取下面何值时,性别与视力无关的可能性最大( )
男
女
近视
240
200
不近视
50
A.40 B.60 C.100 D.240
【答案】B
【分析】根据相关性的概念求解即可.
【详解】根据相关性的概念可知当,即近视与不近视的男女比例相同时,性别与视力无关的可能性最大,
解得,
故选:B
2.(24-25高二下·陕西汉中·阶段练习)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
男
女
合计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
由计算值推断,得到的正确结论是( )
A.有以上的把握认为“爱好该项运动和性别有关”
B.有以上的把握认为“爱好该项运动和性别无关”
C.有以上的把握认为“爱好该项运动和性别有关”
D.有以上的把握认为“爱好该项运动和性别无关
【答案】A
【分析】根据表格和公式计算的值,即可判断.
【详解】由题意,,
因此,有以上的把握认为“爱好该项运动和性别有关”.
故选:A.
3.(24-25高二·全国·课堂例题)一个列联表如下:
合计
35
45
7
合计
73
则表中,的值分别是 ( )
A.10,38 B.17,45 C.10,45 D.17,38
【答案】B
【分析】由列联表数据,列出等式即可求解;
【详解】由,得.
由,得.
由,得.
由,得.
故选:B
4.(2025高三·全国·专题练习)下面是列联表:
合计
21
73
22
25
47
合计
46
120
则表中,的值分别为( )
A.94,72 B.52,50 C.52,74 D.74.52
【答案】C
【分析】根据联表计算求参即可.
【详解】因为.所以.又,所以.
故选:C.
5.(2024·宁夏银川·一模)有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
总计
甲班
10
b
乙班
c
30
合计
附:
P(K2≥k0)
0.05
0.025
0.010
0.005
k0
3.841
5.024
6.635
7.879
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.列联表中c的值为30,b的值为35
B.列联表中c的值为15,b的值为50
C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”
D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”
【答案】C
【分析】根据题中条件计算可判断选项A、B;根据列联表计算出的值,即可判断选项C,D.
【详解】由题意知,成绩优秀的学生数是,
成绩非优秀的学生数是75,所以,
选项A、B错误;
根据列联表中的数据,
得到
因此有97.5%的把握认为“成绩与班级有关系”.
故C正确,D错误,
故选:C.
题型二 用等高堆积条形图分析两分类变量间的关系
6.(22-23高二下·四川泸州·期末)2023年1月9日,中国在文昌航天发射场使用长征七号改运载火箭(下简称长七改火箭),成功发射实践二十三号卫星,中国航天实现2023年宇航发射“开门红”.为了解某中学高二学生对此新闻事件的关注程度,从该校高二学生中随机抽取了50名学生进行调查,调查样本中有20名女生.如图是根据样本的调查结果绘制的等高条形图(阴影区域表示关注“长七改火箭”的部分).
关注
没关注
合计
男
女
合计
0.150
0.100
0.050
0.010
0.005
2.072
2.706
3.841
6.635
7.879
(1)请你依据列联表的独立性检验,判断该校高二学生是否有95%的把握认为对“长七改火箭”的关注程度与性别有关?
(2)现从关注“长七改火箭”的同学中按照性别进行分层抽样抽取7人,求从7人中抽取两人,这两人都是男生的概率.
附:,其中.
【答案】(1)没有95%的把握认为对“长七改火箭”的关注程度与性别有关
(2)
【分析】(1)根据等高条形图完善列联表,根据表格中的数据,利用公式求得,再与临界值表对比即可得结论;
(2)设5名男生为,2名女生为,列举出从7人中抽取两人的所有情况,以及这两人都是男生的情况,利用古典概型概率公式可得答案.
【详解】(1)50名学生进行调查,调查样本中有20名女生,有30名男生,
由等高条形图可知,女生中有6名同学关注长七改火箭,
男生中有15名同学关注长七改火箭,
列联表如下:
关注
没关注
合计
男
15
15
30
女
6
14
20
合计
21
29
50
所以没有95%的把握认为对“长七改火箭”的关注程度与性别有关;
(2)关注“长七改火箭”的同学中,男生与女生的比例为15:6=5:2,
所以,从关注“长七改火箭”的同学中按照性别进行分层抽样抽取7人,
男生有5人,女生有2人,设5名男生为,2名女生为,
从7人中抽取两人共有21种情况:
其中,这两人都是男生共有10种情况:
所以从7人中抽取两人,这两人都是男生的概率为.
7.(22-23高二下·吉林长春·阶段练习)某校组织在校学生观看学习“天宫课堂”,并对其中1000名学生进行了一次“飞天宇航梦”的调查,得到如下的两个等高条形图,其中被调查的男女学生比例为.
(1)求m,n的值(结果用分数表示);
(2)完成以下表格,并根据表格数据,依据小概率值的独立性检验,能否判断学生性别和是否有飞天宇航梦有关?
有飞天宇航梦
无飞天宇航梦
合计
男
女
合计
(3)在抽取的样本女生中,按有无飞天宇航梦用分层抽样的方法抽取5人.若从这5人中随机抽取3人进一步调查,求抽到有飞天宇航梦的女生人数X的分布列及数学期望.
附临界值表及参考公式:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
,.
【答案】(1),;
(2)列联表见解析,不能
(3)分布列见解析,
【分析】(1)根据得到被调查的男女上的人数,以及有飞天宇航梦和无飞天宇航梦的男生和女生的认识,进而求得的值;
(2)根据(1)中的数据列出的列联表,求得的值,结合题意,即可得到结论;
(3)根据题意,得到随机变量的可能取值为,求得相应的概率,列出分布列,结合期望的公式,即可求解.
【详解】(1)解:由题可知被调查的男女学生分别为600人,400人,
男生有飞天宇航梦的学生有人,无飞天宇航梦的学生有人,
女生有飞天宇航梦的学生有人,无飞天宇航梦的学生有人,
所以,.
(2)解:根据(1)中数据填表,
有飞天宇航梦
无飞天宇航梦
合计
男
420
180
600
女
240
160
400
合计
660
340
1000
可得
根据小概率的独立性检验,
所以没有充分证据推断不成立,因此可以认为成立,即不能判断学生性别和是否有飞天宇航梦有关.
(3)解:根据题意,在抽取的5名女生中,有3名女生有飞天宇航梦,2名女生无飞天宇航梦,则X的可能取值为1,2,3,
可得,,,
故随机变量的分布列为
1
2
3
所以的数学期望.
8.(2024·全国·模拟预测)杭州亚运会开幕式于2023年9月23日在杭州奥体中心体育场举行.为了解某高校大一学生对亚运会开幕式的关注程度,从该校大一学生中随机抽取了200名学生进行调查,调查对象中有60名女生.下图是根据调查结果绘制的等高条形图(阴影区域表示关注亚运会开幕式的部分).
(1)完成下面的列联表,并计算回答是否有的把握认为“对亚运会开幕式的关注与性别有关”.
关注
没关注
总计
男生
女生
总计
(2)从上述关注亚运会开幕式的学生中,按分层抽样的方法抽出18人,然后从这18人中随机选出3人赠送开幕式门票,记被抽取的3人中获得“赠送亚运会开幕式门票”的女生人数为随机变量,求的分布列及数学期望.
附:,其中.
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
【答案】(1)列联表见解析,有的把握认为“对亚运会开幕式的关注与性别有关”
(2)分布列见解析,
【分析】(1)先根据题意补充列联表,再利用公式求出,最后对比临界值表即可求解;
(2)根据分层抽样确定男生、女生人数,由随机变量的值求出对应的概率,进而得到分布列和数学期望.
【详解】(1)根据题意,男生(名).
关注亚运会开幕式的男生(人),女生(人);
没有关注亚运会开幕式的男生(人),女生(人);
因此,列联表完成如下:
关注
没关注
总计
男生
70
70
140
女生
20
40
60
总计
90
110
200
提出假设对亚运会开幕式的关注与性别无关.
由列联表数据可得,
根据的独立性检验,推断不成立,
所以有的把握认为“对亚运会开幕式的关注与性别有关”.
(2)由(1)知对关注亚运会开幕式的学生总人数为,按分层抽样的方法抽出18人,
则抽样比为,其男生人数为,女生人数为.
从其中随机选出3人赠送开幕式门票,则的所有可能取值为.
,
,
故的分布列为
0
1
2
3
所以的数学期望.
9.(21-22高二·全国·单元测试)某学校高二年级为调查本年度参加学业水平考试的学生是否需要年级提供帮助,从高二年级随机调查了50名学生,其中有20名男同学,如图是根据样本的调查结果绘制的等高条形图.
(1)根据已知条件与等高条形图完成下面的列联表:
单位:名
男同学
女同学
总计
需要帮助
不需要帮助
总计
(2)根据(1)中的列联表,依据的独立性检验,分析该校高二年级学生本年度学业水平考试需要年级提供帮助是否与性别有关.
附:,其中.
0.050
0.010
0.001
3.841
6.635
10.828
【答案】(1)答案见解析;
(2)认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
【分析】(1)根据等高条形图分别求出男、女同学需要帮助和不需要帮助的分数,可得出列联表.
(2)先由公式求出的值,再对照表格中给出的值可得答案.
【详解】(1)由题意知有20名男同学,则有30名女同学.
由题中等高条形图可知男同学需要帮助的有4人,不需要帮助的有16人.
女同学需要帮助的有3人,不需要帮助的有27人.
则列联表为
单位:名
男同学
女同学
总计
需要帮助
4
3
7
不需要帮助
16
27
43
总计
20
30
50
(2)假设:该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
经计算得,
依据的独立性检验,没有充分证据推断不成立,因此证明成立,
即认为该校高二年级学生本年度学业水平考试需要年级提供帮助与性别无关.
10.(21-22高二下·广西南宁·期末)疫苗是指用各种病原微生物制作的用于预防接种的生物制品,接种疫苗是预防和控制传染病最经济、有效的公共卫生干预措施.某制药厂对预防某种疾病的两种疫苗开展临床对比试验.若使用后的抗体呈阳性,则认为疫苗有效.在100名受访者中,60名接种灭活疫苗,剩余40名接种核酸疫苗,根据临床试验数据绘制等高条形图如图所示.已知在接种灭活疫苗的受访者中有6人抗体为阴性.
(1)求等高条形图中a的值;
(2)根据所给数据,完成下面的列联表:
抗体情况
灭活疫苗
核酸疫苗
总计
抗体为阳性
抗体为阴性
总计
100
(3)判断能否有90%的把握认为两种疫苗的预防效果存在差异?
参考公式:,其中
0.15
0.10
0.05
2.072
2.706
3.841
【答案】(1)0.9
(2)见解析
(3)没有%的把握认为两种疫苗的预防效果存在差异.
【分析】(1)根据题意求出注射灭活疫苗后抗体呈阳性发生的概率求得.
(2)根据已知条件填写列联表.
(3)计算出的值,由此作出判断.
【详解】(1)由题意,在接种灭活疫苗的受访者中有6人抗体为阴性,
故抗体阳性发生的概率为,
所以等高条形图中a的值为.
(2)由等高条形图知注射核酸疫苗的40人中,抗体阳性的为,
故可列联表如下:
抗体情况
灭活疫苗
核酸疫苗
总计
抗体为阳性
抗体为阴性
总计
60
40
100
(3),
所以没有%的把握认为两种疫苗的预防效果存在差异.
题型三 有关“相关的检验”
11.(24-25高二下·内蒙古巴彦淖尔·期中)某学校在一次调查“篮球迷”的活动中,获得了如下数据:以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
P
0.10
0.05
0.01
k
2.706
3.841
6.635
A.有90%的把握认为是否是篮球迷与性别有关
B.有99%的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过0.05的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过0.01的前提下,可以认为是否是篮球迷与性别有关
【答案】A
【分析】根据已知表格数据及卡方公式求卡方值,应用独立检验基本思想得到结论,即可得.
【详解】由题设,
所以有90%的把握认为是否是篮球迷与性别有关,没有95%的把握认为是否是篮球迷与性别有关,A对,B、C、D错;
故选:A
12.(24-25高二下·辽宁·期中)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下面表中所示:
男
女
合计
需要
50
25
s
不需要
200
225
425
合计
250
t
500
(1)求s,t;
(2)能否有99%的把握认为该地老年人是否需要帮助与性别有关?
(3)根据(2)的结论,你能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.
附:,
0.050
0.010
0.001
k
3.841
6.635
10.828
【答案】(1),
(2)有
(3)采用分层抽样,理由见解析
【分析】(1)根据表格中的数据完善列联表.
(2)计算后与临界值比较即可判断.
(3)根据(2)知该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,故选择分层抽样.
【详解】(1)由列联表知,.
(2)由列联表得,
由于,所以有99%的把握认为该地老年人是否需要帮助与性别有关.
(3)采用分层抽样,理由如下:
由(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,
因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男女两层并采用分层抽样方法比采用简单随机抽样方法更好.
13.(2025·浙江绍兴·模拟预测)为了研究DeepSeek(AI学习助手)对学生数学成绩的影响,将20名学生均分为两组,分别为使用组(使用DeepSeek)和非使用组.一段时间后,测得20名学生的数学成绩变化如下(单位:分):
使用组
1
1
2
2
3
3
3
4
非使用组
0
0
1
1
2
3
(1)从使用组中随机抽取两名学生,设其中成绩进步的人数为,求的分布列和数学期望;
(2)求20名学生数学成绩变化的中位数,并分别统计两组中低于与不低于的人数,完成如下列联表:
低于
不低于
总计
使用组
非使用组
总计
(3)根据(2)中的列联表,能否有的把握认为使用DeepSeek与数学成绩变化有显著关联?
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
【答案】(1)分布列见解析,数学期望为
(2),列联表见解析
(3)有
【分析】(1)利用组合数公式计算离散型随机变量取不同值的概率,进而得到分布列,再根据期望公式计算期望;
(2)根据中位数的定义确定的值并列出列联表;
(3)依据独立性检验的公式计算值,并与临界值比较,判断是否有把握认为两个变量有关联.
【详解】(1)由题意知:的可能取值为,
,
的分布列为:
0
1
2
(2)由题意知:20名学生成绩变化的中位数为
列联表如下:
低于
不低于
总计
使用组
2
8
10
非使用组
6
4
10
总计
8
12
20
(3)零假设:认为使用DeepSeek与数学成绩变化无关,
,则不成立,
有的把握认为使用DeepSeek与数学成绩变化有显著关联.
14.(23-24高二下·吉林通化·期末)某班主任对全班50名学生学习积极性和对待班级工作的态度进行了调查,统计数据如下表所示:
积极参加班级工作
不太主动参加班级工作
合计
学习积极性高
18
b
25
学习积极性一般
a
19
c
合计
24
d
50
参考数据:
P(K2≥k0)
0.025
0.010
0.005
0.001
k0
5.024
6.635
7.879
10.828
(1)求a,b,c,d的值
(2)如果随机抽查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太主动参加班级工作且学习积极性一般的学生的概率是多少?
(3)试运用独立性检验的思想方法分析:学生的学习积极性与对待班级工作的态度是否有关系?说明理由.
【答案】(1)
(2),
(3)有,理由见解析
【分析】(1)据表中的数据可求出的值;
(2)先确定基本事件的总数与所求事件包含的基本事件个数,代入古典概率的计算公式即可;
(3)由题中的数据直接计算与临界值比较,即可得出结论.
【详解】(1)因为;,,.
所以.
(2)随机抽查这个班的一名学生,有50种不同的抽查方法,由于积极参加班级工作的学生有18+6=24人,所以抽到积极参加工作的学生有24种不同的抽法,因此由古典概型的计算公式可得抽到积极参加班级工作的学生的概率是P1==,又因为不太主动参加班级工作且学习积极性一般的学生有19人,所以抽到不太主动参加班级工作且学习积极性一般的学生的概率是P2=.
(3)由χ2统计量的计算公式得χ2=≈11.538,由于11.538>10.828,
所以有99.9%的把握认为“学生的学习积极性与对待班级工作的态度有关系”.
题型四 有关“无关的检验”
15.(2025·甘肃金昌·二模)某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20.下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.有的把握认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
【答案】B
【分析】求得卡方值,比对临界值,逐个判断即可.
【详解】由题意,列出列联表:
接受
不接受
合计
男
40
60
100
女
20
80
100
合计
60
140
200
零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,
所以,
根据小概率值的独立性检验,我们推断不成立,
即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.
故选:B.
16.(24-25高二下·天津·期中)通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
【答案】A
【分析】根据独立性检验的原理逐项判断可得答案.
【详解】零假设为:爱好跳绳与性别无关.
A.∵,
∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关.选项A正确.
B. ∵,
∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关,但无法判断这个结论犯错误的概率是否超过.选项B错误.
C.∵,
∴根据小概率值的独立性检验,我们认为爱好跳绳与性别有关.选项C错误.
D. ∵,
∴在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别有关.选项D错误.
故选:A.
17.(24-25高二下·全国·课后作业)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:
运动
性别
总计
男
女
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
下列结论正确的是( )
A.认为“爱好该项运用与性别有关”,犯错误的概率不超过0.01
B.认为“爱好该项运用与性别无关”,犯错误的概率不超过0.01
C.认为“爱好该项运动与性别有关”,犯错误的概率不超过0.001
D.认为“爱好该项运动与性别无关”,犯错误的概率不超过0.001
【答案】A
【分析】由独立性检验卡方计算卡方后,结合独立性检验相关概念可得答案.
【详解】由公式,
由可知,认为“爱好该项运动与性别有关”,
犯错误的概率不超过0.01.
故选:A
18.(24-25高三下·浙江湖州·阶段练习)中国春节档电影《哪吒之魔童闹海》票房突破百亿,是中国第一部冲入全球影史票房前5的作品.同学小华在某影院用简单随机抽样的方法调查了200位观影人观看该电影的次数,并对他们的观影次数作出统计,具体如下:
年龄(岁)
少年组(18及以下)
青年组(19-35)
中年组(36-60)
老年组(61及以上)
调查人数
70
80
30
20
少年组、青年组、中年组、老年组分别有,,,的人看了2次该电影,其余的人都只看了1次.
(1)求这200位观众观看该电影的平均次数;
(2)小华记少年组与青年组为“组”,记中年组和老年组为“组”.请完成以下列联表,依据小概率值的独立性检验,能否认为观影次数与年龄层次有关联?
观影次数
年龄层次
合计
组
组
1次
2次
合计
附表:
0.1
0.05
0.01
2.706
3.841
6.635
参考公式:,.
【答案】(1)
(2)列联表见解析;认为观影次数与年龄层次有关联,此推断犯错误的概率不大于0.05.
【分析】(1)先分别算出观看不同次数电影的人数,再根据公式计算平均次数.
(2)零假设是认为两个变量无关联,通过计算卡方统计量,并与给定的小概率值对应的临界值比较,来判断是否拒绝零假设.
【详解】(1)70人的群体中观看2次电影的人数为人;
80人的群体中观看2次电影的人数为人;
30人的群体中观看2次电影的人数为人;
20人的群体中观看2次电影的人数为人.
将这些人数相加,可得观看2次该电影总人数为人.
已知观看1次电影的总人数为200-72=128人,观看2次电影的总人数为72人,总人数为200人.
这200位观众观看该电影的平均次数为.
(2)零假设:观影次数与年龄层次无关联.
从题目中可知,A组观看1次电影的有90人,B组观看1次电影的有38人,所以观看1次电影的合计128人;
A组观看2次电影的有60人,B组观看2次电影的有12人,所以观看2次电影的合计72人;
A组合计150人,B组合计50人,总人数200人.
整理数据得到列联表:
观影次数
年龄层次
合计
A组
B组
1次
90
38
128
2次
60
12
72
合计
150
50
200
计算卡方统计量:代入可得.
根据小概率值的独立性检验,我们推断不成立,即认为观影次数与年龄层次有关联,此推断犯错误的概率不大于0.05.
题型五 独立性检验的综合应用
19.(2025·天津河东·二模)2024年12月26日,Deep Seek—V3首个版本正式上线,截至2025年2月9日,Deep Seek APP的累计下载量已超1.1亿次,AI成为当下的热门话题.立德中学高中数学社团以16至40岁人群使用Deep Seek频率为课题,分小组自主选题进行调查研究,下列说法正确的是( )
A.甲小组开展了Deep Seek每周使用频次与年龄的相关性研究,经计算样本相关系数,可以推断两个变量正线性相关,但相关程度很弱
B.乙小组利用最小二乘法得到Deep Seek每周使用频次y关于年龄x的经验回归方程为,可以推断年龄为30岁的群体每周使用频次一定为17次
C.丙小组用决定系数来比较模型的拟合效果,经验回归方程①和②的分别约为0.733和0.998,因此经验回归方程②的刻画效果比经验回归方程①的好很多
D.丁小组研究性别因素是否影响Deep Seek使用频次,根据小概率值的独立性检验,计算得到,可以认为不同性别的Deep Seek使用频次没有差异
【答案】C
【分析】由相关系数,回归方程,决定系数,卡方的检验逐项判断即可.
【详解】对于A,由的绝对值越接近1,相关性越强可得A错误,故A错误;
对于B,回归方程为给出的是预测值,实际值会有随机误差,所以年龄为30岁的群体每周使用频次不一定为17次,故B错误;
对于C,表示模型对因变量的解释比例,大说明经验回归方程②的刻画效果比经验回归方程①的好很多,故C正确;
对于D,,可以认为不同性别的Deep Seek使用频次有差异,故D错误.
故选:C
20.(24-25高三下·山东青岛·开学考试)下表反映了12月份(共21个工作日)中,李华同学在每天的数学课上携带教材的情况,以及数学课上坐在李华同桌位置的同学,只有梓晴、陈伟和刘瑞可以作为李华的同桌.
日期
1
2
3
4
5
6
7
8
9
10
11
教材
无
有
有
无
有
有
无
有
有
无
无
同桌
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
梓晴
梓晴
陈伟
日期(续)
12
13
14
15
16
17
18
19
20
21
教材(续)
有
有
有
无
无
有
有
无
无
有
同桌(续)
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
梓晴
陈伟
刘瑞
从表格信息,我们可以推断( ):(附:)
A.有不小于95%的把握认为李华与梓晴同桌时上数学课有更大的概率携带教材
B.有不小于99%的把握认为李华与梓晴同桌时上数学课有更大的概率携带教材
C.有不小于95%的把握认为李华与刘瑞、陈伟同桌时上数学课有相等的概率携带教材
D.若强制刘瑞或陈伟与李华同桌,可能一定程度上提升李华上数学课携带教材的概率
【答案】D
【分析】完善相应的列联表,求得卡方值,比较临界值,逐项判断即可;
【详解】与梓晴同桌8天,2天带教材,6天没带;
与陈伟同桌7天,5天带教材,2天没带;
与刘瑞同桌6天,5天带教材,1天没带;
带教材
没带教材
合计
梓晴
2
6
8
其他同桌
10
3
13
合计
12
9
21
,
所以认为有95%的把握认为李华是否带教材与谁是同桌有关;
,
所以认为没有99%的把握认为李华是否带教材与谁是同桌有关;故AB错误;
带教材
没带教材
合计
刘瑞
5
1
6
陈伟
5
2
7
合计
10
3
13
,所以没有95%的把握认为李华是否带教材与谁是同桌有关,C错误;
从数据:与梓晴同桌8天,2天带教材,6天没带;
与陈伟同桌7天,5天带教材,2天没带;
与刘瑞同桌6天,5天带教材,1天没带;
可以认为强制刘瑞或陈伟与李华同桌,可能一定程度上提升李华上数学课携带教材的概率,D正确,
故选:D
21.(22-23高三下·重庆北碚·阶段练习)一医疗团队为研究治疗某种疾病的新药能否有助于7天内治愈该疾病病人,在已患病的500例病人中,随机分为两组,实验组服用该新药,对照组不服用该药,在其他治疗措施相同的情况下,统计7天内痊愈病例数,得到如下数据:
7天内未痊愈
7天内痊愈
对照组
30
170
实验组
20
280
根据表格数据,下列结论正确的是( )
参考公式及数据:,其中.
0.10
0.010
0.001
2.706
6.635
10.828
A.在犯错误的概率不大于0.01的前提下,可以认为服用该新药与7天内治愈病人无关
B.在犯错误的概率不大于0.001的前提下,可以认为服用该新药与7天内治愈病人无关
C.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
D.根据小概率值的独立性检验,可以推断服用该新药与7天内治愈病人有关
【答案】C
【分析】求出卡方值,和6.635,10.828比较即可根据小概率值的独立性检验判断.
【详解】,所以根据小概率值的独立性检验,有充分证据推断服用该新药对7天内治愈病人有影响,
因此在犯错误的概率不大于0.01的前提下,可以推断服用该新药与7天内治愈病人有关,故C正确,A错误.
,所以根据小概率值的独立性检验,没有充分证据推断服用该新药对7天内治愈病人有关,
因此在犯错误的概率不大于0.001的前提下,不可以推断服用该新药与7天内治愈病人有关,故BD错误.
故选:C.
22.(2025·甘肃甘南·模拟预测)某新能源汽车公司对其销售的、两款汽车的售后服务向消费者进行满意度调查,从购买这两款汽车的消费者中各随机抽取了名,调查结果统计如下表:
满意程度
汽车款式
合计
款
款
满意
不满意
合计
(1)补全列联表,并根据小概率值的独立性检验,能否认为消费者对A、B两款汽车的售后服务的满意度有差异?
(2)用频率估计概率,现从购买、款汽车的消费者中随机抽取人,表示这名消费者中对款汽车的售后服务持满意态度的人数,求的分布列和数学期望.
附:,.
【答案】(1)列联表见解析,无差异
(2)证明见解析,
【分析】(1)完善列联表,提出零假设消费者对、款汽车售后服务的满意度无差异, 计算出的观测值,结合临界值表可得出结论;
(2)分析可知,利用二项分布可得出随机变量的分布列,进一步可求得的值.
【详解】(1)列联表为:
满意程度
汽车款式
合计
款
款
满意
不满意
合计
零假设消费者对、款汽车售后服务的满意度无差异,
根据列联表中的数据,计算得,,
根据小概率值的独立性检验,没有充分理由推断不成立,
故消费者对、款汽车的售后服务的满意度无差异.
(2)从名消费者中随机抽人,对款车的售后服务持满意态度的频率为,
所以从购买、款汽车的消费者中随机抽取人,
则该人对款汽车的售后服务持满意态度的概率为,
X的可能取值为、、、、,且,
,,
,,
,
所以的分布列为:
(或).
题型六 求回归直线方程
23.(2025·重庆·三模)随机询问80名不同职业的人在购买食品时是否看营养说明,得到如下调查结果:
职业
买食品时是否看营养说明
合计
不看营养说明
看营养说明
从事与医疗相关行业
12
28
40
从事与医疗无关行业
18
22
40
合计
30
50
80
(1)从这80名受访者中随机抽出1人,已知此人在购买食品时要看营养说明,求这名受访者从事与医疗无关行业的概率;
(2)依据小概率的独立性检验,能否推断两个群体在购买食品时是否看营养说明存在差异?
参考公式:
独立性检验中常用小概率值和相应临界值:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)无差异
【分析】(1)根据条件概率及古典概型计算即可;
(2)代入公式计算的值,结合临界值判断即可.
【详解】(1)用A表示事件“受访者在购买食品是要看营养说明”,
B表示事件“受访者从事医疗无关行业”,“已知此人在购买食品时要看营养说明,
求这名受访者从事与医疗无关行业”的概率就是在“在事件A发生的条件下,事件B发生”的概率,记为,
,,所以;
(2)零假设为:职业与看营养说明相互独立,即两个群体在购买食品时是否看营养说明无差异,
根据表中数据,计算得到,
根据小概率值的独立性检验,没有充分证据推断不成立,
所以可以认为成立,
即认为两个群体在购买食品时是否看营养说明无差异.
24.(2025·黑龙江哈尔滨·三模)某学校校庆时统计连续天进入学校参加活动的校友数(单位:千人)如下:
日期
月日
月日
月日
月日
月日
第天
参观人数
(1)由上表数据看出,可用线性回归模型拟合与的关系,请用相关系数加以说明(保留小数点后两位);(若,则认为与的线性相关性很强),并求出关于的线性回归方程;
(2)校庆期间学校开放号门、号门和号门供校友出入,校友从号门、号门和号门进入学校的概率分别为、、,且出学校与进学校选择相同门的概率为,选择与入校不同两门的概率各为.假设校友从号门、号门、号门出入学校互不影响,现有甲、乙、丙、丁名校友于月日回母校参加活动,设为人中从号门出学校的人数,求的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
【答案】(1),说明见解析,
(2)分布列见解析,,.
【分析】(1)求出,将参考数据代入相关系数公式,求出的值,即可得出结论;再将数据代入最小二乘法公式,求出、的值,即可得出回归直线方程;
(2)利用全概率公式求出每个人从号门出校园的概率均为,由此可知,利用二项分布可得出随机变量的分布列,利用二项分布的期望、方差公式可得出、的值.
【详解】(1)依题意,,而,,,
则.
因为时线性相关程度高,所以与线性相关性很强,可以用线性回归模型拟合.
,,
因此,回归方程为.
(2)记“甲从号门出学校”为事件,“甲从号门进学校”为事件,
“甲从号门进学校”为事件,“甲从号门进学校”为事件,
由题意可得,,,
,,
由全概率公式得:
,
同理乙、丙、丁从号门出学校的概率也为,
为人中从号门出学校的人数,则,
,,
,,
,
故的分布列为:
,.
25.(2025·甘肃白银·三模)某材料实验室研究了某种金属材料在不同冷却速率下的凝固点温度,以及冷却环境对材料热物性的影响.下表为某金属材料凝固点温度(单位:)随冷却速率(单位:)变化的统计数据.
10
20
30
40
50
650
640
600
590
580
(1)一般认为当时,经验回归方程的拟合效果非常好;当时,经验回归方程的拟合效果良好.试问该经验回归方程的拟合效果是非常好还是良好?说明你的理由.
(2)请利用所给数据求该金属凝固点温度与冷却速率之间的经验回归方程,并预测冷却速率为时,该金属的凝固点温度.
参考公式:;
相关系数.
参考数据:.
【答案】(1)拟合效果非常好,理由见解析
(2);
【分析】(1)首先根据表格里面的数据求出的平均值,然后根据根据相关系数公式求出相关系数.
(2)首先求出回归方程的表达式,然后将冷却速率值代入,求出金属的凝固点温度.
【详解】(1)易知,
因为,,
,
因为
所以该经验回归方程的拟合效果非常好.
(2)由(1)知,由,
因为,
所以,故所求的经验回归方程为.
当时,,
所以冷却速率为时,该金属的凝固点温度为.
26.(24-25高二下·辽宁·期中)已知与及与的成对数据如下,且关于的回归直线方程为,
(1)求关于的回归直线方程;
(2)由散点图发现可以用指数型函数模型拟合与的关系,请建立关于的回归方程(,的值精确到);
(3)又得到一组新数据,,根据这对数据残差的绝对值的大小判断(1)、(2)两个方程哪个拟合效果更好.
参考数据:
其中,.
参考公式:对于一组数据,,,,
其回归直线方程为,其中,.
【答案】(1)
(2),
(3)指数函数模型拟合效果更好.
【分析】(1)方法一:设关于的回归直线方程为,由条件求,,,,再由公式求,,由此可得结论;
方法二:由条件可得,,结合关于的回归直线方程为,可求结论;
(2)由条件可得,设,,,则,利用公式求,由此可得结论;
(3)结合(1),(2)分别求当时,两个回归方程对应的残差,比较残差的大小判断结论.
【详解】(1)方法一:设关于的回归直线方程为,
由已知,,
,
,
所以,
,
所以关于的回归直线方程为,
方法二:因为关于的回归直线方程为,
因为,,
所以,,
则,
所以关于的回归直线方程为,
(2)若用指数型函数模型拟合与的关系,则有,
设,,,
则,
,
,
所以,
所以,
所以关于的回归方程为,
(3)由(1)关于的回归直线方程为,
所以时,,
残差为,
由(2)关于的指数函数模型的回归方程为,
所以时,,
残差为,
因为,所以指数函数模型拟合效果更好.
27.(2025·湖南·三模)我国新能源汽车的卓越性能赢得全球人民的信赖,某品牌新能源汽车凭借科研创新、广告宣传和可靠售后保障,在全球赢得了很好的营销局面.下表为2017年—2024年(年份代码分别记为:1,2,3,4,5,6,7,8)该品牌新能源汽车的科研经费投入和全球市场规模统计.
年份代码i
1
2
3
4
5
6
7
8
科研经费(单位:百亿元)
2
3
6
10
13
15
18
21
市场规模(单位:百万辆)
1
1
2
2.5
3.5
3.5
4.5
6
参考数据:,,,.
参考公式:相关系数.
(1)根据样本数据,推断两个变量是否线性相关,并计算样本相关系数,推断它们的线性相关程度(结果精确到0.01,当越接近1时,成对样本数据的线性相关程度越强;当越接近0时,成对样本数据的线性相关程度越弱);
(2)已知在国内,新能源车主购买的新能源汽车为该品牌新能源汽车的概率为p(),从国内新能源车主中随机抽取5人,记这5人中选择购买该品牌的人数为随机变量X,若,求随机变量X的数学期望和方差
【答案】(1)样本相关系数,两个变量线性相关且线性相关程度很强.
(2)随机变量的数学期望,方差.
【分析】(1)根据给定的相关系数公式,结合已知的参考数据,计算出样本相关系数,再依据相关系数与线性相关程度的关系进行判断.
(2)由已知条件可知随机变量服从二项分布,我们先根据求出的值,再利用二项分布的数学期望和方差公式求出和.
【详解】(1);
.
然后计算,
将,,,代入可得:
.
接着计算,将,,代入可得:
.
再计算,将,,代入可得:
.
最后计算相关系数:
根据公式,将,
,代入可得:
,因为,所以.
由于接近,所以两个变量线性相关且线性相关程度很强.
(2)已知随机变量(因为从国内新能源车主中随机抽取人,
每个人购买该品牌汽车的概率为,符合二项分布的定义),
根据二项分布的概率公式,由可得:
,即,因为,得,
解方程,得.
再根据二项分布的数学期望公式和方差公式,
将,代入可得:;.
28.(24-25高二下·辽宁·期中)某课外实验小组通过实验统计了某种子的发芽率y%与土壤的湿度x%的相关数据如下表:
x
40
45
50
55
60
y
50
56
64
72
83
(1)求y关于x的相关系数r(精确到0.001),并判断它们是否具有较强的线性相关关系?
(2)求y关于x的回归直线方程,并预测当土壤的湿度为70%时,种子的发芽率y%的值.
参考公式及数据:对于一组数据,,…,,回归直线方程的斜率和截距的最小二乘估计公式分别为,,相关系数,,,.
【答案】(1),具有较强的线性相关关系
(2),发芽率的预测值为
【分析】(1)由题,计算,由相关系数得公式运算判断;
(2)根据题意,求出,得到回归直线方程,得解.
【详解】(1)由题,,,
所以关于的相关系数,
所以与具有较强的线性相关关系.
(2)由(1),,则,
所以关于的回归直线方程为,
当时,,
所以当土壤的湿度为70%时,种子的发芽率y%的预测值为.
29.(24-25高二下·河南南阳·期中)某人工智能公司从2018至2024年的利润情况如下表所示:
年份
2018
2019
2020
2021
2022
2023
2024
年份代码x
1
2
3
4
5
6
7
利润y(单位:亿元)
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)根据表中的数据,推断变量y与x之间是否线性相关.计算y与x之间的相关系数(精确到0.01),并推断它们的相关程度;
(2)求出y关于x的经验回归方程,并预测该人工智能公司2025年的利润;
参考数据:
参考公式:对于一组数据,①相关系数为:;
②经验回归直线x的斜率和截距的最小二乘估计公式分别,
【答案】(1)y与x线性相关,,相关程度很强
(2),6.3亿元
【分析】(1)用题目给的、、的值代入算 r ,再依据 r 的值和正负判断变量关系.
(2)把已知的和的值代入计算,得到涉及的系数,进而得到方程.再 把给定 x 值代入回归方程算出 y 值.
【详解】(1)由题设,易知y与x线性相关,且,
,
由于,可以推断变量y与x成正线性相关且相关程度很强.
(2)由题设,,,
所以,因此y关于x的回归方程为,
当时,,即预测该人工智能公司2025的利润为6.3亿元.
30.(24-25高二下·山东烟台·期中)某种产品销售价格x(万元/吨)和销售量y(吨)的变化情况如表:
x
5
5.5
6
6.5
7
y
13
11
10
9
7
(1)计算y与x的相关系数r,并说明y与x的关系是否可用线性回归模型拟合;(一般地,若,则可认为线性相关程度较高,可用线性回归模型拟合.)
(2)若该产品每吨成本为4万元,请利用y与x的回归.关系预测:销售价格定为多少时该产品的销售利润最大?(结果精确到0.01)
参考公式:对于一组数据,
其相关系数;其回归直线的斜率和截距的最小二乘估计分别为:,.
参考数据:,.
【答案】(1)答案见解析
(2)预测销售价格为6.79万元/吨
【分析】(1)由相关系数的公式,根据表中数据,求得相关系数,结合其性质,可得答案;
(2)由回归直线方程公式求得回归直线方程,代入数据,可得答案.
【详解】(1)由题意,,,
,
,
.
所以,
所以,故与的线性相关程度较高,可以用线性回归模型拟合与的关系.
(2),
所以关于的经验回归方程为.
由题意,销售利润为,
当时,取得最大值,
所以预测销售价格为6.79万元/吨时,该产品销售利润最大.
1 / 1
1 / 1
学科网(北京)股份有限公司
$$