内容正文:
专题01 统计案例大题冲关之六大热点题型
题型一:线性回归问题 1
题型二:非线性回归问题 4
题型三:独立性检验问题 10
题型四:回归分析与独立性检验的综合 12
题型五:回归分析与概率的综合 15
题型六:独立性检验与概率的综合 21
题型一:线性回归问题
1.(24-25高二下·山东东营·期末)某人工智能公司从某年起连续年的利润情况如下表所示.
第x年
1
2
3
4
5
6
7
利润y/亿元
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)计算出与之间的相关系数(精确到),并求出关于的回归直线方程;
(2)根据回归直线方程,分别预测该人工智能公司第年和第年的利润.
参考公式:样本的回归直线为,其中,,,,,.
【答案】(1)相关系数约为,回归方程为.
(2)第、年的利润约为亿元、亿元.
【分析】(1)求出、的值,将参考数据代入相关系数公式,可求出相关系数的值,利用最小二乘法可求出、的值,即可得出关于的回归直线方程;
(2)将、分别代入回归直线方程,可得结果.
【详解】(1)由题中数据可得,
,
,
因此,
,,
故回归直线方程为.
(2)在回归直线方程中令,得.
令,得,
因此预测第、年的利润约为亿元、亿元.
2.(2025·广东广州·模拟预测)经验表明,一般树的胸径(树的主干在地面以上m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据,并根据数据作出如下的散点图.
经计算得,,,,.
(1)推断两个变量是否线性相关,计算样本相关系数(精确到),并推断它们的相关程度;
(2)试根据以上数据建立树高关于胸径的经验回归方程(系数精确到),并预测胸径为cm的树高.
附:相关系数,回归方程中,,.
【答案】(1)两个变量线性相关;相关性较强.
(2);m.
【分析】(1)根据树高与胸径的散点图判断它们是否线性相关,再通过相关系数判断它们相关的程度;
(2)根据最小二乘法估计计算经验回归方程的系数,得到经验回归方程,再用经验回归方程做出预测.
【详解】(1)根据树高与树的胸径的散点图,可判断两个变量是线性相关.
根据题中所给数据,得,,.
所以.
由于的值接近于1,故相关性较强.
故两个变量线性相关,且相关程度较强.
(2)由(1)知,,.
所以,.
所以经验回归方程为.
当时,,即树高的预测值大约为m.
故树高关于胸径的经验回归方程为,预测胸径为cm的树高为m.
3.(25-26高三上·广东深圳·开学考试)药物临床试验是确认新药有效性和安全性必不可少的步骤,为探究某药物在人体中的代谢情况,研究人员统计了血液中药物浓度与代谢时间的相关数据,如下表所示:
2
3
4
5
6
55
20
6
3
1
若采用一元线性回归模型,已知一个经验回归方程为①;若采用一元非线性回归模型,可求得经验回归方程②.
(1)求;
(2)①与②哪个更适合作为关于的经验回归方程?请比较其决定系数的大小,并说明理由.
附:(i)参考数据:;在经验回归方程②中,;
(ii)对于一组数据,决定系数.
【答案】(1)65
(2)②更适合作为关于的经验回归方程,理由见解析
【分析】(1)先求出,,再根据求解即可;
(2)根据公式分别计算出两个方程的,进而结合决定系数公式判断即可.
【详解】(1)由题意,,,
则.
(2)在方程①中,经验回归方程为,
则,
所以,
在方程②中,,
决定系数,
①的决定系数小于②的决定系数,
②更适合作为关于的经验回归方程.
题型二:非线性回归问题
4.(2025高二·全国·专题练习)有一种速度叫中国速度,有一种骄傲叫中国高铁.高铁可以说是中国的一张行走的名片.截至2020年,中国高铁运营里程已经达到3.9万千米.2013年至2020年中国高铁每年的运营里程统计如下表,它反映了中国高铁的飞速发展.
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
6
7
8
运营里程y/万千米
1.3
1.6
1.9
2.2
2.5
2.9
3.5
3.9
根据以上数据,回答下面的问题.
(1)甲同学用曲线来拟合,并算出相关系数;乙同学用曲线来拟合,并算出转化为线性回归方程所对应的相关系数.请判断哪一个更适合作为y关于x的回归方程类型,并说明理由.
(2)根据(1)的判断结果及表中数据,求y关于x的回归方程.(系数精确到0.1)
(3)请你利用得到的模型,预测2030年中国高铁的运营里程将达到多少万千米.
参考公式:用最小二乘法求线性回归方程的系数,公式为;
参考数据:,令,.
【答案】(1)乙同学的更适合作为y关于x的回归方程类型,理由见解析
(2)
(3)17.25
【分析】(1)比较已知的相关系数的大小;
(2)由已知数据求出,结合回归方程变形为,求出d和,从而可求出回归方程;
(3)利用非线性回归方程进行估计.
【详解】(1)因为,所以乙同学的更适合作为y关于x的回归方程类型.
(2),
由得,即.
则,
,
所以.
(3)2030年对应的年份代码,代入(2)中的y关于x的回归方程,
得.故预测2030年中国高铁运营里程将达到17.25万千米.
5.(24-25高二下·山东·月考)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
-2.10
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据,其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
【答案】(1)模型建立与的回归方程更合适
(2)
(3)万元
【分析】(1)求出相关系数,比较大小,越接近1回归方程更适合.
(2)先换元用公式,求出线性回归方程,再回代求出非线性回归方程即可.
(3)用(2)的方程代入利润方程得出利润z关于研发经费x的函数关系式,再用基本不等式可解决.
【详解】(1)由题意知,
,
因为,所以用模型建立与的回归方程更合适.
(2)令,回归方程为,
因为,
,
所以关于的回归方程为,即.
(3)由题意知
,当且仅当,即时取等号,
则,所以.当且仅当时等号成立,
所以当研发经费投入为60万元时企业生产的利润最大,最大利润为万元.
6.(24-25高二下·上海·月考)某芯片研究团队为制定下一年的研发投入计划,需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量和年销售额的数据,该团队建立了两个模型:①;②,其中,,,均为常数,为自然对数的底数.经对历史数据的初步处理,得到右侧散点图,如图.令,,计算得如下数据:
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)设和的相关系数为,和的相关系数为,请从相关系数的角度,旋转一个拟合程度更好的模型:
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ii)若下一年销售额y需达到80亿元,预测下一年的研发资金投入量x是多少亿元?(结果精确到0.01)
附:对于一组数据,样本相关系数
回归直线的斜率和截距的最小二乘估计分别为:
,.
【答案】(1)模型②;
(2)(i)(ⅱ)27.1亿元
【分析】(1)计算相关系数,根据相关系数的绝对值大小得出结论;
(2)(i)两边取自然对数,转化为线性回归方程求解,再转化为指数式即可;
(ii)根据(i)的结论预测销售额y达到80亿元时研发投入即可得解.
【详解】(1)由题意表格数据得,
同理,
∵0.86<0.91,即,
则从相关系数的角度,选择模型②的拟合程度会更好.
(2)(i)由(1)得,模型②,可建立关于x的线性回归方程,
则,又,
∴,∴,
∴,即.
(ii)由(i)得,
要使下一年销售额达到80亿元,即,,
∴,解得,
故下一年销售额达到80亿元,预测下一年的研发资金投入量是27.1亿元.
7.(2025·福建泉州·模拟预测)泉州少年郎团队从2024年10月份以来,通过深度整合AI算法、大数据分析和自动化技术,不断优化产品与服务,显著提升了运营效率和市场竞争力,推动团队收入持续攀升.该团队在近7个月的经济收入(单位:百万元)的数据如下表:
月份编号
1
2
3
4
5
6
7
收入(百万元)
6
11
21
34
66
101
196
(1)根据以上数据绘制散点图,并根据散点图判断,与(均为大于零的常数)哪一个适宜作为该团队经济收入y关于月份x的回归方程模型?(给出判断即可,不必说明理由)并根据你的判断结果及表中的数据,求出y关于x的回归方程;
(2)请你根据所求的回归方程,预测该团队下一个月的经济收入;
(3)试从统计学角度分析,如果用所求的回归方程预测该团队接下来1年的经济收入情况是否合理?
参考数据:
435
10.78
2535
50.12
2.82
3.47
其中设,
参考公式:,.
【答案】(1)适宜,
(2)347百万元
(3)不合理
【分析】(1)看到形式,通过取对数转化成的形式,把复杂形式变简单. 算出的均值、的均值和这些值. 用公式算出,再把样本中心点代入求出,进而得到回归方程.
(2)把代入回归方程,算出对应的值,得到预测收入.
(3)经验回归方程有时效性,所以判断预测不合理.
【详解】(1)散点图如图所示,
根据散点图判断,适宜作为5G经济收入y关于月代码x的回归方程类型,
,两边同时取常用对数得:,
设,,
,
,
,
,
把样本中心点代入,得:,
,,
,
y关于x的回归方程:.
(2)当时,,
所以预测该公司2025年5月份的经济收入估计为347百万元.
(3)不合理,经验回归方程一般具有时效性,解释变量越接近样本数据,预测值比较可信,否则会有显著误差.
题型三:独立性检验问题
8.(2024·河南·一模)近年来,短视频作为以视频为载体的聚合平台,社交属性愈发突出,在用户生活中覆盖面越来越广泛,针对短视频的碎片化缺陷,将短视频剪接成长视频势必成为一种新的技能.某机构在网上随机对1000人进行了一次市场调研,以决策是否开发将短视频剪接成长视频的APP,得到如下数据:
青年人
中年人
老年人
对短视频剪接成长视频的APP有需求
200
对短视频剪接成长视频的APP无需求
150
其中的数据为统计的人数,已知被调研的青年人数为400.
(1)求的值;
(2)根据小概率值的独立性检验,分析对短视频剪接成长视频的APP的需求,青年人与中老年人是否有差异?
参考公式:,其中.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)
(2)有差异
【分析】(1)根据题意列式求解即可;
(2)根据题意可得列联表,计算,并与临界值对比分析.
【详解】(1)由题意可得:,解得.
(2)零假设为:对短视频剪接成长视频APP的需求,青年人与中老年人没有差异.
由已知得,如下列联表:
青年人
中老年人
合计
对短视频剪接成长视频的APP有需求
300
250
550
对短视频剪接成长视频的APP无需求
100
350
450
合计
400
600
1000
可得,
根据小概率值的独立性检验,我们推断不成立,
所以对短视频剪接成长视频的APP有需求,青年人与中老年人有差异.
9.(2025·山东济南·模拟预测)为调查某城市居民对冰雪运动的了解情况,随机抽取了该市120名市民进行统计,得到如下列联表:
男
女
合计
了解冰雪运动
m
p
70
不了解冰雪运动
n
q
50
合计
60
60
120
已知从参与调查的男性市民中随机选取1名,抽到了解冰雪运动的概率为.
(1)直接写出m,n,p,q的值;
(2)能否根据小概率值α=0.1的独立性检验,认为该市居民了解冰雪运动与性别有关?请说明理由.
附:.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1),,,
(2)该市居民了解冰雪运动与性别有关,理由见解析
【分析】(1)先根据已知条件求出参与调查的男性中“了解冰雪运动”的人数m,再根据表中的数据可求出;
(2)根据公式计算,再根据临界值表进行判断即可.
【详解】(1)由题知,,所以,,.
所以.
(2)能.理由如下:由题意知,,
所以根据小概率值α=0.1的独立性检验,认为该市居民了解冰雪运动与性别有关.
题型四:回归分析与独立性检验的综合
10.(25-26高三上·山东济南·期中)某超市正在销售一种饮品,销售人员发现日销售量与当日的气温有关,随着气温的升高,销售量也有明显的增加,如表是该超市连续五天的日销售情况:
温度
温度变量
1
2
3
4
5
销售量/万份
0.3
0.3
0.5
0.9
1
其中,温度变量对应的销售量为.
(1)建立销售量关于温度变量的一元线性回归模型,并估计温度在区间时该饮品的日销售量.
(2)为了了解消费群体中男、女对该饮品的喜欢程度,销售人员随机采访了220名消费者,将他们的意见进行统计,得到了列联表为:
喜欢
一般
合计
女
90
20
110
男
70
40
110
合计
160
60
220
依据小概率值的独立性检验,分析对饮品的喜欢程度是否与性别有关联?
(3)超市销售该饮品一个阶段后,统计了100天的日销售量,将100个样本数据分成,,,,(单位:千份)五组,并绘制了如图的频率分布直方图.根据频率分布直方图估计这100天的日均销售量(同一组中的数据用该组区间的中点值代表).
附:.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1),1.2万份;
(2)认为对饮品的喜欢程度与性别有关;
(3)6300份.
【分析】(1)求出,,,代入得到,求出,销售量关于温度变量的线性回归方程,代入,求出,从而得到温度在区间时的该饮品的日销售量.
(2)先进行零假设为:对饮品的喜欢程度与性别相互独立,即对饮品的喜欢程度与性别无关联,利用公式求出,进行比较得到结论;
(3)设这100天的日均销售量为,求出,从而得到这100天的日均销售量.
【详解】(1),
,
,所以,
,销售量关于温度变量的线性回归方程为,
当.
所以温度在区间时的该饮品的日销售量估计为1.2万份.
(2)零假设为:对饮品的喜欢程度与性别相互独立,即对饮品的喜欢程度与性别无关联.
.
依据小概率值的独立性检验,我们推断不成立,即认为对饮品的喜欢程度与性别有关,此推断犯错误的概率不大于0.01.
(3)设这100天的日均销售量为,
则,所以这100天的日均销售量为6300份.
11.(25-26高三上·广东东莞·月考)苏州某网红奶茶品牌公司计划在周边城市开设加盟分店,为了确定在城市开设分店的个数,该公司对苏州市相城区的5个区域开店数据作了初步处理后得到下列表格,记表示在相城区的5个区域开设分店的个数,表示这个分店的年收入之和.
(个)
2
3
4
5
6
(十万元)
2.5
3
4
4.5
6
(1)该公司经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程:
(2)如果该公司最终决定在城市选择两个合适的地段各开设了一个分店,根据市场调查得到如下统计数据,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的顾客平均为80人,其中20人会购买该品牌奶茶.完成下列表格,并依据小概率值的独立性检验,试问两个分店的顾客下单率有无差异?
不下单
下单
合计
分店一
分店二
合计
参考公式:,,,
【答案】(1)
(2)表格见解析,两个分店下单率没有差异
【分析】(1)计算,代入公式可求,再求,由此可得回归方程,
(2)填写表格,再提出零假设,求,比较所求结果与临界值的大小,结合比较结果确定结论.
【详解】(1)由题可得,,,
,,
设关于的线性回归方程为,则,
,
关于的线性回归方程为;
(2)设零假设为:两个分店顾客下单率无差异,
由题意可知列联表如下所示:
不下单
下单
合计
分店一
25
5
30
分店二
60
20
80
合计
85
25
110
.
根据小概率值的独立性检验,没有充分证据推断不成立,所以两个分店下单率没有差异.
题型五:回归分析与概率的综合
12.(25-26高三上·重庆·月考)近期甲型H3N2流感来袭,医学研究表明,如果每天温差太大,人们受风寒刺激极易受凉感冒,自身抵抗力就会变弱,易受流感病毒侵袭,特别是对于学生及老年人群体更需保暖和多加防范.我校数学建模社团成员共同研究了一天昼夜温差的大小与我校患流感就诊人数多少之间的关系,他们记录了某周周一至周六的温差,并到校医室查阅了这六天中每天学生新增流感就诊的人数,得到数据如下:
日期
周一
周二
周三
周四
周五
周六
昼夜温差t(℃)
4
7
8
9
14
12
新增流感就诊人数y(位)
y₁
y₂
y₃
y₄
y₅
y₆
参考数据:,
(1)已知第一天新增流感就诊的学生中有3位男生,从第一天新增的流感就诊学生中随机抽取2位,其中男生人数记为X,若抽取的2人中至少一位女生的概率为 求X的分布列和数学期望;
(2)已知两个变量t与y之间的样本相关系数 ,请用最小二乘法求出y关于t的经验回归方程 ,据此估计昼夜温差为13℃时,我校新增流感就诊的学生人数.
参考公式:,
【答案】(1)分布列见解析,数学期望为.
(2)经验回归方程为;当昼夜温差13℃时,我校新增流感就诊的学生人数为人.
【分析】(1)先根据已知条件求出第一天新增流感就诊的学生总数,然后求出的可能取值为0,1,2以及对应的概率值,列出分布列,根据期望公式求出数学期望即可.
(2)根据条件中给的公式和相关系数先求出,然后得到,然后根据公式求出,进而得到,从而求得经验回归方程和昼夜温差为13℃时的函数值.
【详解】(1)因为抽取的2人中至少一位女生的概率为,所以抽取的2人中全是男生的概率为.
设第一天新增流感就诊的学生共人,则,化简得.
解得(舍去)或.
所以由题意可知的可能取值为0,1,2,
.
所以的分布列为
0
1
2
所以数学期望为.
(2)由题意可知,,
所以.
所以.
因为,所以,
解得.而,所以
所以y关于t的经验回归方程为.
当昼夜温差时,我校新增流感就诊的学生人数为人.
13.(25-26高三上·江苏盐城·月考)随着新能源产业的发展,某地区近年来新能源汽车保有量快速增长,为了研究充电桩建设的情况,相关部门收集到了2021年到2025年充电桩数量(单位:万个),为方便研究,年份代码用表示(如:表示2021年),具体参考数据如下表:
55
70.4
19
(1)请根据表中数据,建立关于的回归直线方程;
(2)假设该地区现有12个充电桩,其中一半为快充桩,现对该地区现有的12个充电桩进行检查,随机抽取3个充电桩进行检查,记抽到的快充桩个数为,求的分布列及均值.
(参考公式:,.)
【答案】(1)
(2)分布列见解析,
【分析】(1)根据题干数据以及回归直线方程的参数公式,可得答案;
(2)根据超几何分布的分布列计算,以及均值计算公式,可得答案.
【详解】(1),,
,,
所以,回归直线方程为.
(2)的可能取值为,则:
,,
,,
所以分布列为:
故均值.
14.(24-25高二下·河北承德·期末)2025年4月,中国新能源汽车零售渗透率突破,进入“以电为主”的新阶段,充电桩的使用率也成为关注焦点.经调查,某市今年月份的充电桩日均使用时长(时)与新能源汽车保有量(万辆)及充电桩日均使用率(,为常数)的数据如下表所示:
月份
1
2
3
4
5
6
新能源汽车保有量(万辆)
8
13
15
18
23
25
充电桩日均使用时长(时)
5
7
10
12
15
17
充电桩日均使用率
0.15
0.21
0.3
0.36
0.45
0.51
(1)若用充电桩日均使用率近似估计一个充电桩一天内被使用的概率,设该市某个充电桩在3月份的某3天中被使用的天数为,求的分布列;
(2)求关于的样本相关系数,并说明线性相关程度的强弱;(精确到0.01)
(3)若关于的经验回归方程为,求的值(精确到0.1),并预测当该市某月的新能源汽车保有量为36万辆时,充电桩的日均使用率为多少.
参考数据:,.
参考公式:相关系数.
【答案】(1)分布列见解析
(2)0.99,与的线性相关程度较强.
(3),0.72.
【分析】(1)由题可知充电桩在3月份使用的概率为0.3,故,根据二项分布写出分布列即可;
(2)根据题意先求,利用相关系数公式,代入数据求值与1比较即可;
(3)由过回归方程可求,根据回归方程进行预测即可.
【详解】(1)由题可知的所有可能取值为,且,
则,
,
,
,
所以的分布列为
0
1
2
3
0.343
0.441
0.189
0.027
(2)由题可知,,
则,
因为接近于1,所以与的线性相关程度较强.
(3)由题可知,
解得,
所以关于的经验回归方程为.
将代入经验回归方程,得,
又因为,所以当时,,
故预测当该市某月的新能源汽车保有量为36万辆时,充电桩的日均使用率为0.72.
15.(25-26高三上·湖北宜昌·月考)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,.
(1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度;
(2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列.
附:相关系数.
【答案】(1),相关性强
(2)分布列见解析
【分析】(1)由条件结合相关系数公式求出相关系数,根据相关系数性质判断结论;
(2)由条件确定的可能取值,再求取各值的概率,由此可得其分布列.
【详解】(1)样本的相关系数为
.
由于相关系数,则相关性很强,的值越大,相关性越强.
故,故销售金额和月份编号成很强的正相关性.
(2)由题意得:的可能取值为0,1,2,
20个月中有8个月的销售金额低于平均数,有12个月的销售金额不低于平均数,
所以,
所以的分布列为:
0
1
2
题型六:独立性检验与概率的综合
16.(25-26高三上·河北张家口·期末)某省为了解高中生对足球赛事的了解情况,特地举办了一次足球常识问卷调查,问卷的满分为100分,统计结果显示,学生成绩,不低于60分为及格,高于80分为优秀,且优秀率为20%.根据某高中学校参加问卷的90名学生的调查结果,得到如下列联表:
性别
关注足球赛事
不关注足球赛事
合计
男
55
5
60
女
20
10
30
合计
75
15
90
(1)根据小概率值的独立性检验,分析该校学生对足球赛事的关注是否与性别有关;
(2)在这90名学生中随机抽取一名,记事件表示抽到“学生关注足球赛事”,事件表示抽到“学生是女生”,求及的值;
(3)从全省参与调查的学生中随机选出5人,这5人中及格的人数记作,求的期望与方差.
附:,其中.
常用的小概率值和相应的临界值:
0.05
0.01
0.001
3.841
6.635
10.828
【答案】(1)该校学生对足球赛事的关注与性别有关.
(2).
(3).
【分析】(1)根据卡方计算公式,结合独立检验的思想即可下结论;
(2)根据和事件的运算与条件概率的计算公式求解即可;
(3)根据正态分布求得,结合二项分布的均值与方差公式计算即可求解.
【详解】(1)零假设为:学生对足球赛事的关注与性别无关.
根据列联表中的数据,得到,
根据小概率值的独立性检验,我们推断不成立,
即认为该校学生对足球赛事的关注与性别有关.
(2)由题意得,,,,
故.
(3)因为,
所以,
所以,
故,
即.
17.(2025高三上·贵州贵阳·专题练习)某电商平台在用户选购家电时,要求每位用户先从冰箱和洗衣机这两类大家电中选定一类,再从微波炉、烤箱、扫地机器人、空气净化器这四类小家电中任选两类.选购结束后,为了解用户的选购情况,随机抽取了部分用户作为样本,对他们的选购情况统计后得到下表:
微波炉
烤箱
扫地机器人
空气净化器
冰箱类
100
120
200
180
洗衣机类
120
140
60
80
(1)利用上述样本数据填写以下列联表,并依据小概率值的独立性检验,分析以上两类大家电对空气净化器的选法是否存在差异.
类别
空气净化器选法
选
不选
合计
冰箱类
洗衣机类
合计
(2)假设该平台所有选购家电的用户中有的用户选择了冰箱类,其余的用户都选择了洗衣机类,且在冰箱类的用户中两个小家电选择的是烤箱和扫地机器人的概率为,而在洗衣机类的用户中两小家电选择的是烤箱和扫地机器人的概率为.若从该平台所有用户中随机抽取100名用户,用表示这100名用户中同时选择了烤箱和扫地机器人的人数,求随机变量的均值.
附:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,存在
(2)16
【分析】(1)根据题意完善列联表,根据表中数据求,并与临界值对比分析;
(2)根据全概率公式求,可得,再根据二项分布求.
【详解】(1)由题意可得:选择冰箱类的总人数有300,其中选择空气净化器的人数为180,不选择空气净化器的人数为120;选择洗衣机类的总人数有200,其中选择空气净化器的人数为80,不选择空气净化器的人数为120;据此完善列联表
类别
空气净化器选法
选
不选
合计
冰箱类
180
120
300
洗衣机类
80
120
200
合计
260
240
500
零假设:两类大家电对空气净化器的选法没有差异,
可得,
由于,根据小概率值可知假设不成立,
故可以认为两类大家电对空气净化器的选法存在差异,且犯错误的概率不大于.
(2)记“选择冰箱类”为事件M,“选择洗衣机类”为事件N,“同时选择烤箱和扫地机器人”为事件C,
则,
故,
由题意可得,则,
故随机变量的均值.
18.(2025·云南昭通·模拟预测)某高校为了解学生在一周内参与志愿服务的情况,统计了全校所有学生在一年内每周参与志愿服务的次数,现随机抽取了50名同学,统计在某一周参与志愿服务的数据,结果如下表:
一周参与志愿服务次数
1
2
3
4
5
6
合计
男生人数
4
6
6
4
3
2
25
女生人数
1
1
3
5
9
6
25
合计
5
7
9
9
12
8
50
(1)若将一周参与志愿服务次数为5次及5次以上的,称为“积极参与”,其余的称为“一般参与”.请完成以下2×2列联表,并依据小概率值的独立性检验,能否认为性别因素与学生参与志愿服务的积极性有关系;
性别
志愿服务
合计
一般参与
积极参与
男生
女生
合计
(2)若将一周参与志愿服务达到6次的同学称为“最美志愿者”,在样本的8名“最美志愿者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为,求的分布列和数学期望.
附:,.
0.1
0.05
0.01
2.706
3.841
6.635
【答案】(1)填表见解析;认为性别因素与学生参与志愿服务的积极性有关系
(2)分布列见解析;期望为
【分析】(1)由题意可直接完成列联表,再由公式即可求解;
(2)确定的可能取值,求得概率,进而可求解.
【详解】(1)根据统计表格数据可得列联表如下:
性别
志愿服务
合计
一般参与
积极参与
男生
20
5
25
女生
10
15
25
合计
30
20
50
零假设为:性别与参与志愿服务情况独立,即性别因素与学生志愿服务的参与积极性无关,
根据列联表的数据计算可得,
因为,
所以,依据小概率值的独立性检验,推断不成立,即认为性别因素与学生参与志愿服务的积极性有关系.
(2)由题可知8名“最美志愿者”有2名男生,6名女生,所以Y的所有可能取值为0,1,2,
且服从超几何分布,则,,,
Y的分布列为:
Y
0
1
2
P
可得.
19.(2025·四川内江·一模)某兴趣小组调查了某校100名学生100米短跑成绩的情况,其中有60 名学生的短跑成绩合格.这100名学生中有45名学生每周自主锻炼时间超过5小时,60名短跑成绩合格的学生中有35名学生每周自主锻炼时间超过5小时.现对短跑成绩不合格的学生进行跑步技巧培训,已知每周自主锻炼时间超过5小时的学生参加跑步技巧培训后,学生的短跑成绩合格的概率为,每周自主锻炼时间不超过5小时的学生参加跑步技巧培训后,学生的短跑成绩合格的概率为.用频率估计概率,从短跑成绩不合格的学生中随机抽取1名学生(记为甲)进行跑步技巧培训.依据小概率值的独立性检验,零假设为:学生短跑成绩合格与每周自主锻炼时间相互独立.
(1)先填写列联表,再依据小概率值的独立性检验,判断是否能认为学生短跑成绩合格与每周自主锻炼时间超过5小时有关;
每周自主锻炼时间超过5小时
每周自主锻炼时间不超过5小时
合计
短跑成绩合格
短跑成绩不合格
合计
100
(2)求学生甲在培训后短跑成绩合格的情况下,每周自主锻炼时间不超过5小时的概率;
(3)为提高学生锻炼的积极性,学校偶尔会在田径运动场举办锻炼有奖活动,记表示事件“田径运动场举办锻炼有奖的抽奖活动”,表示事件“小明去田径运动场锻炼”,.已知小明在田径运动场举办锻炼有奖的抽奖活动的情况下去运动场锻炼的概率,比不举办抽奖活动的情况下去运动场锻炼的概率大.证明:.
参考公式与数据:,其中,.
0.01
0.005
0.001
6.635
7.879
10.828
【答案】(1)列联表详见解析,,根据小概率值的独立性检验,可以认为学生短跑成绩合格与每周自主锻炼时间超过5小时有关.
(2).
(3)证明详见解析.
【分析】(1)根据题意先完成列联表,根据表格中的数据计算即可进行独立性检验.
(2)综合条件概率公式、全概率公式、贝叶斯公式求解.
(3)根据条件概率公式与对立事件的概率公式化简求证.
【详解】(1)根据题意完善列联表如下:
每周自主锻炼时间超过5小时
每周自主锻炼时间不超过5小时
合计
短跑成绩合格
35
25
60
短跑成绩不合格
10
30
40
合计
45
55
100
根据列联表中的数据,计算得到
,
根据小概率值的独立性检验,我们推断不成立,即认为学生短跑成绩合格与每周自主锻炼时间超过5小时有关.
(2)由(1)中的列联表知,短跑成绩不合格的学生有40人,其中每周自主锻炼时间超过5小时的有10人,每周自主锻炼时间不超过5小时的有30人.
记事件“甲在培训后短跑成绩合格”,事件“甲每周自主锻炼时间超过5小时”,则事件 “甲每周自主锻炼时间不超过5小时”,
用频率估计概率知 ,,
由题意知,,
由全概率公式知.
由贝叶斯公式知,即学生甲在培训后短跑成绩合格的情况下,每周自主锻炼时间不超过5小时的概率为.
(3)由题意知,
所以,
因为,所以,
所以,
整理得,
所以,
即,
因为,所以,
所以,即.
20.(25-26高三上·湖北黄冈·期末)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计.
(1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关?
性别
男生
女生
合计
不愿报名参加答题活动
愿意报名参加答题活动
合计
200
(2)网络答题规则:假设甲每道题回答是否正确相互独立,且每次答对的概率均为.
(i)若答题活动设置且道题,甲仅答对其中10道题的概率最大,求的值.
(ii)若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)列联表见解析,认为学生报名参加答题活动与性别有关联
(2)(i);(ii)的分布列见解析,
【分析】(1)根据题设,结合条件概率的定义求出数据,进而完成列联表,再计算出的值判断即可;
(2)(i)设随机变量Y为甲答对题目的个数,则,根据二项分布的概率性质建立不等式组即可求解;(ii)写出的所有可能取值,结合独立事件的概率特征求出对应的概率,从而可写出的分布列及期望.
【详解】(1)因为,所以愿意报名参加答题活动人数为,
又因为,所以愿意报名参加答题活动的男生人数为,愿意报名参加答题活动的女生人数为,则可得到列联表为:
性别
男生
女生
合计
不愿报名参加答题活动
20
60
80
愿意报名参加答题活动
80
40
120
合计
100
100
200
零假设为:学生报名参加答题活动与性别无关,
则,
依据小概率值的独立性检验,我们推断不成立,
即认为学生报名参加答题活动与性别有关联,此推断犯错误的概率不大于0.001;
(2)(i)设随机变量Y为甲答对题目的个数,则.
则,
假设最有可能答对题目的数量是10次,则
即:
解得,又,则;
(ii)的所有可能取值为:1,2,3,4,
,
所以的分布列为:
X
1
2
3
4
P
故.
2 / 37
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题01 统计案例大题冲关之六大热点题型
题型一:线性回归问题 1
题型二:非线性回归问题 3
题型三:独立性检验问题 7
题型四:回归分析与独立性检验的综合 9
题型五:回归分析与概率的综合 11
题型六:独立性检验与概率的综合 13
题型一:线性回归问题
1.(24-25高二下·山东东营·期末)某人工智能公司从某年起连续年的利润情况如下表所示.
第x年
1
2
3
4
5
6
7
利润y/亿元
2.9
3.3
3.6
4.4
4.8
5.2
5.9
(1)计算出与之间的相关系数(精确到),并求出关于的回归直线方程;
(2)根据回归直线方程,分别预测该人工智能公司第年和第年的利润.
参考公式:样本的回归直线为,其中,,,,,.
2.(2025·广东广州·模拟预测)经验表明,一般树的胸径(树的主干在地面以上m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收集了某种树的一些数据,并根据数据作出如下的散点图.
经计算得,,,,.
(1)推断两个变量是否线性相关,计算样本相关系数(精确到),并推断它们的相关程度;
(2)试根据以上数据建立树高关于胸径的经验回归方程(系数精确到),并预测胸径为cm的树高.
附:相关系数,回归方程中,,.
3.(25-26高三上·广东深圳·开学考试)药物临床试验是确认新药有效性和安全性必不可少的步骤,为探究某药物在人体中的代谢情况,研究人员统计了血液中药物浓度与代谢时间的相关数据,如下表所示:
2
3
4
5
6
55
20
6
3
1
若采用一元线性回归模型,已知一个经验回归方程为①;若采用一元非线性回归模型,可求得经验回归方程②.
(1)求;
(2)①与②哪个更适合作为关于的经验回归方程?请比较其决定系数的大小,并说明理由.
附:(i)参考数据:;在经验回归方程②中,;
(ii)对于一组数据,决定系数.
题型二:非线性回归问题
4.(2025高二·全国·专题练习)有一种速度叫中国速度,有一种骄傲叫中国高铁.高铁可以说是中国的一张行走的名片.截至2020年,中国高铁运营里程已经达到3.9万千米.2013年至2020年中国高铁每年的运营里程统计如下表,它反映了中国高铁的飞速发展.
年份
2013
2014
2015
2016
2017
2018
2019
2020
年份代码x
1
2
3
4
5
6
7
8
运营里程y/万千米
1.3
1.6
1.9
2.2
2.5
2.9
3.5
3.9
根据以上数据,回答下面的问题.
(1)甲同学用曲线来拟合,并算出相关系数;乙同学用曲线来拟合,并算出转化为线性回归方程所对应的相关系数.请判断哪一个更适合作为y关于x的回归方程类型,并说明理由.
(2)根据(1)的判断结果及表中数据,求y关于x的回归方程.(系数精确到0.1)
(3)请你利用得到的模型,预测2030年中国高铁的运营里程将达到多少万千米.
参考公式:用最小二乘法求线性回归方程的系数,公式为;
参考数据:,令,.
5.(24-25高二下·山东·月考)为了促进锂电产业发展,市创新研究院课题组对企业研发经费的投入和企业当年的销售收入的关系进行了研究,他们收集了上一年不同企业销售收入y(单位:10万元)与一定范围内的研发经费x(单位:10万元)的数据,根据收集的13组观测数据,得到如下的散点图,分别利用或建立y关于x的回归方程,令,得到如下数据,且与的相关系数分别为,,且.
10.15
108.40
3.04
0.16
14.00
-2.10
11.67
0.21
21.22
(1)用相关系数说明哪种模型建立y与x的回归方程更合适;
(2)根据(1)的结果及表中数据,建立y关于x的回归方程;
(3)已知企业的利润z满足,试根据回归方程求出企业利润的最大值.
参考数据和公式:,,,对于一组数据,其回归直线方程的斜率和截距的最小二乘法估计分别为,,相关系数.
6.(24-25高二下·上海·月考)某芯片研究团队为制定下一年的研发投入计划,需要了解年研发资金投入量x(单位:亿元)对年销售额(单位:亿元)的影响,结合近12年的年研发资金投入量和年销售额的数据,该团队建立了两个模型:①;②,其中,,,均为常数,为自然对数的底数.经对历史数据的初步处理,得到右侧散点图,如图.令,,计算得如下数据:
20
66
770
200
14
460
4.20
3125000
0.308
21500
(1)设和的相关系数为,和的相关系数为,请从相关系数的角度,旋转一个拟合程度更好的模型:
(2)(i)根据(1)的选择及表中数据,建立y关于x的回归方程(系数精确到0.01);
(ii)若下一年销售额y需达到80亿元,预测下一年的研发资金投入量x是多少亿元?(结果精确到0.01)
附:对于一组数据,样本相关系数
回归直线的斜率和截距的最小二乘估计分别为:
,.
7.(2025·福建泉州·模拟预测)泉州少年郎团队从2024年10月份以来,通过深度整合AI算法、大数据分析和自动化技术,不断优化产品与服务,显著提升了运营效率和市场竞争力,推动团队收入持续攀升.该团队在近7个月的经济收入(单位:百万元)的数据如下表:
月份编号
1
2
3
4
5
6
7
收入(百万元)
6
11
21
34
66
101
196
(1)根据以上数据绘制散点图,并根据散点图判断,与(均为大于零的常数)哪一个适宜作为该团队经济收入y关于月份x的回归方程模型?(给出判断即可,不必说明理由)并根据你的判断结果及表中的数据,求出y关于x的回归方程;
(2)请你根据所求的回归方程,预测该团队下一个月的经济收入;
(3)试从统计学角度分析,如果用所求的回归方程预测该团队接下来1年的经济收入情况是否合理?
参考数据:
435
10.78
2535
50.12
2.82
3.47
其中设,
参考公式:,.
题型三:独立性检验问题
8.(2024·河南·一模)近年来,短视频作为以视频为载体的聚合平台,社交属性愈发突出,在用户生活中覆盖面越来越广泛,针对短视频的碎片化缺陷,将短视频剪接成长视频势必成为一种新的技能.某机构在网上随机对1000人进行了一次市场调研,以决策是否开发将短视频剪接成长视频的APP,得到如下数据:
青年人
中年人
老年人
对短视频剪接成长视频的APP有需求
200
对短视频剪接成长视频的APP无需求
150
其中的数据为统计的人数,已知被调研的青年人数为400.
(1)求的值;
(2)根据小概率值的独立性检验,分析对短视频剪接成长视频的APP的需求,青年人与中老年人是否有差异?
参考公式:,其中.
临界值表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
9.(2025·山东济南·模拟预测)为调查某城市居民对冰雪运动的了解情况,随机抽取了该市120名市民进行统计,得到如下列联表:
男
女
合计
了解冰雪运动
m
p
70
不了解冰雪运动
n
q
50
合计
60
60
120
已知从参与调查的男性市民中随机选取1名,抽到了解冰雪运动的概率为.
(1)直接写出m,n,p,q的值;
(2)能否根据小概率值α=0.1的独立性检验,认为该市居民了解冰雪运动与性别有关?请说明理由.
附:.
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
题型四:回归分析与独立性检验的综合
10.(25-26高三上·山东济南·期中)某超市正在销售一种饮品,销售人员发现日销售量与当日的气温有关,随着气温的升高,销售量也有明显的增加,如表是该超市连续五天的日销售情况:
温度
温度变量
1
2
3
4
5
销售量/万份
0.3
0.3
0.5
0.9
1
其中,温度变量对应的销售量为.
(1)建立销售量关于温度变量的一元线性回归模型,并估计温度在区间时该饮品的日销售量.
(2)为了了解消费群体中男、女对该饮品的喜欢程度,销售人员随机采访了220名消费者,将他们的意见进行统计,得到了列联表为:
喜欢
一般
合计
女
90
20
110
男
70
40
110
合计
160
60
220
依据小概率值的独立性检验,分析对饮品的喜欢程度是否与性别有关联?
(3)超市销售该饮品一个阶段后,统计了100天的日销售量,将100个样本数据分成,,,,(单位:千份)五组,并绘制了如图的频率分布直方图.根据频率分布直方图估计这100天的日均销售量(同一组中的数据用该组区间的中点值代表).
附:.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
11.(25-26高三上·广东东莞·月考)苏州某网红奶茶品牌公司计划在周边城市开设加盟分店,为了确定在城市开设分店的个数,该公司对苏州市相城区的5个区域开店数据作了初步处理后得到下列表格,记表示在相城区的5个区域开设分店的个数,表示这个分店的年收入之和.
(个)
2
3
4
5
6
(十万元)
2.5
3
4
4.5
6
(1)该公司经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程:
(2)如果该公司最终决定在城市选择两个合适的地段各开设了一个分店,根据市场调查得到如下统计数据,第一分店每天的顾客平均为30人,其中5人会购买该品牌奶茶,第二分店每天的顾客平均为80人,其中20人会购买该品牌奶茶.完成下列表格,并依据小概率值的独立性检验,试问两个分店的顾客下单率有无差异?
不下单
下单
合计
分店一
分店二
合计
参考公式:,,,
题型五:回归分析与概率的综合
12.(25-26高三上·重庆·月考)近期甲型H3N2流感来袭,医学研究表明,如果每天温差太大,人们受风寒刺激极易受凉感冒,自身抵抗力就会变弱,易受流感病毒侵袭,特别是对于学生及老年人群体更需保暖和多加防范.我校数学建模社团成员共同研究了一天昼夜温差的大小与我校患流感就诊人数多少之间的关系,他们记录了某周周一至周六的温差,并到校医室查阅了这六天中每天学生新增流感就诊的人数,得到数据如下:
日期
周一
周二
周三
周四
周五
周六
昼夜温差t(℃)
4
7
8
9
14
12
新增流感就诊人数y(位)
y₁
y₂
y₃
y₄
y₅
y₆
参考数据:,
(1)已知第一天新增流感就诊的学生中有3位男生,从第一天新增的流感就诊学生中随机抽取2位,其中男生人数记为X,若抽取的2人中至少一位女生的概率为 求X的分布列和数学期望;
(2)已知两个变量t与y之间的样本相关系数 ,请用最小二乘法求出y关于t的经验回归方程 ,据此估计昼夜温差为13℃时,我校新增流感就诊的学生人数.
参考公式:,
13.(25-26高三上·江苏盐城·月考)随着新能源产业的发展,某地区近年来新能源汽车保有量快速增长,为了研究充电桩建设的情况,相关部门收集到了2021年到2025年充电桩数量(单位:万个),为方便研究,年份代码用表示(如:表示2021年),具体参考数据如下表:
55
70.4
19
(1)请根据表中数据,建立关于的回归直线方程;
(2)假设该地区现有12个充电桩,其中一半为快充桩,现对该地区现有的12个充电桩进行检查,随机抽取3个充电桩进行检查,记抽到的快充桩个数为,求的分布列及均值.
(参考公式:,.)
14.(24-25高二下·河北承德·期末)2025年4月,中国新能源汽车零售渗透率突破,进入“以电为主”的新阶段,充电桩的使用率也成为关注焦点.经调查,某市今年月份的充电桩日均使用时长(时)与新能源汽车保有量(万辆)及充电桩日均使用率(,为常数)的数据如下表所示:
月份
1
2
3
4
5
6
新能源汽车保有量(万辆)
8
13
15
18
23
25
充电桩日均使用时长(时)
5
7
10
12
15
17
充电桩日均使用率
0.15
0.21
0.3
0.36
0.45
0.51
(1)若用充电桩日均使用率近似估计一个充电桩一天内被使用的概率,设该市某个充电桩在3月份的某3天中被使用的天数为,求的分布列;
(2)求关于的样本相关系数,并说明线性相关程度的强弱;(精确到0.01)
(3)若关于的经验回归方程为,求的值(精确到0.1),并预测当该市某月的新能源汽车保有量为36万辆时,充电桩的日均使用率为多少.
参考数据:,.
参考公式:相关系数.
15.(25-26高三上·湖北宜昌·月考)随着科技的发展,人工智能生成的虚拟角色正逐步取代传统的真人直播带货.某公司使用虚拟角色直播带货后销售金额逐步提升,根据该公司使用虚拟角色直播带货后20个月的销售金额的情况统计,得到一组样本数据,其中和分别表示月份编号和销售金额(单位:万元),并计算得,,.
(1)求样本的相关系数(精确到),并推断销售金额(单位:万元)和月份编号的相关程度;
(2)已知这20个月中有8个月的销售金额低于平均数,从这20个月中随机抽取2个月的销售金额,记抽到销售金额低于平均数的月份数为,求随机变量的分布列.
附:相关系数.
题型六:独立性检验与概率的综合
16.(25-26高三上·河北张家口·期末)某省为了解高中生对足球赛事的了解情况,特地举办了一次足球常识问卷调查,问卷的满分为100分,统计结果显示,学生成绩,不低于60分为及格,高于80分为优秀,且优秀率为20%.根据某高中学校参加问卷的90名学生的调查结果,得到如下列联表:
性别
关注足球赛事
不关注足球赛事
合计
男
55
5
60
女
20
10
30
合计
75
15
90
(1)根据小概率值的独立性检验,分析该校学生对足球赛事的关注是否与性别有关;
(2)在这90名学生中随机抽取一名,记事件表示抽到“学生关注足球赛事”,事件表示抽到“学生是女生”,求及的值;
(3)从全省参与调查的学生中随机选出5人,这5人中及格的人数记作,求的期望与方差.
附:,其中.
常用的小概率值和相应的临界值:
0.05
0.01
0.001
3.841
6.635
10.828
17.(2025高三上·贵州贵阳·专题练习)某电商平台在用户选购家电时,要求每位用户先从冰箱和洗衣机这两类大家电中选定一类,再从微波炉、烤箱、扫地机器人、空气净化器这四类小家电中任选两类.选购结束后,为了解用户的选购情况,随机抽取了部分用户作为样本,对他们的选购情况统计后得到下表:
微波炉
烤箱
扫地机器人
空气净化器
冰箱类
100
120
200
180
洗衣机类
120
140
60
80
(1)利用上述样本数据填写以下列联表,并依据小概率值的独立性检验,分析以上两类大家电对空气净化器的选法是否存在差异.
类别
空气净化器选法
选
不选
合计
冰箱类
洗衣机类
合计
(2)假设该平台所有选购家电的用户中有的用户选择了冰箱类,其余的用户都选择了洗衣机类,且在冰箱类的用户中两个小家电选择的是烤箱和扫地机器人的概率为,而在洗衣机类的用户中两小家电选择的是烤箱和扫地机器人的概率为.若从该平台所有用户中随机抽取100名用户,用表示这100名用户中同时选择了烤箱和扫地机器人的人数,求随机变量的均值.
附:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
18.(2025·云南昭通·模拟预测)某高校为了解学生在一周内参与志愿服务的情况,统计了全校所有学生在一年内每周参与志愿服务的次数,现随机抽取了50名同学,统计在某一周参与志愿服务的数据,结果如下表:
一周参与志愿服务次数
1
2
3
4
5
6
合计
男生人数
4
6
6
4
3
2
25
女生人数
1
1
3
5
9
6
25
合计
5
7
9
9
12
8
50
(1)若将一周参与志愿服务次数为5次及5次以上的,称为“积极参与”,其余的称为“一般参与”.请完成以下2×2列联表,并依据小概率值的独立性检验,能否认为性别因素与学生参与志愿服务的积极性有关系;
性别
志愿服务
合计
一般参与
积极参与
男生
女生
合计
(2)若将一周参与志愿服务达到6次的同学称为“最美志愿者”,在样本的8名“最美志愿者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为,求的分布列和数学期望.
附:,.
0.1
0.05
0.01
2.706
3.841
6.635
19.(2025·四川内江·一模)某兴趣小组调查了某校100名学生100米短跑成绩的情况,其中有60 名学生的短跑成绩合格.这100名学生中有45名学生每周自主锻炼时间超过5小时,60名短跑成绩合格的学生中有35名学生每周自主锻炼时间超过5小时.现对短跑成绩不合格的学生进行跑步技巧培训,已知每周自主锻炼时间超过5小时的学生参加跑步技巧培训后,学生的短跑成绩合格的概率为,每周自主锻炼时间不超过5小时的学生参加跑步技巧培训后,学生的短跑成绩合格的概率为.用频率估计概率,从短跑成绩不合格的学生中随机抽取1名学生(记为甲)进行跑步技巧培训.依据小概率值的独立性检验,零假设为:学生短跑成绩合格与每周自主锻炼时间相互独立.
(1)先填写列联表,再依据小概率值的独立性检验,判断是否能认为学生短跑成绩合格与每周自主锻炼时间超过5小时有关;
每周自主锻炼时间超过5小时
每周自主锻炼时间不超过5小时
合计
短跑成绩合格
短跑成绩不合格
合计
100
(2)求学生甲在培训后短跑成绩合格的情况下,每周自主锻炼时间不超过5小时的概率;
(3)为提高学生锻炼的积极性,学校偶尔会在田径运动场举办锻炼有奖活动,记表示事件“田径运动场举办锻炼有奖的抽奖活动”,表示事件“小明去田径运动场锻炼”,.已知小明在田径运动场举办锻炼有奖的抽奖活动的情况下去运动场锻炼的概率,比不举办抽奖活动的情况下去运动场锻炼的概率大.证明:.
参考公式与数据:,其中,.
0.01
0.005
0.001
6.635
7.879
10.828
20.(25-26高三上·湖北黄冈·期末)有媒体称DeepSeek开启了我国AI新纪元.某高校拟与某网络平台合作组织学生参加与AI知识有关的网络答题活动,为了解男女学生参与答题意愿的差异,男生、女生各取100人.设事件“学生愿意报名参加答题活动”,“学生为男生”,据统计.
(1)根据已知条件,完成下列列联表,并依据小概率值的独立性检验,能否推断该校学生报名参加答题活动与性别有关?
性别
男生
女生
合计
不愿报名参加答题活动
愿意报名参加答题活动
合计
200
(2)网络答题规则:假设甲每道题回答是否正确相互独立,且每次答对的概率均为.
(i)若答题活动设置且道题,甲仅答对其中10道题的概率最大,求的值.
(ii)若答题活动设置4道题,且答题规则如下:每次答一题,一旦答对,则结束答题;答错则继续答题,直到4道题答完.已知甲同学报名参加答题活动,用表示在本次答题的题目数量,求的分布列和期望.
参考公式与数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
2 / 37
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$