内容正文:
8.3 列联表与独立性检验
1. 分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
2. 列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表:假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表
总计
总计
3.
独立性检验:计算随机变量,其中,利用的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.
1.(多选)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一
次数据统计,并根据形成的2×2列联表,计算得到,根据小概率值为的独立性检验,则( )
附:
0.100
0.050
0.010
2.706
3.841
6.635
A.若,则认为“毛色”和“角”无关
B.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过10%
C.若,则认为“毛色”和“角”无关
D.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过1%
【答案】BC
【分析】根据独立性检验的判断原则一一分析即可.
【详解】对AB,若,因为 ,则认为“毛色”和“角”有关,此推断犯错误的概率不超过10%,故A 错,B 对;
对CD,若,因为,则认为“毛色”和“角”无关,故C正确,D错误.
故选:BC.
2.(多选)下列关于的说法正确的是( )
A.根据列联表中的数据计算得出,则有的把握认为两个分类变量有关系
B.越大,认为两个分类变量有关系的把握性就越大
C.是用来判断两个分类变量有关系的可信程度的随机变量
D.,其中为样本容量
【答案】ABC
【知识点】独立性检验的概念及辨析、独立性检验的基本思想、独立性检验解决实际问题
【分析】根据独立性检验概念及公式分别判断各个选项.
【详解】根据列联表中的数据计算得出,则有的把握认为两个分类变量有关系,A选项正确;
越大,认为两个分类变量有关系的把握性就越大,B选项正确;
是用来判断两个分类变量有关系的可信程度的随机变量,C选项正确;
公式中分子应该是,D选项错误.
故选:ABC.
3.通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
【答案】A
【知识点】独立性检验的基本思想、独立性检验解决实际问题
【分析】根据独立性检验的原理逐项判断可得答案.
【详解】零假设为:爱好跳绳与性别无关.
A.∵,∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关.选项A正确.
B. ∵,∴根据小概率值的独立性检验,没有充分证据推断不成立,因此可以认为爱好跳绳与性别无关,但无法判断这个结论犯错误的概率是否超过.选项B错误.
C.∵,∴根据小概率值的独立性检验,我们认为爱好跳绳与性别有关.C错误.
D. ∵,∴在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别有关.D错误.
故选:A.
4.(多选)统计学中,常用的显著性水平以及对应的分位数如下表所示.
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.若,则在犯错误的概率不超过的前提下认为与有关
B.若,则在犯错误的概率不超过的前提下认为与无关
C.若,则有的把握认为与有关
D.若,,则
【答案】ACD
【知识点】独立性检验的基本思想
【分析】根据的计算结果与常用的显著性水平的对应的分位数大小关系,判断ABC,结合的性质判断D.
【详解】对于A,因为,,,
所以根据小概率值的独立性检验,推断零假设不成立,即在犯错误的概率不超过的前提下认为与有关,A正确;
对于B,因为,,,所以根据小概率值的独立性检验,推断零假设不成立,即在犯错误的概率不超过的前提下认为与有关,B错误;
对于C,因为,,,所以根据小概率值的独立性检验,推断零假设不成立,即在犯错误的概率不超过的前提下认为与有关,C正确;
对于D,因为分布是单调递增的累积分布函数,所以,所以,D正确;故选:ACD.
5.根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
【答案】D
【分析】根据给定条件,利用独立性检验的意义逐项判断即得.
【详解】由,得吸烟与患肺癌有关联,此推断犯错误的概率不大于1%,D正确;
卡方检验仅说明吸烟与患肺癌两个变量间的关联性,无法量化个体情况,这两个变量间也无因果关系,ABC错误.
故选:D
6.为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算,根据这一数据分析,下列说法正确的是( )
(附:)
A.有的人认为该电视栏目优秀
B.有的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
【答案】D
【分析】根据卡方表示的意义结合临界值表分析判断即可
【详解】只有时才能在犯错误的概率不超过的前提下认为该电视栏目是否优秀与改革有关系,
而即使也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的推论,与是否有的人等无关.故A,B不正确.
由于,故C错误,D正确.
故选:D.
7.根据分类变量x与y的成对样本数据,计算得,依据的独立性检验,结论为( )参考值:
0.1
0.05
0.01
2.706
3.841
6.635
A.x与y不独立
B.x与y不独立,这个结论犯错误的概率不超过0.05
C. x与y独立
D.x与y独立,这个结论犯错误的概率不超过0.05
【答案】C
【分析】利用独立性检验的基本思想即可得解.
【详解】零假设为:x与y独立,
由,依据的独立性检验,可得成立,
故可以认为x与y独立.
故选:C.
8. 为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设:患慢性气管炎与吸烟没有关系,并通过计算得到统计量,则可推断 原假设.(填“拒绝”或“接受”,规定显著性水平.)
【答案】拒绝
【知识点】独立性检验的基本思想
【分析】在独立性检验中,当计算得到的统计量大于临界值时,就拒绝原假设,即可求解.
【详解】已知显著性水平,,即临界值为,
因为,所以可推断拒绝原假设.
故答案为:拒绝.
9.根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则的值不
可能为( )
2.072
2.706
3.841
6.635
7.879
0.150
0.100
0.050
0.010
0.005
A.2.819 B.5.512 C.6.635 D.8.243
【答案】A
【分析】利用独立性检验的观测值对应临界表可得答案.
【详解】因为有不少于95%的把握认为 X 和Y 有关,
所以,只有A不满足要求.
故选:A
10. 下列说法错误的是( )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
【答案】C
【难度】0.65
【知识点】抽样比、样本总量、各层总数、总体容量的计算、相关系数的意义及辨析、独立性检验解决实际问题、总体百分位数的估计
【分析】利用分层抽样计算判断A;求出第75百分位数判断B;利用线性相关系数的意义判断C;利用独立性检验的思想判断D.
【详解】对于A,该校高一年级女生人数是,A正确;
对于B,由,得第75百分位数为,B正确;
对于C,线性回归方程中,线性相关系数绝对值越大,两个变量的线性相关性越强,C错误;
对于D,由,可判断与有关联,此推断犯错误的概率不大于0.05,D正确.
故选:C
11. 下列说法中,正确的个数是( )
①若随机变量X服从正态分布,且,则;
②可以用相关系数r刻画两个变量的相关程度强弱,r值越大两个变量的相关程度越强.
③残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越高;
④根据分类变量X与Y的成对样本数据,计算得到,根据小概率值的独立性检验,可判断X与Y有关联,此推断犯错误的概率不超过0.05.
⑤决定系数,甲、乙两个模型的分别约为0.98和0.80,则模型乙的拟合效果更好.
A.1 B.2 C.3 D.4
【答案】B
【知识点】相关系数的意义及辨析、相关指数的计算及分析、解释回归直线方程的意义、正态曲线的性质
【分析】根据正态分布对称性的应用可判断命题①;根据相关系数的定义判断命题②;根据残差图的性质判断命题③;根据独立性检验的知识判断命题④,根据决定系数性质判断命题⑤.
【详解】对于①. 已知随机变量服从正态分布,,
则,所以,故①错误;
对于②,线性相关系数的范围在到1之间,有正有负,相关有正相关和负相关,
相关系数的绝对值的大小越接近于1,两个变量的线性相关性越强;反之,线性相关性越弱,故②错误;
对于③,在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,则回归方程的预报精确度越高,故③正确;
对于④,据分类变量X与Y的成对样本数据,计算得到,根据小概率值的独立性检验,可判断X与Y有关联,此推断犯错误的概率不超过0.05,故④正确.
对于⑤,因为甲的决定系数比乙的决定系数更接近1,所以模型甲的拟合效果更好,命题⑤错误;
故选:B.
12. 2024年12月26日,Deep Seek—V3首个版本正式上线,截至2025年2月9日,Deep Seek APP的累计下载量已超1.1亿次,AI成为当下的热门话题.立德中学高中数学社团以16至40岁人群使用Deep Seek频率为课题,分小组自主选题进行调查研究,下列说法正确的是( )
A.甲小组开展了Deep Seek每周使用频次与年龄的相关性研究,经计算样本相关系数,可以推断两个变量正线性相关,但相关程度很弱
B.乙小组利用最小二乘法得到Deep Seek每周使用频次y关于年龄x的经验回归方程为,可以推断年龄为30岁的群体每周使用频次一定为17次
C.丙小组用决定系数来比较模型的拟合效果,经验回归方程①和②的分别约为0.733和0.998,因此经验回归方程②的刻画效果比经验回归方程①的好很多
D.丁小组研究性别因素是否影响Deep Seek使用频次,根据小概率值的独立性检验,计算得到,可以认为不同性别的Deep Seek使用频次没有差异
【答案】C
【知识点】相关系数的意义及辨析、根据样本中心点求参数、相关指数的计算及分析、独立性检验解决实际问题
【分析】由相关系数,回归方程,决定系数,卡方的检验逐项判断即可.
【详解】对于A,由的绝对值越接近1,相关性越强可得A错误,故A错误;
对于B,回归方程为给出的是预测值,实际值会有随机误差,所以年龄为30岁的群体每周使用频次不一定为17次,故B错误;
对于C,表示模型对因变量的解释比例,大说明经验回归方程②的刻画效果比经验回归方程①的好很多,故C正确;
对于D,,可以认为不同性别的Deep Seek使用频次有差异,故D错误.
13.(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表.经计算,则可以推断出( )
满意
不满意
男
30
20
女
40
10
A.该学校男生对食堂服务满意的概率的估计值为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有不少于95%的把握认为男、女生对该食堂服务的评价有差异
D.有不少于99%的把握认为男、女生对该食堂服务的评价有差异
【答案】AC
【难度】0.65
【知识点】独立性检验解决实际问题、计算古典概型问题的概率
【分析】应用古典概型判断A,B选项,根据与边界值比较判断C,D选项.
【详解】对于选项A,该学校男生对食堂服务满意的概率的估计值为,故A正确;
对于选项B,该学校女生对食堂服务满意的概率的估计值为,故B错误;
因为,所以有不少于95%的把握认为男、女生对该食堂服务的评价有差异,故C正确,D错误.
故选:AC.
14.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
甲班
10
乙班
30
0.05
0.025
0.010
0.005
3.841
5.024
6.635
7.879
附:(),
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.甲班人数少于乙班人数
B.甲班的优秀率高于乙班的优秀率
C.表中的值为15,的值为50
D.根据表中的数据,若按的可靠性要求,能认为“成绩与班级有关系”
【答案】D
【分析】根据条件解出,,然后直接计算即可判断A,B,C错误,使用的计算公式计算,并将其与比较,即可得到D正确.
【详解】对于C,由条件知,,故,.
所以,,故C错误;
对于A,由于甲班人数为,
乙班人数为,故A错误;
对于B,由于甲班优秀率为,乙班优秀率为,故B错误;
对于D,由于,故D正确.
故选:D.
15.(多选)为比较甲、乙两所学校学生的数学水平,采取简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名学生数学成绩优秀;乙校45名学生中有7名学生数学成绩优秀.整理数据如下表:
学校
数学成绩
合计
不优秀
优秀
甲校
33
10
43
乙校
38
7
45
合计
71
17
88
附:.
则下列说法正确的有( )
A.甲校的数学抽测成绩优秀率一定比乙校的数学抽测成绩优秀率高
B.甲校的数学成绩优秀率一定比乙校的数学成绩优秀率高
C.甲校的数学优秀人数可能比乙校的数学优秀人数多
D.对于小概率值,可以认为两校的数学成绩优秀率几乎没有差异
【答案】ACD
【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题
【分析】根据样本的抽测成绩的代表性强弱,可判断ABC,利用计算可判断D.
【详解】对于A,因为甲校的数学抽测成绩优秀率为,乙校的数学抽测成绩优秀率为,
所以甲校的数学抽测成绩优秀率一定比乙校的数学抽测成绩优秀率高,故A正确;
对于B,抽测的样本的优秀率可能代表性差,不一定能真实的反映两校的优秀率,故B错误;
对于C,有可能甲校的数学优秀人数可能比乙校的数学优秀人数多,故C正确;
对于D,,
根据小概率的独立性检验,两校的数学成绩优秀率没有差异,故D正确.
故选:ACD.
16.
某医疗研究机构为了解某种地方性疾病与当地居民的生活习惯(生活习惯分良好和不够良好)的关系,现从该地区随机抽取名居民,统计数据如下:
生活习惯
合计
良好
不够良好
患有该疾病居民
0.6n
1.4n
2n
未患有该疾病居民
1.2n
0.8n
2n
合计
1.8n
2.2n
4n
若根据小概率值的独立性检验,分析发现居民是否患有该疾病与生活习惯有关联,则从该地区抽取居民人数至少为( )
附:,.
A.60 B.76 C.80 D.100
【答案】C
【知识点】卡方的计算
【分析】由卡方的计算结合题意可得.
【详解】,又,所以,且,,,均为整数,所以的最小值为20,则从该地区抽取居民人数至少为80.
故选:C
17.为了考察某种药物预防疾病的效果,进行动物试验,得到如下图所示列联表:
药物
疾病
合计
未患病
患病
服用
50
未服用
50
合计
80
20
100
取显著性水平,若本次考察结果支持“药物对疾病预防有显著效果”,则()的最小值为 .(参考公式:;参考值:)
【答案】
【分析】由题意列出不等式,结合近似计算求出m的取值范围,即可得答案.
【详解】由题意可知,则,
解得或,而,故m的最小值为44.故答案为:44.
18.校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数.若有的把握认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,.
A.20 B.30 C.35 D.40
【答案】A
【分析】借助卡方计算即可得.
【详解】设总人数为,则男生选学生物学的人数为,女生选生物学的人数为,
则,即,又为的倍数,故男生最少有人.
故选:A.
【题型二】解答题
月份
3
4
5
6
7
旅游收入
10
12
11
12
20
1.文旅部门统计了某网红景点在2022年3月至7月的旅游收入(单位:万),得到以下数据:
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由(精确到0.001);
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,并判断能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关”.
喜欢
不喜欢
总计
男
100
女
60
总计
110
参考数据:.
0.010
0.005
0.001
6.635
7.879
10.828
【答案】(1)可用线性回归模型拟合与的关系,.
(2)列联表见解析,有99.9%的把握认为游客是否喜欢该网红景点与性别有关.
【难度】0.65
【知识点】求回归直线方程、相关系数的计算、完善列联表、独立性检验解决实际问题
【分析】(1)先依据已知条件依次计算、、、和,进而计算,从而得出可用线性回归模型拟合与的关系,再根据最小二乘法求出即可得解.
(2)由已知数据即可填写列联表;根据表格数据计算,再结合独立性检验基本思想方法即可得解.
【详解】(1)由已知得:,,
所以,
,
,
所以,
因为,说明与的线性相关关系很强,可用线性回归模型拟合与的关系,
所以,
所以关于的线性回归方程为:.
(2)列联表如下所示:
喜欢
不喜欢
总计
男
70
30
100
女
40
60
100
总计
110
90
200
零假设:游客是否喜欢该网红景点与性别无关,
根据列联表中数据,,
依据小概率值的独立性检验推断不成立,
即有的把握认为游客是否喜欢该网红景点与性别有关.
2. 在2025年春晚《秧BOT》节目中,宇树科技的Unitree H1“福兮”机器人采用人工智能(AI)驱动全身运动控制技术,能根据音乐旋律调整舞步,其最大关节扭矩高达360牛顿•米.节目播出后引发公众对机器人技术的兴趣和热情,为了了解不同性别的学生对AI的关注情况,随机抽取了90名学生,调查结果如下表:
(1)完成下述列联表,依据该统计数据,能否有的把握认为学生对AI的关注与性别有关?
(2)在这90名学生中随机抽取一位,求在关注AI的情况下,该生为女生的概率.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
关注
不关注
合计
男生
55
60
女生
合计
75
【答案】(1)答案见解析;有的把握认为学生对AI的关注与性别有关.
(2)
【难度】0.65
【知识点】完善列联表、卡方的计算、计算条件概率
【分析】(1)根据题意,完成列联表,求出,对照数据即可得到结论.
(2)根据条件概率的计算公式求解.
【详解】(1)完成列联表如下:
关注
不关注
合计
男生
55
5
60
女生
20
10
30
合计
75
15
90
则.
因为,所以有的把握认为学生对AI的关注与性别有关.
(2)设事件:表示关注“关注AI”,事件表示“该生为女生”.
则,,
所以.
即在这90名学生中随机抽取一位,在关注AI的情况下,该生为女生的概率为.
3. 已知某学校为提高学生课外锻炼的积极性,开展了丰富的课外活动,为了解学生对开展的课外活动的满意程度,该校随机抽取了350人进行调查,整理得到如下列联表:
性别
课外活动
合计
满意
不满意
男
150
100
250
女
50
50
100
合计
200
150
350
0.1
0.05
0.01
2.706
3.841
6.635
(1)根据小概率值的独立性检验,能否认为该校学生对课外活动的满意情况与性别因素有关联?
(2)从这350名样本学生中任选1名学生,设事件“选到的学生是男生”,事件“选到的学生对课外活动满意”,比较和的大小.
附:
【答案】(1)认为该校学生对课外活动的满意情况与性别因素无关联;(2)
【难度】0.65
【知识点】独立性检验解决实际问题、计算条件概率
【分析】(1)同过列联表中数据计算的值,再与小概率值进行比较得出结论;
(2)根据条件概率公式本别计算和的值并比较两值的大小.
【详解】(1)提出零假设:该校学生对课外活动的满意情况与性别因素无关联,
根据表中数据,得到,
所以根据小概率值的独立性检验,没有充分证据推断不成立,
即认为该校学生对课外活动的满意情况与性别因素无关联.
(2)依题意得,,,,,
所以,,则.
4. 食品安全负责部门为了对某大型超市经营的某品牌(由A,B两个不同的产地生产)的“预制食品”的某些指标进行检测,随机从A,B两个产地生产的产品中分别抽取了30个作为样本进行检测,依据检测相应指标的相关数据,将其划定为“优良”和“合格”两个级别,记录相关数据得到如下2×2列联表:
(1)依据小概率值的独立性检验,分析“该食品的指标等级与产地”是否有关?
级别
产地
合计
A
B
优良
20
15
35
合格
10
15
25
合计
30
30
60
(2)该超市对该“预制食品”进行打包促销,对于同一产地生产的食品采用每5个装为一个“促销大礼包”的促销形式,若某顾客随机购买了一个“促销大礼包”,经检测显示恰有4个为优良级别,试通过概率知识确定该“促销大礼包”内装的是A产地生产的食品的概率(该超市A,B两个产地的售出量之比为3:2,以列联表中产品的优良的频率代替各自产品优良的概率).(单位:个)
参考公式和数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)可以认为“该食品的指标等级与产地”无关.;(2)【难度】0.65
【知识点】卡方的计算、独立性检验解决实际问题、计算条件概率、全概率公式、贝叶斯公式
【分析】(1)计算,与临界值比较即可得解;
(2)利用全概率公式及条件概率公式求解即可.
【详解】(1)零假设为:该食品的指标等级与产地无关,
根据表中数据计算得,,
依据小概率值的独立性检验,没有充分证据推断不成立,
因此可以认为“该食品的指标等级与产地”无关.
(2)记为“‘促销大礼包’中有4个为优良级别”;A为“‘促销大礼包’中的食品由A产地生产”;B为“‘促销大礼包’中的食品由B产地生产”依题意,,,
,
则,
所以该“促销大礼包”内装的是产地生产的食品的概率为.
5.
目前电动车的电池有石墨烯电池与铅酸电池两种,某公司为了了解该市电动车消费者对这两种电池电动车的偏好,随机调查了500名电动车用户,其中男性用户300名,在被调查的女性用户中偏好铅酸电池电动车的占,得到以下的2×2列联表:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性用户
200
300
女性用户
合计
500
(1)根据以上数据,完成2×2列联表,依据小概率值的独立性检验,能否认为该市电动车用户对这两种电池的电动车的偏好与性别有关;
(2)从偏好石墨烯电池电动车的用户中按性别比例用分层随机抽样的方法随机抽取7人进行问卷调查,再从这7名用户中抽取2人进行座谈,在有女性用户参加座谈的条件下,求恰有两名女性用户参加座谈的概率;
(3)用样本的频率估计概率,在该市所有女性电动车用户中随机抽取3名进行新车试驾,记3名参加试驾的女性用户中偏好石墨烯电池电动车的人数为X,求X的分布列.
【答案】(1)列联表见解析,能;(2);(3)分布列见解析
【解析】(1)被调查的女性市民人数为,
其中偏好铅酸电池电动车的女性市民人数为.
偏好石墨烯电池电动车的女性市民人数为,
所以2×2列联表为:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性市民
200
100
300
女性市民
80
120
200
合计
280
220
500
零假设:市民对这两种电池的电动车的偏好与市民的性别无关,
根据列联表中的数据可以求得
,
由于,根据小概率值的独立性检验,我们推断不成立,
即认为市民对这两种电池的电动车的偏好与市民的性别有关.
(2)因为偏好石墨烯电池电动车的市民中,男性市民与女性市民的比为,
所以采用分层抽样的方法抽取7的人中,男性市民有5人,女性市民有2人,
设“有女性市民参加座谈”为事件A,“恰有两名女性市民参加座谈”为事件B,
则,,所以.
(3)根据频率估计概率知,女性用户中偏好石墨烯电池电动车的概率为,
偏好铅酸电池电动车的概率为,
参加试驾的女性用户中偏好石墨烯电池电动车的人数为X,可能取值为0,1,2,3,
,,
,,
故X的分布列如下:
X
0
1
2
3
P
6. 某工厂生产某款产品,根据质量指标值Q对产品进行等级划分,Q小于60的产品视为不合格品,Q不小于60的产品视为合格品,其中Q不小于90的产品视为优质品.工厂为了提升产品质量,对设备进行升级.为考察设备升级后产品的质量,质检部门对设备升级前后生产的产品进行简单随机抽样,得到样本数据,制作如下频数表:
(1)根据所给数据填写下列2×2列联表,并依据小概率值的独立性检验,分析产品合格与设备升级是否有关联.
不合格品件数
合格品件数
合计
升级前
升级后
合计
(2)以上述样本中设备升级后的优质品频率作为升级后产品的优质品率,质检部门为检查设备升级后是否正常运转,每天从该设备生产的产品中随机抽取10件产品并检测.
(i)记X表示抽取的10件产品中的优质品件数,求(精确到0.001);
(ii)质检部门规定:若抽检的10件产品中,至少出现2件优质品,则认为设备正常运转,否则需对设备进行检修.请根据的值解释上述规定的合理性.参考数据:,,
【答案】(1)列联表见解析,可以认为产品合格与设备升级有关联,该推断犯错误的概率不超过
(2)(i);(ii)理由见解析
【难度】0.65
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题、利用二项分布求分布列
【分析】(1)先计算出的值,根据独立性检验的思想对照临界值得结论;
(2)(i)根据二项分布的有关计算公式,求出的概率;(ii)优质品件数少于2个的概率只有,据此可得结论.
【详解】(1)依题意可得列联表为:
不合格品件数
合格品件数
合计
升级前
20
80
100
升级后
10
90
100
合计
30
170
200
零假设:产品合格与设备升级没有关联,
由列联表可计算,
依据小概率的独立性检验,我们可以推断不成立,
因此可以认为产品合格与设备升级有关联,该推断犯错误的概率不超过.
(2)(i)根据题意,设备升级后的优质品率为,
可以认为从生产线中抽出的10件产品是否为优质品是相互独立的,则,
,
所以;
(ii)如果设备正常运转,一天内抽取的10 件产品中,优质品件数少于2个的概率只有,发生的概率很小,因此一旦发生这种情况,就有理由认为设备运转异常,需对设备进行检修,可见上述规定是合理的.
Sora的应用情况
视频从业人员
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
7.向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展以人工智能的应用为例,人工智能中的文生视频模型Sora(以下简称Sora),能够根据用户的文本提示创建最长60秒的逼真视频.为调查Sora的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
0.010
0.005
0.001
6.635
7.879
10.828
(1)根据所给数据,判断是否有的把握认为Sora的应用与视频从业人员的减少有关?
(2)某公司视频部拟开展Sora培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用Sora.
(i)求员工经过培训能应用Sora的概率;
(ii)已知开展Sora培训前,员工每人每年平均为公司创造利润6万元;开展Sora培训后,能应用Sora的员工每人每年平均为公司创造利润10万元;Sora培训平均每人每年成本为1万元.视频部现有员工100人,根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展Sora培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
【答案】(1)有的把握认为Sora的应用与视频从业人员的减少有关,理由见解析;
(2)(i);(ii)人.
【难度】0.65
【知识点】二项分布的均值、独立事件的乘法公式、独立性检验解决实际问题、卡方的计算
【分析】(1)先零假设,然后计算,根据小概率值的独立性检验即可判断;
(2)(i)设“员工经过培训能应用Sora”,结合互斥事件概率加法公式,独立事件概率乘法公式即可求解;
(ii)设视频部调人至其他部门,为培训后视频部能应用Sora的人数,则,由条件列不等式可求结论.
【详解】(1)零假设:Sora的应用与视频从业人员的减少无关,
,
根据小概率值的独立性检验,可以推断出不成立,
所以有的把握认为Sora的应用与视频从业人员的减少有关;
(2)(i)设“员工经过培训能应用Sora”,
所以,
所以员工经过培训能应用Sora的概率为;
(ii)设视频部调人至其他部门,,为培训后视频部能应用Sora的人数,
则,因此,
调整后视频部的期望年利润为:(万元),
令,解得,又,所以,
因此视频部最多可以调人到其他部门.
性别
绩效分数达标情况
合计
未达标
达标
男
20
10
30
女
5
25
30
合计
25
35
60
8. 某工厂为了解员工绩效分数达标情况与员工性别的关系,随机对该厂男、女各30名员工的绩效分数达标情况进行调查,整理得到如下列联表:(单位:人)
(1)经计算,所调查的男员工绩效分数的平均数为26;女员工绩效分数的平均数为34,求这60人绩效分数的平均数.
(2)根据上表数据,依据小概率值的独立性检验,能否据此推断绩效分数达标情况与性别有关联?
(3)该厂为激励员工,规定每月绩效分数的第一名奖励1千元,其他名次无奖励.甲为该厂员工,他在工厂开工的第一个月赢得奖励的概率为,从第二个月开始,若上个月没有赢得奖励,则这个月赢得奖励的概率为;若上个月赢得奖励,则这个月仍赢得奖励的概率为,求甲在前两个月所得奖金总额X(单位:千元)的分布列和数学期望.
附:参考公式:,其中.
0.1
0.01
0.001
2.706
6.635
10.828
【答案】(1)
(2)有关联
(3)分布列见解析,
【难度】0.65
【知识点】计算几个数的平均数、独立性检验解决实际问题、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)根据题意计算即可;
(2)由已知数据利用公式计算,与参考数据比较大小即可得出结论;
(3)根据题意计算出可能取值及相应概率,即可得到分布列,再利用公式计算期望值.
【详解】(1)由题意可知,.
(2)零假设为:绩效分数达标情况与性别无关.
,
根据小概率值的独立性检验,我们推断不成立,即认为绩效分数达标情况与性别有关联,此推断犯错误的概率不大于0.001.
(3)由题意知可能的取值为,
则;
,
所以甲在前两个月所得奖金总额的分布列为
0
1
2
数学期望.
分数区间性别
男生/名
15
45
60
女生/名
25
25
30
9.
为激发学生注重学科核心素养的培养,某校数学教研组开展数学基本技能比赛,比赛采用自主报名参赛方式,全校共有200名学生自主报名参赛,统计参赛成绩,参赛学生所得分数的分组区间为,,,得到如下的频数统计表:
(1)若学生得分不低于90分,则认为基本技能优秀,得分低于90分,则认为基本技能良好,依据小概率值的独立性检验,分析该校学生的基本技能与性别是否有关?
α
0.10
0.05
0.010
2.706
3.841
6.635
(2)为进一步调研男生和女生在基本技能上的差异,在参加数学基本技能比赛的200名学生中,按性别比例分层抽样的方式随机抽取5名学生进行问卷调研,然后再从这5名学生中随机抽取3名学生进行座谈调研,记取出的3人中女生的人数为X,求X的分布列和数学期望.
【答案】(1)认为该校学生的基本技能与性别有关联
(2)分布列见解析,
【知识点】独立性检验的基本思想、写出简单离散型随机变量分布列、超几何分布的均值
【分析】(1)由题设完善列联表,应用卡方公式求卡方值,根据独立检验的基本思想得结论;
(2)由题意的可能取值有0,1,2,进而求其分布列并求期望值.
【详解】(1)根据题意得如下2×2列联表:
男生
女生
合计
基本技能优秀
60
30
90
基本技能良好
60
50
110
合计
120
80
200
零假设:该校学生的基本技能与性别无关联.
,
依据小概率值的独立性检验,我们推断不成立,
即认为该校学生的基本技能与性别有关联,此推断犯错误的概率不大于0.1.
(2)由题意知,随机抽取进行问卷调查的5名学生中,女生2名,男生3名,
所以随机变量的可能取值有0,1,2,
故,
,
,
故X的分布列如下,
X
0
1
2
P
.
10.“村BA”是由贵州省台盘村“六月六”吃新节篮球赛发展而来的赛事,比赛由村民组织,参赛者以村民为主,极具乡村气息.某学校为了研究不同性别的学生对该赛事的了解情况,进行了一次抽样调查,分别随机抽取男生和女生各80名作为样本,设事件“了解村BA”,“学生为女生”,据统计.
(1)根据已知条件,作出列联表,并判断是否有的把握认为该校学生对“村”的了解情况与性别有关;
(2)现从该校不了解“村BA”的学生中,采用分层随机抽样的方法抽取10名学生,再从这10名学生中随机抽取4人,设抽取的4人中男生的人数为,求的分布列和数学期望.
【分析】(1)先根据条件概率求得人数填写列联表:再代入公式求出,将该值与临界值比较即可求解.
(2)先根据分层抽样确定抽取的男生人数和女生人数,再写出的所有可能取值并计算相应的概率,列出分布列并根据数学期望公式可得出答案.
【详解】(1)因为,
所以对“村BA”了解的女生人数为,了解“村BA”的学生人数为,
结合男生和女生各80名,作出列联表为:
了解
不了解
总计
男生
30
50
80
女生
5
75
80
总计
35
125
160
,
因此,有的把握认为该校学生对“村BA”的了解情况与性别有关.
(2)由(1)知,采用分层随机抽样的方法抽取10名学生,
其中男生人数为,女生人数为.
随机变量的所有可能取值为0,1,2,3,4.
,
.
故随机变量的分布列如下:
0
1
2
3
4
则.
11.某高中学校为了解学生参加体育锻炼的情况,统计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学在某一周参加体育锻炼的数据,结果如下表
一周参加体育锻炼次数
0
1
2
3
4
5
6
7
合计
男生人数
1
2
4
5
6
5
4
3
30
女生人数
4
5
5
6
4
3
2
1
30
合计
5
7
9
11
10
8
6
4
60
(1)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为“不经常锻炼”.请完成以下2×2列联表,并依据独立性检验,能否有90%的把握认为性别因素与学生体育锻炼的经常性有关系;
性别
锻炼
合计
不经常
经常
男生
女生
合计
(2)若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会导致肥胖等诸多健康问题,以样本频率估计概率,在全校抽取20名同学,其中“极度缺乏锻炼”的人数为X,求和;
(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为,求的分布列和数学期望.
附:
参考数据:
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
【答案】(1)列联表见解析;有90%的把握认为性别因素与学生体育锻炼的经常性有关系
(2),
(3)分布列见解析,
【难度】0.65
【知识点】独立性检验解决实际问题、超几何分布的均值、二项分布的均值、二项分布的方差
【分析】(1)由60名同学的统计数据可得列联表,代入公式可得,再对照临界值表即可得出结论;
(2)求出随机抽取一人为“极度缺乏锻炼”者的概率,易得服从二项分布,由二项分布即可得和;
(3)依题意可得的所有可能取值为0,1,2,3,利用超几何分布公式求得概率,进而即可得到的分布列和期望值.
【详解】(1)根据统计表格数据可得列联表如下:
性别
锻炼
合计
不经常
经常
男生
7
23
30
女生
14
16
30
合计
21
39
60
根据列联表的数据计算可得
,
故有90%的把握认为性别因素与学生体育锻炼的经常性有关系;
(2)因学校总学生数远大于所抽取的学生数,故近似服从二项分布,
易知随机抽取一人为“极度缺乏锻炼”者的概率,即可得,
故,;
(3)易知10名“运动爱好者”有7名男生,3名女生,
所以Y的所有可能取值为0,1,2,3,且Y服从超几何分布:
,
,
,
故所求分布列为
Y
0
1
2
3
P
可得
电子产品
近视
未近视
非长时间使用电子产品
40
70
长时间使用电子产品
60
30
12. 2024年6月5日《中国教育报》刊发了教育部的“呵护好孩子的眼睛,共创光明的未来”的文章,其中特别强调“幼儿单次使用电子产品的时间不宜超过15分钟,累计每天不超过1小时”等内容.为切实提升儿童青少年视力健康整体水平,某学校积极推进近视综合防控,落实“明眸”工程,开展了近视原因的调查以备有效进行预防.在已近视的学生中随机调查了100人,同时在未近视的学生中随机调查了100人,得到如下数据:
(1)依据小概率值的独立性检验,能否认为患近视与长时间使用电子产品有关?
(2)用频率估计概率,从已经近视的学生中采用随机抽样的方式选出1名学生,利用“物理+药物”治疗方案对该学生进行治疗.已知“物理+药物”治疗方案的治愈数据如下:在已近视的学生中,对非长时间使用电子产品的学生的治愈率为,对长时间使用电子产品的学生的治愈率为,求该近视学生被治愈的概率;
(3)若按样本数据利用分层随机抽样的方法从近视学生中抽取5人,再从这5人中抽取3人进行近视矫正实验,记表示这3人中长时间使用电子产品的人数,求的分布列与数学期望.
【答案】(1)有关联
(2)
(3)分布列见解析,
【难度】0.65
【知识点】利用全概率公式求概率、超几何分布的分布列、独立性检验解决实际问题、卡方的计算
【分析】(1)先设零假设,计算再与边界值比较判断即可;
(2)应用全概率公式计算求解即可;
(3)根据超几何分布求出概率再计算数学期望即可.
【详解】(1)零假设为:学生患近视与长时间使用电子产品无关,
,
依据小概率值的独立性检验,我们推断不成立,
即认为学生患近视与长时间使用电子产品有关联,此推断犯错误的概率不大于0.001.
(2)设事件表示使用“物理十药物”治疗方案并且治愈,
事件表示非长时间使用电子产品的近视学生,事件表示长时间使用电子产品的近视学生,
由题意可得,
且,
则
,
所以该近视学生被治愈的概率为.
(3)由样本数据可知近视学生中长时间使用电子产品与非长时间使用电子产品的人数比例为,
所以抽取的5人中有3人是长时间使用电子产品,有2人是非长时间使用电子产品,
所以的可能取值为,
且,
;
,
所以的分布列为:
1
2
3
所以数学期望为.
13.是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、论文以及翻译文章、编写代码等任务,成为历史上增长量最快的消费者应用程序.为调查浙江省大学生对的了解情况,从浙江省内各高校抽取400名学生进行问卷调查,得到部分数据如下表:
是否了解情况
男
女
总计
了解
80
不了解
160
总计
200
400
(1)完成上述列联表,并判断是否有99.9%的把握认为浙江省大学生对的了解情况与性别有关;
(2)某高校科研所抓住机遇,抢占市场先机,决定成立分别由3名教授领衔的甲、乙、丙三个科研小组,已知甲、乙、丙三个小组能获得成功的概率分别为,且三个小组各自独立进行研究,每个研究成功的小组都会受到科研所的奖励,设受到奖励的小组数为X,求.
【答案】(1)填表见解析;有
(2)
【分析】(1)根据题意,得出列联表,求得,结合附表,即可得到结论;
(2)根据题意,得到的可能取值为,利用相互独立事件的概率乘法公式,求得相应的概率,得出分布列,求得数学期望.
【详解】(1)解:根据已知完成列联表如下,
是否了解情况
男
女
总计
了解
80
40
120
不了解
120
160
280
总计
200
200
400
零假设:大学生对的了解情况与性别无关,
则,则,
所以零假设不成立,则有99.9%的把握认为浙江省大学生对的了解情况与性别有关.
(2)解:由题意,随机变量的可能取值为,
可得,,
,,
所以X的分布列为
0
1
2
3
所以.
14.为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.
年龄次数
每周0~2次
70
55
36
59
每周3~4次
25
40
44
31
每周5次及以上
5
5
20
10
(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据数据回答:是否有的把握认为体育锻炼频率的高低与年龄有关;
(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;
(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为,求小明星期天选择跑步的概率.
参考公式:
附:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)有的把握认为体育锻炼频率的高低与年龄有关.
(2)分布列见解析;期望为
(3)
【分析】(1)根据题意,列出的列联表,求得卡方值,结合附表,即可得到结论;
(2)根据题意,得到随机变量的可能取值为,求得相应的概率,列出分布列,结合期望的公式,即可求解;
(3)根据题意,结合全概率公式,即可求解.
【详解】(1)解:由题意,可得的列联表,如下表所示:
青年
中年
合计
体育锻炼频率低
125
95
220
体育锻炼频率高
75
105
180
合计
200
200
400
可得,
所以有的把握认为体育锻炼频率的高低与年龄有关.
(2)解:由表中的数据,利用分层抽样的方法抽取的8人中,年龄在与的人数分别为人和人,
根据题意,可得随机变量的可能取值为,
则,
,
,
所以随机变量的分布列为:
所以随机变量的数学期望为.
(3)解:记小明在某一星期六选择跑步、篮球、羽毛球,分别为事件,星期天选择跑步为事件,
则,,
所以,
所以小明星期天选择跑步的概率为.
15.已知羽毛球比赛的单打规则是:若发球方胜,则发球方得1分,且继续在下一回合发球;若接球方胜,则接球方得1分,且成为下一回合发球方、现甲、乙二人进行羽毛球单打比赛,随机选取了以往甲、乙两名运动员对阵中的300回合的比赛数据,得到如下待完善的2×2列联表:
甲得分
乙得分
总计
甲发球
90
乙发球
120
总计
120
300
(1)完成列联表,并根据小概率值的独立性检验,能否认为“比赛得分与接、发球有关”?
(2)以列联表中甲、乙各自接、发球的得分频率分别作为每一回合中甲、乙各自接、发球的得分概率.
①若第1回合是甲先发球,设第回合是甲发球的概率为,证明:是等比数列;
②已知:若随机变量服从两点分布,且,,则.若第1回合是甲先发球,求甲、乙连续进行300回合比赛后,甲的总得分期望.(结果保留2位小数)
参考公式:,其中,.
【答案】(1)列联表见解析,有99.9%的把握认为“比赛得分与接、发球有关”
(2)证明见解析,②100.44
【分析】(1)根据题意列联表,然后卡方计算,分析根据小概率值的独立性检验,认为“比赛得分与接、发球有关”
(2)①分析第回合是甲发球要分两种情况:第回合是甲发球且甲得分,或第回合是乙发球且甲得分,然后根据等比数列的定义判断数列为等比数列;②根据两点分布的特征,然后根据结合等比数列的求和公式求解即可.
【详解】(1)由题得完整列联表如下:
甲得分
乙得分
M计
甲发球
90
60
150
乙发球
30
120
150
总计
120
180
300
经计算,
因为,故根据小概率值的独立性检验,认为“比赛得分与接、发球有关” .
(2)由题已知:在甲发球的情况下,甲得分的概率为,乙得分的概率为;
在乙发球的情况下,乙得分的概率为,甲得分的概率为.
①第回合是甲发球要分两种情况:第回合是甲发球且甲得分,或第回合是乙发球且甲得分,
即:,
故,
故,
又,
故是以为首项,为公比的等比数列.
②由①可得,
故.
记“第回合甲得分为”,则显然服从两点分布,且事件“”等价于“第回合是甲发球”,故.
又甲、乙共连续进行300回合比赛后,甲的得分为,
故
16.国家设立国家自然科学基金,用于资助基础研究,支持人才培养和团队建设. 现对近4年的国家自然科学基金项目支出(以下简称项目支出)概况进行统计,得到数据如下表:
年份
2020年
2021年
2022年
2023年
年份序号
1
2
3
4
项目支出/百亿元
90
96
100
108
(1)经过数据分析,发现年份序号与项目支出具有线性相关关系. 请求出项目支出y关于年份序号x的经验回归方程,并预测2025年的项目支出;
(2)天元基金是国家自然科学基金中的数学专项基金之一,为促进甲、乙两个地区天元基金申报者的交流,天元基金委员会举办了论坛活动. 经调查统计,甲、乙两个地区共有200人参加此次论坛活动,具体数据如下表:
男生
女生
合计/人
甲
65
35
100
乙
45
55
100
合计/人
110
90
200
(i)根据小概率值的独立性检验,能否认为申报者所在地区与性别有关联?
(ii)为了解此次论坛活动的满意度(满意度评分满分为10分),现采用按男、女样本量比例分配的分层随机抽样,从上述200人中抽取40人进行访谈,其中男生样本的满意度平均数为9分,方差为7.19,女生样本的满意度平均数为7分,方差为6.79,由这些数据,请求出总样本的满意度的平均数和方差,并对全体参加此次论坛活动的天元基金申报者的满意度的平均数和方差作出估计.
附:,,,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1),118.8百亿元
(2)(i)能;(ii)平均数为8.1,方差为8;全体参加论坛活动的天元基金者的满意度的平均数为8.1,方差为8
【难度】0.65
【知识点】估计总体的方差、标准差、求回归直线方程、独立性检验解决实际问题
【分析】(1)利用所给的公式求回归方程,并用之预测2025年的项目支出.
(2)(i)计算,根据独立性检验的思想进行判断;(ii)根据部分数据与整体数据特征数的关系求值.
【详解】(1)(法一),
,
,
所以,
所以国家自然科学技术基金项目支出y关于年份序号x的经验回归方程为.
当时,(百亿元),
预测2025年的国家自然科学技术基金项目支出为118.8百亿元.
(法二),,
,
所以国家自然科学技术基金项目支出y关于年份序号x的经验回归方程为.
当时,(百亿元),
预测2025年的国家自然科学技术基金项目支出为118.8百亿元.
(2)(i)零假设为
申报天元基金者的所在地区与性别无关联.
根据列联表中的数据,经计算得到
.
依据小概率值的独立性检验,我们推断不成立,即认为申报天元基金者的所在地区与性别有关联,此推断犯错误的概率不大于0.005.
(ⅱ)把男生样本的满意度平均数记为,方差记为;
女生样本的满意度平均数记为,方差记为;总样本的满意度平均数记为,方差记为.
则,
根据男、女样本量按比例分配的分层随机抽样总样本平均数与各层样本平均数的关系,
可得总样本的满意度平均数为,
.
总样本的满意度的平均数为8.1,方差为8.
并据此估计全体参加论坛活动的天元基金者的满意度的平均数为8.1,方差为8.
17.某学校校庆时统计连续天进入学校参加活动的校友数(单位:千人)如下:
日期
月日
月日
月日
月日
月日
第天
参观人数
(1)由上表数据看出,可用线性回归模型拟合与的关系,请用相关系数加以说明(保留小数点后两位);(若,则认为与的线性相关性很强),并求出关于的线性回归方程;
(2)校庆期间学校开放号门、号门和号门供校友出入,校友从号门、号门和号门进入学校的概率分别为、、,且出学校与进学校选择相同门的概率为,选择与入校不同两门的概率各为.假设校友从号门、号门、号门出入学校互不影响,现有甲、乙、丙、丁名校友于月日回母校参加活动,设为人中从号门出学校的人数,求的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
【答案】(1),说明见解析,
(2)分布列见解析,,.
【知识点】求回归直线方程、二项分布的方差、相关系数的计算、利用全概率公式求概率
【分析】(1)求出,将参考数据代入相关系数公式,求出的值,即可得出结论;再将数据代入最小二乘法公式,求出、的值,即可得出回归直线方程;
(2)利用全概率公式求出每个人从号门出校园的概率均为,由此可知,利用二项分布可得出随机变量的分布列,利用二项分布的期望、方差公式可得出、的值.
【详解】(1)依题意,,而,,,
则.
因为时线性相关程度高,所以与线性相关性很强,可以用线性回归模型拟合.
,,
因此,回归方程为.
(2)记“甲从号门出学校”为事件,“甲从号门进学校”为事件,
“甲从号门进学校”为事件,“甲从号门进学校”为事件,
由题意可得,,,
,,
由全概率公式得:
,
同理乙、丙、丁从号门出学校的概率也为,
为人中从号门出学校的人数,则,
,,
,,
,
故的分布列为:
,.
第 1 页 共 5 页
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$选择性必修三第八章 成对数据的统计分析 知识过手练习
8.3 列联表与独立性检验
1. 分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.
2. 列联表:
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表:假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表
总计
总计
3.
独立性检验:计算随机变量,其中,利用的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验.
1.(多选)为了验证牛的毛色(黑色、红色)和角(有角、无角)这两对相对性状是否相关,某学院进行了一
次数据统计,并根据形成的2×2列联表,计算得到,根据小概率值为的独立性检验,则( )
附:
0.100
0.050
0.010
2.706
3.841
6.635
A.若,则认为“毛色”和“角”无关
B.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过10%
C.若,则认为“毛色”和“角”无关
D.若,则认为“毛色”和“角”有关,此推断犯错误的概率不超过1%
2.(多选)下列关于的说法正确的是( )
A.根据列联表中的数据计算得出,则有的把握认为两个分类变量有关系
B.越大,认为两个分类变量有关系的把握性就越大
C.是用来判断两个分类变量有关系的可信程度的随机变量
D.,其中为样本容量
3.通过随机询问某中学110名中学生是否爱好跳绳,得到列联表,并由计算得: 参照附表,则下列结论正确的是( )
A.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
B.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关,这个结论犯错误的概率不超过
C.根据小概率值的独立性检验,我们认为爱好跳绳与性别无关
D.在犯错误的概率不超过的前提下,我们认为爱好跳绳与性别无关
4.(多选)统计学中,常用的显著性水平以及对应的分位数如下表所示.
在检验与是否有关的过程中,根据已知数据计算得,则( )
A.若,则在犯错误的概率不超过的前提下认为与有关
B.若,则在犯错误的概率不超过的前提下认为与无关
C.若,则有的把握认为与有关
D.若,,则
5.根据吸烟与患肺癌这两个分类变量的样本数据,计算得出,经查阅独立性检验的小概率值和相应的临界值,则下列说法正确的是( )
A.在100个吸烟的人中就会有99人患肺癌
B.若某人吸烟,那么他有99%的可能患肺癌
C.若某人患肺癌,那么他有99%的可能为吸烟者
D.吸烟与患肺癌有关联,此推断犯错误的概率不大于1%
6.为了评价某个电视栏目的改革效果,某机构在改革前后分别从居民点抽取了100位居民进行调查,经过计算,根据这一数据分析,下列说法正确的是( )
(附:)
A.有的人认为该电视栏目优秀
B.有的人认为该电视栏目是否优秀与改革有关系
C.在犯错误的概率不超过的前提下,认为该电视栏目是否优秀与改革有关系
D.没有理由认为该电视栏目是否优秀与改革有关系
7.根据分类变量x与y的成对样本数据,计算得,依据的独立性检验,结论为( )参考值:
0.1
0.05
0.01
2.706
3.841
6.635
A.x与y不独立 B.x与y不独立,这个结论犯错误的概率不超过0.05
C. x与y独立 D.x与y独立,这个结论犯错误的概率不超过0.05
8. 为了研究吸烟习惯与慢性气管炎患病的关系,某疾病预防中心对相关调查数据进行了研究,假设:患慢性气管炎与吸烟没有关系,并通过计算得到统计量,则可推断 原假设.(填“拒绝”或“接受”,规定显著性水平.)
9.根据分类变量 X 和Y 的样本观察数据的计算结果,有不少于95%的把握认为 X 和Y 有关,则的值不
可能为( )
2.072
2.706
3.841
6.635
7.879
0.150
0.100
0.050
0.010
0.005
A.2.819 B.5.512 C.6.635 D.8.243
10. 下列说法错误的是( )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
11. 下列说法中,正确的个数是( )
①若随机变量X服从正态分布,且,则;
②可以用相关系数r刻画两个变量的相关程度强弱,r值越大两个变量的相关程度越强.
③残差图中,残差点所在的水平带状区域越窄,则回归方程的预报精确度越高;
④根据分类变量X与Y的成对样本数据,计算得到,根据小概率值的独立性检验,可判断X与Y有关联,此推断犯错误的概率不超过0.05.
⑤决定系数,甲、乙两个模型的分别约为0.98和0.80,则模型乙的拟合效果更好.
A.1 B.2 C.3 D.4
12. 2024年12月26日,Deep Seek—V3首个版本正式上线,截至2025年2月9日,Deep Seek APP的累计下载量已超1.1亿次,AI成为当下的热门话题.立德中学高中数学社团以16至40岁人群使用Deep Seek频率为课题,分小组自主选题进行调查研究,下列说法正确的是( )
A.甲小组开展了Deep Seek每周使用频次与年龄的相关性研究,经计算样本相关系数,可以推断两个变量正线性相关,但相关程度很弱
B.乙小组利用最小二乘法得到Deep Seek每周使用频次y关于年龄x的经验回归方程为,可以推断年龄为30岁的群体每周使用频次一定为17次
C.丙小组用决定系数来比较模型的拟合效果,经验回归方程①和②的分别约为0.733和0.998,因此经验回归方程②的刻画效果比经验回归方程①的好很多
D.丁小组研究性别因素是否影响Deep Seek使用频次,根据小概率值的独立性检验,计算得到,可以认为不同性别的Deep Seek使用频次没有差异
13.(多选)某大学为了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如下表所示的列联表.经计算,则可以推断出( )
满意
不满意
男
30
20
女
40
10
A.该学校男生对食堂服务满意的概率的估计值为
B.调研结果显示,该学校男生比女生对食堂服务更满意
C.有不少于95%的把握认为男、女生对该食堂服务的评价有差异
D.有不少于99%的把握认为男、女生对该食堂服务的评价有差异
0.05
0.025
0.010
0.005
3.841
5.024
6.635
7.879
14.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:
优秀
非优秀
甲班
10
乙班
30
附:(),
已知在全部105人中随机抽取1人,成绩优秀的概率为,则下列说法正确的是( )
A.甲班人数少于乙班人数
B.甲班的优秀率高于乙班的优秀率
C.表中的值为15,的值为50
D.根据表中的数据,若按的可靠性要求,能认为“成绩与班级有关系”
15.(多选)为比较甲、乙两所学校学生的数学水平,采取简单随机抽样的方法抽取88名学生.通过测验得到了如下数据:甲校43名学生中有10名学生数学成绩优秀;乙校45名学生中有7名学生数学成绩优秀.整理数据如下表:
学校
数学成绩
合计
不优秀
优秀
甲校
33
10
43
乙校
38
7
45
合计
71
17
88
附:.
则下列说法正确的有( )
A.甲校的数学抽测成绩优秀率一定比乙校的数学抽测成绩优秀率高
B.甲校的数学成绩优秀率一定比乙校的数学成绩优秀率高
C.甲校的数学优秀人数可能比乙校的数学优秀人数多
D.对于小概率值,可以认为两校的数学成绩优秀率几乎没有差异
16.
某医疗研究机构为了解某种地方性疾病与当地居民的生活习惯(生活习惯分良好和不够良好)的关系,现从该地区随机抽取名居民,统计数据如下:
生活习惯
合计
良好
不够良好
患有该疾病居民
0.6n
1.4n
2n
未患有该疾病居民
1.2n
0.8n
2n
合计
1.8n
2.2n
4n
若根据小概率值的独立性检验,分析发现居民是否患有该疾病与生活习惯有关联,则从该地区抽取居民人数至少为( )
附:,.
A.60 B.76 C.80 D.100
17.为了考察某种药物预防疾病的效果,进行动物试验,得到如下图所示列联表:
药物
疾病
合计
未患病
患病
服用
50
未服用
50
合计
80
20
100
取显著性水平,若本次考察结果支持“药物对疾病预防有显著效果”,则()的最小值为 .(参考公式:;参考值:)
18.校数学兴趣社团对“学生性别和选学生物学是否有关”作了尝试性调查.其中被调查的男女生人数相同.男生选学生物学的人数占男生人数的,女生选学生物学的人数占女生人数.若有的把握认为选学生物学和性别有关,则调查人数中男生不可能有( )人.
附表:
0.100
0.050
0.010
0.005
0.001
2.706
3.841
6.635
7.879
10.828
其中,.
A.20 B.30 C.35 D.40
月份
3
4
5
6
7
旅游收入
10
12
11
12
20
【题型二】解答题
1.文旅部门统计了某网红景点在2022年3月至7月的旅游收入(单位:万),得到以下数据:
(1)根据表中所给数据,用相关系数加以判断,是否可用线性回归模型拟合与的关系?若可以,求出关于之间的线性回归方程;若不可以,请说明理由(精确到0.001);
(2)为调查游客对该景点的评价情况,随机抽查了200名游客,得到如下列联表,请填写下面的列联表,并判断能否有99.9%的把握认为“游客是否喜欢该网红景点与性别有关”.
喜欢
不喜欢
总计
男
100
女
60
总计
110
参考数据:.
0.010
0.005
0.001
6.635
7.879
10.828
2. 在2025年春晚《秧BOT》节目中,宇树科技的Unitree H1“福兮”机器人采用人工智能(AI)驱动全身运动控制技术,能根据音乐旋律调整舞步,其最大关节扭矩高达360牛顿•米.节目播出后引发公众对机器人技术的兴趣和热情,为了了解不同性别的学生对AI的关注情况,随机抽取了90名学生,调查结果如下表:
(1)完成下述列联表,依据该统计数据,能否有的把握认为学生对AI的关注与性别有关?
(2)在这90名学生中随机抽取一位,求在关注AI的情况下,该生为女生的概率.
附:,其中.
0.1
0.05
0.01
0.001
2.706
3.841
6.635
10.828
关注
不关注
合计
男生
55
60
女生
合计
75
3. 已知某学校为提高学生课外锻炼的积极性,开展了丰富的课外活动,为了解学生对开展的课外活动的满意程度,该校随机抽取了350人进行调查,整理得到如下列联表:
性别
课外活动
合计
满意
不满意
男
150
100
250
女
50
50
100
合计
200
150
350
0.1
0.05
0.01
2.706
3.841
6.635
(1)根据小概率值的独立性检验,能否认为该校学生对课外活动的满意情况与性别因素有关联?
(2)从这350名样本学生中任选1名学生,设事件“选到的学生是男生”,事件“选到的学生对课外活动满意”,比较和的大小.
附:
4. 食品安全负责部门为了对某大型超市经营的某品牌(由A,B两个不同的产地生产)的“预制食品”的某些指标进行检测,随机从A,B两个产地生产的产品中分别抽取了30个作为样本进行检测,依据检测相应指标的相关数据,将其划定为“优良”和“合格”两个级别,记录相关数据得到如下2×2列联表:
(1)依据小概率值的独立性检验,分析“该食品的指标等级与产地”是否有关?
级别
产地
合计
A
B
优良
20
15
35
合格
10
15
25
合计
30
30
60
(2)该超市对该“预制食品”进行打包促销,对于同一产地生产的食品采用每5个装为一个“促销大礼包”的促销形式,若某顾客随机购买了一个“促销大礼包”,经检测显示恰有4个为优良级别,试通过概率知识确定该“促销大礼包”内装的是A产地生产的食品的概率(该超市A,B两个产地的售出量之比为3:2,以列联表中产品的优良的频率代替各自产品优良的概率).(单位:个)
参考公式和数据:,其中.
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
5.
目前电动车的电池有石墨烯电池与铅酸电池两种,某公司为了了解该市电动车消费者对这两种电池电动车的偏好,随机调查了500名电动车用户,其中男性用户300名,在被调查的女性用户中偏好铅酸电池电动车的占,得到以下的2×2列联表:
偏好石墨烯电池电动车
偏好铅酸电池电动车
合计
男性用户
200
300
女性用户
合计
500
(1)根据以上数据,完成2×2列联表,依据小概率值的独立性检验,能否认为该市电动车用户对这两种电池的电动车的偏好与性别有关;
(2)从偏好石墨烯电池电动车的用户中按性别比例用分层随机抽样的方法随机抽取7人进行问卷调查,再从这7名用户中抽取2人进行座谈,在有女性用户参加座谈的条件下,求恰有两名女性用户参加座谈的概率;
(3)用样本的频率估计概率,在该市所有女性电动车用户中随机抽取3名进行新车试驾,记3名参加试驾的女性用户中偏好石墨烯电池电动车的人数为X,求X的分布列.
6. 某工厂生产某款产品,根据质量指标值Q对产品进行等级划分,Q小于60的产品视为不合格品,Q不小于60的产品视为合格品,其中Q不小于90的产品视为优质品.工厂为了提升产品质量,对设备进行升级.为考察设备升级后产品的质量,质检部门对设备升级前后生产的产品进行简单随机抽样,得到样本数据,制作如下频数表:
(1)根据所给数据填写下列2×2列联表,并依据小概率值的独立性检验,分析产品合格与设备升级是否有关联.
不合格品件数
合格品件数
合计
升级前
升级后
合计
(2)以上述样本中设备升级后的优质品频率作为升级后产品的优质品率,质检部门为检查设备升级后是否正常运转,每天从该设备生产的产品中随机抽取10件产品并检测.
(i)记X表示抽取的10件产品中的优质品件数,求(精确到0.001);
(ii)质检部门规定:若抽检的10件产品中,至少出现2件优质品,则认为设备正常运转,否则需对设备进行检修.请根据的值解释上述规定的合理性.参考数据:,,
Sora的应用情况
视频从业人员
合计
减少
未减少
应用
54
18
72
没有应用
36
42
78
合计
90
60
150
7.向“新”而行,向“新”而进,新质生产力能够更好地推动高质量发展以人工智能的应用为例,人工智能中的文生视频模型Sora(以下简称Sora),能够根据用户的文本提示创建最长60秒的逼真视频.为调查Sora的应用是否会对视频从业人员的数量产生影响,某学校研究小组随机抽取了150名视频从业人员进行调查,结果如下表所示.
0.010
0.005
0.001
6.635
7.879
10.828
(1)根据所给数据,判断是否有的把握认为Sora的应用与视频从业人员的减少有关?
(2)某公司视频部拟开展Sora培训,分三轮进行,每位员工第一轮至第三轮培训达到“优秀”的概率分别为,,,每轮相互独立,有二轮及以上获得“优秀”的员工才能应用Sora.
(i)求员工经过培训能应用Sora的概率;
(ii)已知开展Sora培训前,员工每人每年平均为公司创造利润6万元;开展Sora培训后,能应用Sora的员工每人每年平均为公司创造利润10万元;Sora培训平均每人每年成本为1万元.视频部现有员工100人,根据公司发展需要,计划先将视频部的部分员工随机调至其他部门,然后对剩余员工开展Sora培训,现要求培训后视频部的年利润不低于员工调整前的年利润,则视频部最多可以调多少人到其他部门?
性别
绩效分数达标情况
合计
未达标
达标
男
20
10
30
女
5
25
30
合计
25
35
60
8. 某工厂为了解员工绩效分数达标情况与员工性别的关系,随机对该厂男、女各30名员工的绩效分数达标情况进行调查,整理得到如下列联表:(单位:人)
(1)经计算,所调查的男员工绩效分数的平均数为26;女员工绩效分数的平均数为34,求这60人绩效分数的平均数.
(2)根据上表数据,依据小概率值的独立性检验,能否据此推断绩效分数达标情况与性别有关联?
(3)该厂为激励员工,规定每月绩效分数的第一名奖励1千元,其他名次无奖励.甲为该厂员工,他在工厂开工的第一个月赢得奖励的概率为,从第二个月开始,若上个月没有赢得奖励,则这个月赢得奖励的概率为;若上个月赢得奖励,则这个月仍赢得奖励的概率为,求甲在前两个月所得奖金总额X(单位:千元)的分布列和数学期望.
附:参考公式:,其中.
0.1
0.01
0.001
2.706
6.635
10.828
分数区间性别
男生/名
15
45
60
女生/名
25
25
30
9.
为激发学生注重学科核心素养的培养,某校数学教研组开展数学基本技能比赛,比赛采用自主报名参赛方式,全校共有200名学生自主报名参赛,统计参赛成绩,参赛学生所得分数的分组区间为,,,得到如下的频数统计表:
(1)若学生得分不低于90分,则认为基本技能优秀,得分低于90分,则认为基本技能良好,依据小概率值的独立性检验,分析该校学生的基本技能与性别是否有关?
α
0.10
0.05
0.010
2.706
3.841
6.635
(2)为进一步调研男生和女生在基本技能上的差异,在参加数学基本技能比赛的200名学生中,按性别比例分层抽样的方式随机抽取5名学生进行问卷调研,然后再从这5名学生中随机抽取3名学生进行座谈调研,记取出的3人中女生的人数为X,求X的分布列和数学期望.
10.“村BA”是由贵州省台盘村“六月六”吃新节篮球赛发展而来的赛事,比赛由村民组织,参赛者以村民为主,极具乡村气息.某学校为了研究不同性别的学生对该赛事的了解情况,进行了一次抽样调查,分别随机抽取男生和女生各80名作为样本,设事件“了解村BA”,“学生为女生”,据统计.
(1)根据已知条件,作出列联表,并判断是否有的把握认为该校学生对“村”的了解情况与性别有关;
(2)现从该校不了解“村BA”的学生中,采用分层随机抽样的方法抽取10名学生,再从这10名学生中随机抽取4人,设抽取的4人中男生的人数为,求的分布列和数学期望.
11.某高中学校为了解学生参加体育锻炼的情况,统计了全校所有学生在一年内每周参加体育锻炼的次数,现随机抽取了60名同学在某一周参加体育锻炼的数据,结果如下表
一周参加体育锻炼次数
0
1
2
3
4
5
6
7
合计
男生人数
1
2
4
5
6
5
4
3
30
女生人数
4
5
5
6
4
3
2
1
30
合计
5
7
9
11
10
8
6
4
60
(1)若将一周参加体育锻炼次数为3次及3次以上的,称为“经常锻炼”,其余的称为“不经常锻炼”.请完成以下2×2列联表,并依据独立性检验,能否有90%的把握认为性别因素与学生体育锻炼的经常性有关系;
性别
锻炼
合计
不经常
经常
男生
女生
合计
(2)若将一周参加体育锻炼次数为0次的称为“极度缺乏锻炼”,“极度缺乏锻炼”会导致肥胖等诸多健康问题,以样本频率估计概率,在全校抽取20名同学,其中“极度缺乏锻炼”的人数为X,求和;
(3)若将一周参加体育锻炼6次或7次的同学称为“运动爱好者”,为进一步了解他们的生活习惯,在样本的10名“运动爱好者”中,随机抽取3人进行访谈,设抽取的3人中男生人数为,求的分布列和数学期望.
附:
参考数据:
0.100
0.050
0.010
0.005
2.706
3.841
6.635
7.879
电子产品
近视
未近视
非长时间使用电子产品
40
70
长时间使用电子产品
60
30
12. 2024年6月5日《中国教育报》刊发了教育部的“呵护好孩子的眼睛,共创光明的未来”的文章,其中特别强调“幼儿单次使用电子产品的时间不宜超过15分钟,累计每天不超过1小时”等内容.为切实提升儿童青少年视力健康整体水平,某学校积极推进近视综合防控,落实“明眸”工程,开展了近视原因的调查以备有效进行预防.在已近视的学生中随机调查了100人,同时在未近视的学生中随机调查了100人,得到如下数据:
(1)依据小概率值的独立性检验,能否认为患近视与长时间使用电子产品有关?
(2)用频率估计概率,从已经近视的学生中采用随机抽样的方式选出1名学生,利用“物理+药物”治疗方案对该学生进行治疗.已知“物理+药物”治疗方案的治愈数据如下:在已近视的学生中,对非长时间使用电子产品的学生的治愈率为,对长时间使用电子产品的学生的治愈率为,求该近视学生被治愈的概率;
(3)若按样本数据利用分层随机抽样的方法从近视学生中抽取5人,再从这5人中抽取3人进行近视矫正实验,记表示这3人中长时间使用电子产品的人数,求的分布列与数学期望.
13.是人工智能技术驱动的自然语言处理工具,它能够通过理解和学习人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、论文以及翻译文章、编写代码等任务,成为历史上增长量最快的消费者应用程序.为调查浙江省大学生对的了解情况,从浙江省内各高校抽取400名学生进行问卷调查,得到部分数据如下表:
是否了解情况
男
女
总计
了解
80
不了解
160
总计
200
400
(1)完成上述列联表,并判断是否有99.9%的把握认为浙江省大学生对的了解情况与性别有关;
(2)某高校科研所抓住机遇,抢占市场先机,决定成立分别由3名教授领衔的甲、乙、丙三个科研小组,已知甲、乙、丙三个小组能获得成功的概率分别为,且三个小组各自独立进行研究,每个研究成功的小组都会受到科研所的奖励,设受到奖励的小组数为X,求.
14.为了解居民体育锻炼情况,某地区对辖区内居民体育锻炼进行抽样调查.统计其中400名居民体育锻炼的次数与年龄,得到如下的频数分布表.
年龄次数
每周0~2次
70
55
36
59
每周3~4次
25
40
44
31
每周5次及以上
5
5
20
10
(1)若把年龄在的锻炼者称为青年,年龄在的锻炼者称为中年,每周体育锻炼不超过2次的称为体育锻炼频率低,不低于3次的称为体育锻炼频率高,根据数据回答:是否有的把握认为体育锻炼频率的高低与年龄有关;
(2)从每周体育锻炼5次及以上的样本锻炼者中,按照表中年龄段采用按比例分配的分层随机抽样,抽取8人,再从这8人中随机抽取3人,记这3人中年龄在与的人数分别为,求ξ的分布列与期望;
(3)已知小明每周的星期六、星期天都进行体育锻炼,且两次锻炼均在跑步、篮球、羽毛球3种运动项目中选择一种,已知小明在某星期六等可能选择一种运动项目,如果星期六选择跑步、篮球、羽毛球,则星期天选择跑步的概率分别为,求小明星期天选择跑步的概率.
参考公式:
附:
0.10
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
15.已知羽毛球比赛的单打规则是:若发球方胜,则发球方得1分,且继续在下一回合发球;若接球方胜,则接球方得1分,且成为下一回合发球方、现甲、乙二人进行羽毛球单打比赛,随机选取了以往甲、乙两名运动员对阵中的300回合的比赛数据,得到如下待完善的2×2列联表:
甲得分
乙得分
总计
甲发球
90
乙发球
120
总计
120
300
(1)完成列联表,并根据小概率值的独立性检验,能否认为“比赛得分与接、发球有关”?
(2)以列联表中甲、乙各自接、发球的得分频率分别作为每一回合中甲、乙各自接、发球的得分概率.
①若第1回合是甲先发球,设第回合是甲发球的概率为,证明:是等比数列;
②已知:若随机变量服从两点分布,且,,则.若第1回合是甲先发球,求甲、乙连续进行300回合比赛后,甲的总得分期望.(结果保留2位小数)
参考公式:,其中,.
16.国家设立国家自然科学基金,用于资助基础研究,支持人才培养和团队建设. 现对近4年的国家自然科学基金项目支出(以下简称项目支出)概况进行统计,得到数据如下表:
年份
2020年
2021年
2022年
2023年
年份序号
1
2
3
4
项目支出/百亿元
90
96
100
108
(1)经过数据分析,发现年份序号与项目支出具有线性相关关系. 请求出项目支出y关于年份序号x的经验回归方程,并预测2025年的项目支出;
(2)天元基金是国家自然科学基金中的数学专项基金之一,为促进甲、乙两个地区天元基金申报者的交流,天元基金委员会举办了论坛活动. 经调查统计,甲、乙两个地区共有200人参加此次论坛活动,具体数据如下表:
男生
女生
合计/人
甲
65
35
100
乙
45
55
100
合计/人
110
90
200
(i)根据小概率值的独立性检验,能否认为申报者所在地区与性别有关联?
(ii)为了解此次论坛活动的满意度(满意度评分满分为10分),现采用按男、女样本量比例分配的分层随机抽样,从上述200人中抽取40人进行访谈,其中男生样本的满意度平均数为9分,方差为7.19,女生样本的满意度平均数为7分,方差为6.79,由这些数据,请求出总样本的满意度的平均数和方差,并对全体参加此次论坛活动的天元基金申报者的满意度的平均数和方差作出估计.
附:,,,其中.
0.1
0.05
0.025
0.01
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
17.某学校校庆时统计连续天进入学校参加活动的校友数(单位:千人)如下:
日期
月日
月日
月日
月日
月日
第天
参观人数
(1)由上表数据看出,可用线性回归模型拟合与的关系,请用相关系数加以说明(保留小数点后两位);(若,则认为与的线性相关性很强),并求出关于的线性回归方程;
(2)校庆期间学校开放号门、号门和号门供校友出入,校友从号门、号门和号门进入学校的概率分别为、、,且出学校与进学校选择相同门的概率为,选择与入校不同两门的概率各为.假设校友从号门、号门、号门出入学校互不影响,现有甲、乙、丙、丁名校友于月日回母校参加活动,设为人中从号门出学校的人数,求的分布列、期望及方差.
附:参考数据:,,,,.
参考公式:回归直线方程,其中,.
相关系数.
第 1 页 共 5 页
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$