内容正文:
专题05 成对数据的统计相关性
题型概览
题型01成对数据的统计分析
题型02一元线性回归模型及其应用
题型03列联表与独立性检验
(
题型01
)成对数据的统计分析
1.(23-24高二下·吉林长春·期末)将保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中15个区域进行编号,统计抽取到的每个区域的某种水源指标和区域内该植物分布的数量,得到数组.已知,.
(1)求样本的样本相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数),研究人员统计大量数据后发现,对于任意的,寿命为的样本在寿命超过k的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均为0.1,这种现象被称为“几何分布的无记忆性”.用含k的式子表示,并求的值.
附:样本相关系数;当k足够大时,.
2.(23-24高二下·湖北·期末)某乡村企业希望通过技术革新增加产品收益,根据市场调研,技术革新投入经费(单位:万元)和增加收益(单位:万元)的数据如下表:
4
6
8
10
12
27
42
55
56
60
为了进一步了解技术革新投入经费对增加收益的影响,通过对表中数据进行分析,分别提出了两个回归模型:①,②.
(1)根据以上数据,计算模型①中与的相关系数(结果精确到0.01);
(2)若,则选择模型①;否则选择模型②.根据(1)的结果,试建立增加收益关于技术革新投入经费的回归模型,并预测时的值(结果精确到0.01).
附:i)回归直线的斜率、截距的最小二乘估计以及相关系数分别为:,,
ii)参考数据:设,,,,,.
3.(23-24高二下·黑龙江哈尔滨·期末)某校高一新生共1000人,男女比例为1:1,经统计身高大于170cm的学生共600人,其中女生200人.该校为了解高一新生身高和体重的关系,在新生中随机抽测了10人的身高(单位:cm)和体重(单位:kg)作为一个样本,所得样本数据如下表所示:
编号
1
2
3
4
5
6
7
8
9
10
身高
164
165
170
172
173
174
176
177
179
180
体重
57
58
65
65
90
70
75
76
80
84
(1)在对这10个学生组成的样本的检测过程中,采用不放回的方式,每次随机抽取1人检测
(ⅰ)若已进行了三次抽取,求抽取的这三人中至少有两人体重大于74kg的概率;
(ⅱ)求第一次抽取的学生体重大于79kg且第二次抽取的学生身高大于175cm的概率;
(2)由表中数据的散点图和残差分析,编号为5的数据残差过大,确定其为离群点,所以应去掉该数据后再求经验回归方程.已知未去掉离群点的样本相关系数约为0.802,请用样本相关系数说明去掉离群点的合理性(相关系数r保留三位小数).
参考公式及数据:样本相关系数
,,,,.
4.(23-24高二下·上海·期末)党的十九大提出实施乡村振兴战略以来,农民收入大幅提升,2022年9月23日某市举办中国农民丰收节庆祝活动,粮食总产量有望连续十年全省第一.据统计该市2017年至2021年农村居民人均可支配收入(单位:万元)与年份代码(见下表)具有线性相关关系,计算得,,.
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
(1)根据上表数据,计算与的相关系数,并判断与是否具有较高的线性相关程度(若,则线性相关程度一般,若,则线性相关程度较高,精确到;
(2)求出关于的线性回归方程.
参考公式:
相关系数,,.
5.(23-24高二下·黑龙江哈尔滨·期末)已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强
C.残差平方和变大 D.样本相关系数r变大
6.(23-24高二下·陕西宝鸡·期末)关于成对数据统计分析的下列结论中,正确的是( )
A.若两个变量与的相关系数,则这两个变量负相关
B.若两个变量与的相关系数越大,则这两个变量的线性相关程度越强
C.若两个变量与的相关系数,则这两个变量不具有相关关系
D.对于两个变量与的经验回归方程,若决定系数越大,则经验回归方程的拟合效果越好
7.(23-24高二下·黑龙江哈尔滨·期末)已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则 .
8.(23-24高二下·贵州·期末)下列说法正确的是( )
A.对于单峰的频率分布直方图,单峰不对称且在右边“拖尾”,则平均数大于中位数
B.在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好
C.以模型去拟合一组数据时,为了求出回归方程,设,求得线性回归方程为,则,的值分别是4和0.3
D.某人在10次答题中,答对题数为,,则答对7题的概率最大.
9.(23-24高二下·广东广州·期末)近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模稳定增长,有关部门整理了2017—2022年中国夜间经济的数据,把市场发展规模记为(单位:万亿元),并把2017—2022年对应的年份代码依次记为,经分析,判断可用函数模型拟合与的关系(为参数).令,计算得,,由最小二乘法得经验回归方程为,则的值为 .为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数 .
(参考公式:决定系数,参考数据:);
10.(23-24高二下·吉林松原·期末)下列结论不正确的是( )
A.两个变量的线性相关系数决定两变量相关程度的强弱,且相关系数越小,相关性越强
B.若两个变量的线性相关系数,则与 之间不具有线性相关性
C.在一组样本数据中,先剔除部分异常数据,再根据最小二乘法求得线性回归方程为,这样相关系数变大
D.在一组样本数据的散点图中,若所有样本点都在直线 上,则这组样本数据的样本相关系数为
(
题型02
)一元线性回归模型及其应用
11.(23-24高二下·广东广州·期末)随机抽取5家超市,得到其广告支出(万元)与销售额(万元)的数据如下:
超市
A
B
C
D
E
广告支出
2
4
5
6
8
销售额
30
40
60
60
70
下列说法正确的是( )(参考公式:;参考数据:)
A.经验回归直线经过点 B.经验回归方程为
C.样本点的残差为 D.预测广告支出10万元时的销售额为80万元
12.(23-24高二下·陕西西安·期末)某中医药企业根据市场调研与模拟,得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
研发投入(亿元)
1
2
3
4
5
产品收益(亿元)
3
7
9
10
11
(1)计算,的相关系数,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般;若,则线性相关程度较高)
(2)求出关于的线性回归方程,并预测若想收益超过20(亿元),则需研发投入至少多少亿元?(结果保留一位小数)
参考公式:回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为,,.
参考数据:,,.
13.(23-24高二下·四川德阳·期末)高温可以使病毒中的蛋白质失去活性,从而达到杀死病毒的效果,某科研团队打算构建病毒的成活率与温度的某种数学模型,通过实验得到部分数据如下表:
温度x(℃)
6
8
10
病毒数量y(万个)
30
22
20
由上表中的数据求得回归方程为,可以预测当温度为14℃时,病毒数量为( )
参考公式:,
A.12 B.10 C.9 D.11
14.(23-24高二下·天津滨海新·期末)在下表的统计量中,有一个数值不清晰,用m表示.
x
1
2
3
4
5
y
6.3
7.4
8.1
8.7
m
已知表中数据的经验回归方程同时满足:①过点;②x每增加一个单位,y增加0.9个单位,则 当;时, .
15.(23-24高二下·黑龙江哈尔滨·期末)如图,由观测数据 的散点图可知, 与的关系可以用模型 拟合,设 ,利用最小二乘法求得 关于的回归方程 . 已知 ,,则 ( )
A. B. C.1 D.
16.(23-24高二下·贵州安顺·期末)经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)之间的关系近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如表:
15
16
18
19
22
102
98
115
120
若由表中样本数据求得线性回归方程为,则实数 .
17.(23-24高二下·河北石家庄·期末)某学院为了加强学生身体素质,特推出“校园轻氧打卡”活动,以下是前9天的打卡人数散点图.
(1)求出每天打卡人数y关于天数x的经验回归方程;
(2)利用经验回归方程试着预测第10天的打卡人数;
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
18.(23-24高二下·新疆乌鲁木齐·期末)白术是常见的大宗药材,最早记载于《神龙本草经》,又叫于术、片术,具有补脾健胃,燥湿利水等功效.今年白术从1月份到5月份每公斤的平均价格(单位:元)的数据如右表:根据上表可得回归方程,则实数的值为( )
月份
1
2
3
4
5
每公斤平均价格
77
109
137
168
199
A.46 B.47 C.48 D.49
19.(23-24高二下·广西玉林·期末)以下关于统计分析的描述,哪一个是正确的?( )
A.样本均值越接近总体均值,样本的代表性越好.
B.样本标准差越大,数据的离散程度越小.
C.相关系数的绝对值越接近1,表示两个变量的线性关系越弱.
D.决定系数R²越接近1,模型的解释能力越强.
20.(23-24高二下·贵州安顺·期末)下列说法正确的是( )
A.某班共有学生50人,现按性别采用分层随机抽样的方法抽取容量为5的样本,若样本中男生有2人,则该班女生共有20人
B.数据,,,,,,,的第80百分位数为8
C.线性回归分析中,样本相关系数的绝对值越大,成对样本数据的线性相关性越强
D.线性回归模型分析中,模型的决定系数越小,模型的拟合效果越好
(
题型0
3
)列联表与独立性检验
21.(23-24高二下·广东中山·期末)某市举行了首届阅读大会,为调查市民对阅读大会的满意度,相关部门随机抽取男女市民各名,每位市民对大会给出满意或不满意的评价,得到下面列联表:
满意
不满意
男市民
女市民
当,时,若在的情况下,我们没有充分的证据推断男、女市民对大会的评价有差异,则的最小值为 .
附:,其中.
22.(23-24高二下·四川德阳·期末)现代科技日新月异,电子产品更是更新换代迅速,某手机开发公司推出一款新手机,为了解某地区消费者对新手机的满意度,从中随机调查了150名消费者,得到如下数据:
满意
不满意
男
60
40
女
40
10
(1)能否有97.5%的把握认为消费者对新手机的满意度与性别有关;
(2)若用频率估计概率,从该地区消费者中随机选取3人,用表示不满意的人数,求的分布列与数学期望.
参考数据:
0.150
0.100
0.050
0.025
2.072
2.706
3.841
5.024
(,其中)
23.(23-24高二下·天津滨海新·期末)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵严重的A城市和交通拥堵不严重的B城市分别随机调查了20名市民,得到了一个市民是否认可的样本,具体数据如下列联表:
A
B
总计
认可
15
8
23
不认可
5
12
17
总计
20
20
40
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
附:.
根据表中的数据,下列说法中,正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
24.(23-24高二下·天津滨海新·期末)下列说法正确的个数是( )
①线性相关系数越接近1,两个变量的线性相关程度越强;
②独立性检验可以100%确定两个变量之间是否具有某种关系;
③在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
④甲、乙两个模型的决定系数分别约为0.88和0.80,则模型甲的拟合效果更好.
A.1 B.2 C.3 D.4
25.(23-24高二下·黑龙江哈尔滨·期末)下列说法正确的是( )
A.回归分析中,线性相关系数的取值范围为
B.回归分析中,残差图中残差比较均匀分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
C.回归分析中,决定系数越大,说明残差平方和越小,拟合效果越好
D.在列联表中,若每个数据均变成原来的2倍,则也变成原来的2倍(,其中)
26.(23-24高二下·黑龙江哈尔滨·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
27.(23-24高二下·广西玉林·期末)某校进行健康体检,发现学生中近视率与性别有关.若将近视率超过50%的班级称为“近视班”,未超过的称为“非近视班”.现从该校随机抽取200人进行分析,得到数据如下所示:
近视班男生:60人,女生:70人.
非近视班男生:40人,女生:30人.
合计男生:100人,女生:100人.
(1)依据小概率值的独立性检验,能否认为“近视班”与性别有关联?
(2)若从随机抽取的非近视班学生中采用分层抽样的方法抽取7人,再从7人中抽取3人,求这3人中至少有2名男生的概率.
附:
下表给出了独立性检验中几个常用的小概率值和相应的临界值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
28.(23-24高二下·黑龙江绥化·期末)为探究药物A对疾病B的治疗效果,将40名患者均分为两组,分别为对照组(未服药)和实验组(服药).测得40名患者血液中的某个指标数据如下(单位:mg):(已按从小到大排好)
对照组:18.3 19.4 20.1 21.4 22.6 23.4 24.4 24.9 25.3 25.9
26.2 26.7 26.8 26.8 26.9 27.3 27.4 27.5 27.6 35.3
实验组:4.4 5.3 5.8 6.9 7.3 8.1 8.4 9.0 10.4 13.2
13.4 16.3 18.2 19.3 23.6 24.1 24.5 24.7 25.2 25.3
(1)求40名患者血液中的某个指标数据的中位数m,并完成下面2×2列联表:
药物A
疾病B
合计
对照组
实验组
合计
(2)依据小概率值α=0.01的独立性检验,能否认为药物A对治疗疾病B有效呢?
附:, .
0.10
0.010
0.001
2.706
6.635
10.828
29.(23-24高二下·河北石家庄·期末)电信诈骗是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程诈骗的犯罪行为.随着5G时代的全面来临,借助手机、网银等实施的非接触式电信诈骗迅速发展蔓延,不法分子甚至将“魔爪”伸向了学生.为了调查同学们对“反诈”知识的了解情况,某校进行了一次抽样调查.若被调查的男女生人数均为,统计得到以下列联表.经过计算,依据小概率值的独立性检验,认为该校学生对“反诈”知识的了解与性别有关,但依据小概率值的独立性检验,认为该校学生对“反诈”知识的了解与性别无关.
性别
不了解
了解
合计
女生
男生
合计
(1)求的值;
(2)为了增强同学们的防范意识,该校举办了主题为“防电信诈骗,做反诈达人”的知识竞赛.已知全校参加本次竞赛的学生分数近似服从正态分布,若某同学成绩满足,则该同学被评为“反诈标兵”;若,则该同学被评为“反诈达人”.
(i)试判断分数为88分的同学能否被评为“反诈标兵”;
(ii)若全校共有50名同学被评为“反诈达人”,试估计参与本次知识竞赛的学生人数.(四舍五入后取整)
附:,其中.
0.10
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
若,则,,
30.(23-24高二下·黑龙江牡丹江·期末)为了解某养殖产品在某段时间内的生长情况,在该批产品中随机抽取了120件样本,测量其增长长度(单位:cm),经统计其增长长度均在区间内,将其按成6组,制成频率分布直方图,如图所示其中增长长度为27cm及以上的产品为优质产品.
(1)已知这120件产品来自两个试验区,部分数据如下列联表:
试验区
试验区
合计
优质产品
20
非优质产品
60
合计
将联表补充完整,并判断是否有的把握认为优质产品与两个试验区有关系,并说明理由;
(2)以样本的频率代表产品的概率,从这批产品中随机抽取4件进行分析研究,计算抽取的这4件产品中含优质产品的件数的分布列和数学期望.
参考公式:,其中.
临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
2 / 5
学科网(北京)股份有限公司
$$
专题05 成对数据的统计相关性
题型概览
题型01成对数据的统计分析
题型02一元线性回归模型及其应用
题型03列联表与独立性检验
(
题型01
)成对数据的统计分析
1.(23-24高二下·吉林长春·期末)将保护区分为面积大小相近的多个区域,用简单随机抽样的方法抽取其中15个区域进行编号,统计抽取到的每个区域的某种水源指标和区域内该植物分布的数量,得到数组.已知,.
(1)求样本的样本相关系数;
(2)假设该植物的寿命为随机变量X(X可取任意正整数),研究人员统计大量数据后发现,对于任意的,寿命为的样本在寿命超过k的样本里的数量占比与寿命为1的样本在全体样本中的数量占比相同,均为0.1,这种现象被称为“几何分布的无记忆性”.用含k的式子表示,并求的值.
附:样本相关系数;当k足够大时,.
【答案】(1)0.8
(2),,
【知识点】由随机变量的分布列求概率、相关系数的计算、写出等比数列的通项公式
【分析】(1)利用相关系公式计算即可;
(2)由题意可得,进而可得,可得,最后再代入即可.
【详解】(1)由,,.
得样本相关系数.
(2)依题意,,
又,
则,
当时,把换成,
则,
两式相减得,
即,
又,
所以对任意都成立,
从而是首项为0.1,公比为0.9的等比数列,
所以,.
2.(23-24高二下·湖北·期末)某乡村企业希望通过技术革新增加产品收益,根据市场调研,技术革新投入经费(单位:万元)和增加收益(单位:万元)的数据如下表:
4
6
8
10
12
27
42
55
56
60
为了进一步了解技术革新投入经费对增加收益的影响,通过对表中数据进行分析,分别提出了两个回归模型:①,②.
(1)根据以上数据,计算模型①中与的相关系数(结果精确到0.01);
(2)若,则选择模型①;否则选择模型②.根据(1)的结果,试建立增加收益关于技术革新投入经费的回归模型,并预测时的值(结果精确到0.01).
附:i)回归直线的斜率、截距的最小二乘估计以及相关系数分别为:,,
ii)参考数据:设,,,,,.
【答案】(1)
(2),约为万元
【知识点】求回归直线方程、非线性回归、相关系数的计算、根据回归方程进行数据估计
【分析】(1)根据所给数据求出,,,,,即可求出相关系数;
(2)根据(1)的结论,可判断选择模型②,令,求出关于的线性回归方程,即可求出关于的经验方程,再代入计算可得.
【详解】(1)因为,
,
所以,
,
,
模型①中,相关系数,
(2)因为,所以选择模型②,
令,先建立关于的线性回归方程,
由于,
,
所以关于的线性回归方程为,
即,
当时,(万元),
所以若投入经费万元,收益约为万元.
3.(23-24高二下·黑龙江哈尔滨·期末)某校高一新生共1000人,男女比例为1:1,经统计身高大于170cm的学生共600人,其中女生200人.该校为了解高一新生身高和体重的关系,在新生中随机抽测了10人的身高(单位:cm)和体重(单位:kg)作为一个样本,所得样本数据如下表所示:
编号
1
2
3
4
5
6
7
8
9
10
身高
164
165
170
172
173
174
176
177
179
180
体重
57
58
65
65
90
70
75
76
80
84
(1)在对这10个学生组成的样本的检测过程中,采用不放回的方式,每次随机抽取1人检测
(ⅰ)若已进行了三次抽取,求抽取的这三人中至少有两人体重大于74kg的概率;
(ⅱ)求第一次抽取的学生体重大于79kg且第二次抽取的学生身高大于175cm的概率;
(2)由表中数据的散点图和残差分析,编号为5的数据残差过大,确定其为离群点,所以应去掉该数据后再求经验回归方程.已知未去掉离群点的样本相关系数约为0.802,请用样本相关系数说明去掉离群点的合理性(相关系数r保留三位小数).
参考公式及数据:样本相关系数
,,,,.
【答案】(1)(ⅰ);(ⅱ)
(2)答案见解析
【知识点】相关系数的计算、独立事件的乘法公式、求超几何分布的概率
【分析】(1)(ⅰ)由超几何分布的概率公式计算得出;(ⅱ)记第一次抽取的学生体重大于79kg为事件A,第二次抽取的学生身高大于175cm为事件B,由乘法公式计算得出;
(2)根据题设公式计算去掉离群点后的样本相关系数,由相比更接近1得出去掉离群点的合理性.
【详解】(1)(ⅰ)记抽取的这三人中至少有两人体重大于74kg为事件M,则,得.
(ⅱ)记第一次抽取的学生体重大于79kg为事件A,第二次抽取的学生身高大于175cm为事件B.
因为样本中学生身高大于175cm的有4人,身高大于175cm且体重大于79kg的有2人,
身高小于175cm且体重大于79kg的有1人,
所以.
(2)设未去离群点的样本相关系数为,去掉离群点后的样本相关系数为,则.
去掉离群点后,,,
,,
,
由
得
因为,且相比更接近1,所以y与x的线性相关性更强,所以去掉离群点是合理的.
4.(23-24高二下·上海·期末)党的十九大提出实施乡村振兴战略以来,农民收入大幅提升,2022年9月23日某市举办中国农民丰收节庆祝活动,粮食总产量有望连续十年全省第一.据统计该市2017年至2021年农村居民人均可支配收入(单位:万元)与年份代码(见下表)具有线性相关关系,计算得,,.
年份
2017
2018
2019
2020
2021
年份代码
1
2
3
4
5
(1)根据上表数据,计算与的相关系数,并判断与是否具有较高的线性相关程度(若,则线性相关程度一般,若,则线性相关程度较高,精确到;
(2)求出关于的线性回归方程.
参考公式:
相关系数,,.
【答案】(1),与具有较高的线性相关程度
(2)
【知识点】求回归直线方程、相关系数的计算
【分析】(1)根据题意求得,利用相关系数公式求得相关系数,比较可得结论;
(2)利用回归方程的系数公式求得,继而求得,即可求得与的回归方程.
【详解】(1)由表数据可得的平均数,
所以,
所以相关系数,
由,所以与具有较高的线性相关程度;
(2)依题意可得,
,
,
所以,
所以关于的线性回归方程为.
5.(23-24高二下·黑龙江哈尔滨·期末)已知5个成对数据的散点图如下,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强
C.残差平方和变大 D.样本相关系数r变大
【答案】B
【知识点】相关指数的计算及分析、相关系数的意义及辨析、判断正、负相关
【分析】根据已知条件,结合变量间的相关关系,结合图象分析判断即可.
【详解】由散点图可知,去掉点后,与的线性相关加强,且为负相关,
所以B正确,A错误;
由于与的线性相关加强,所以残差平方和变小,所以C错误,
由于与的线性相关加强,且为负相关,所以相关系数的绝对值变大,
而相关系数为负的,所以样本相关系数r变小,所以D错误.
故选:B.
6.(23-24高二下·陕西宝鸡·期末)关于成对数据统计分析的下列结论中,正确的是( )
A.若两个变量与的相关系数,则这两个变量负相关
B.若两个变量与的相关系数越大,则这两个变量的线性相关程度越强
C.若两个变量与的相关系数,则这两个变量不具有相关关系
D.对于两个变量与的经验回归方程,若决定系数越大,则经验回归方程的拟合效果越好
【答案】AD
【知识点】相关系数的意义及辨析
【分析】根据相关系数的意义判断ABC三个选项,根据决定系数的意义判断D选项.
【详解】由相关系数的意义知“若两个变量与的相关系数,则这两个变量负相关”A正确;
“两个变量与的相关系数的绝对值越大,则这两个变量的线性相关程度越强”,B错误;
两个变量与的相关系数只能说明两个变量没有线性相关关系,不能排除它们之间有其他相关关系,C错误;
由决定系数的意义知“对于两个变量与的经验回归方程,若决定系数越大,则经验回归方程的拟合效果越好”,D正确;
故选:AD.
7.(23-24高二下·黑龙江哈尔滨·期末)已知一系列样本点的一个经验回归方程为,若样本点的残差为1,则 .
【答案】
【知识点】残差的计算
【分析】根据残差计算公式计算即可.
【详解】根据题意得,解得.
故答案为:.
8.(23-24高二下·贵州·期末)下列说法正确的是( )
A.对于单峰的频率分布直方图,单峰不对称且在右边“拖尾”,则平均数大于中位数
B.在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好
C.以模型去拟合一组数据时,为了求出回归方程,设,求得线性回归方程为,则,的值分别是4和0.3
D.某人在10次答题中,答对题数为,,则答对7题的概率最大.
【答案】ABD
【知识点】非线性回归、残差的计算、服从二项分布的随机变量概率最大问题
【分析】根据频率分布直方图的特征判断样本的分布特征,即可判断A,根据残差的意义,即可判断B,根据转化关系,即可判断C,比较概率,列出不等式,即可判断D.
【详解】A. 对于单峰的频率分布直方图,单峰不对称且在右边“拖尾”,则平均数大于中位数,故A正确;
B. 在做回归分析时,残差图中残差点分布的带状区域的宽度越窄表示回归效果越好,故B正确;,
C.由,设,则,即,
所以,,即,故C错误;
D.由题意可知,,
设答对道题的概率最大,所以
,解得:,
得,所以答对7题的概率最大,故D正确.
故选:ABD
9.(23-24高二下·广东广州·期末)近年来中国各地政府对夜间经济的扶持力度加大,夜间经济的市场发展规模稳定增长,有关部门整理了2017—2022年中国夜间经济的数据,把市场发展规模记为(单位:万亿元),并把2017—2022年对应的年份代码依次记为,经分析,判断可用函数模型拟合与的关系(为参数).令,计算得,,由最小二乘法得经验回归方程为,则的值为 .为判断拟合效果,通过经验回归方程求得预测值,若残差平方和,则决定系数 .
(参考公式:决定系数,参考数据:);
【答案】
【知识点】非线性回归、相关指数的计算及分析
【分析】将两边同时取对数可得,结合所给经验回归方程求出,由所给参考数据求出,即可求出决定系数.
【详解】由,将两边同时取对数可得,
令,由最小二乘法得经验回归方程为,
所以,
又
,
所以.
故答案为:;.
10.(23-24高二下·吉林松原·期末)下列结论不正确的是( )
A.两个变量的线性相关系数决定两变量相关程度的强弱,且相关系数越小,相关性越强
B.若两个变量的线性相关系数,则与 之间不具有线性相关性
C.在一组样本数据中,先剔除部分异常数据,再根据最小二乘法求得线性回归方程为,这样相关系数变大
D.在一组样本数据的散点图中,若所有样本点都在直线 上,则这组样本数据的样本相关系数为
【答案】ACD
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】根据相关系数的概念和性质逐项分析判断.
【详解】对于选项A:越大,与之间的线性相关性越强,所以A错误;
对于选项B:若,则样本数据不具有线性相关性,所以B正确;
对于选项C:去掉异常数据,则相关性变强,变大,所以C错误;
对于选项D:若所有样本点都在直线上,
则这组样本数据完全相关,且正相关,
所以这组样本数据的样本相关系数为1,所以D错误.
故选:ACD.
(
题型02
)列联表与独立性检验
11.(23-24高二下·广东广州·期末)随机抽取5家超市,得到其广告支出(万元)与销售额(万元)的数据如下:
超市
A
B
C
D
E
广告支出
2
4
5
6
8
销售额
30
40
60
60
70
下列说法正确的是( )(参考公式:;参考数据:)
A.经验回归直线经过点 B.经验回归方程为
C.样本点的残差为 D.预测广告支出10万元时的销售额为80万元
【答案】BC
【知识点】根据回归方程进行数据估计、残差的计算、求回归直线方程
【分析】A选项,计算出样本中心点,得到A错误;B选项,计算出,得到经验回归方程;C选项,代入,求出,得到残差;D选项,代入,计算出,D错误.
【详解】A选项,,,
故经验回归直线经过点,A错误;
B选项,,
,故经验回归方程为,B正确;
C选项,将代入中得,
故样本点的残差为,C正确;
D选项,将代入中得,
预测广告支出10万元时的销售额为87万元,D错误.
故选:BC
12.(23-24高二下·陕西西安·期末)某中医药企业根据市场调研与模拟,得到研发投入(亿元)与产品收益(亿元)的数据统计如下:
研发投入(亿元)
1
2
3
4
5
产品收益(亿元)
3
7
9
10
11
(1)计算,的相关系数,并判断是否可以认为研发投入与产品收益具有较高的线性相关程度?(若,则线性相关程度一般;若,则线性相关程度较高)
(2)求出关于的线性回归方程,并预测若想收益超过20(亿元),则需研发投入至少多少亿元?(结果保留一位小数)
参考公式:回归直线的斜率和截距的最小二乘法估计公式,相关系数的公式分别为,,.
参考数据:,,.
【答案】(1),相关程度较高
(2),9.3亿元
【知识点】相关系数的计算、求回归直线方程、用回归直线方程对总体进行估计
【分析】(1)通过计算相关系数来进行判断.
(2)先计算回归直线方程,并由此作出预测.
【详解】(1)由表中数据可知,,,
,,,
则,
故相关程度较高;
(2),,
则,,
故,
令,解得,
故研发投入至少9.3亿元.
13.(23-24高二下·四川德阳·期末)高温可以使病毒中的蛋白质失去活性,从而达到杀死病毒的效果,某科研团队打算构建病毒的成活率与温度的某种数学模型,通过实验得到部分数据如下表:
温度x(℃)
6
8
10
病毒数量y(万个)
30
22
20
由上表中的数据求得回归方程为,可以预测当温度为14℃时,病毒数量为( )
参考公式:,
A.12 B.10 C.9 D.11
【答案】C
【知识点】根据回归方程进行数据估计、求回归直线方程、用回归直线方程对总体进行估计、计算几个数的平均数
【分析】设回归方程,利用表中数据,根据最小二乘原理求得系数,即得方程,再用方程代入温度预测病毒数量即可.
【详解】y关于x的线性回归方程为,直线过样本中心点
由表格数据得,,
,
,
故根据最小二乘原理知,
所以,
即线性回归方程为;
将代入方程,得,
即可预测病毒数量为.
故选:C
14.(23-24高二下·天津滨海新·期末)在下表的统计量中,有一个数值不清晰,用m表示.
x
1
2
3
4
5
y
6.3
7.4
8.1
8.7
m
已知表中数据的经验回归方程同时满足:①过点;②x每增加一个单位,y增加0.9个单位,则 当;时, .
【答案】
【知识点】求回归直线方程、根据回归方程进行数据估计、根据样本中心点求参数
【分析】由经验回归方程恒过样本点的中心求解,进而求得经验回归方程,即可求解时的值.
【详解】,,
因为经验回归方程过点,
所以,解得,
由,可得,则,
当时,,
故答案为:,.
15.(23-24高二下·黑龙江哈尔滨·期末)如图,由观测数据 的散点图可知, 与的关系可以用模型 拟合,设 ,利用最小二乘法求得 关于的回归方程 . 已知 ,,则 ( )
A. B. C.1 D.
【答案】D
【知识点】计算样本的中心点、根据样本中心点求参数
【分析】利用已知数据可求得样本中心点,再利用回归方程必过样本中心点,即可求出.
【详解】由可得: ,
由可得:,
由回归方程 必过样本中心点,即过点,
所以,解得.
故选:D.
16.(23-24高二下·贵州安顺·期末)经统计,用于数学学习的时间(单位:小时)与成绩(单位:分)之间的关系近似于线性相关关系.对某小组学生每周用于数学的学习时间与数学成绩进行数据收集如表:
15
16
18
19
22
102
98
115
120
若由表中样本数据求得线性回归方程为,则实数 .
【答案】115
【知识点】根据样本中心点求参数、计算样本的中心点
【分析】根据已知条件,利用回归直线必过样本的中心点,列式求解.
【详解】依题意,,,
而线性回归方程为,则,
所以.
故答案为:115
17.(23-24高二下·河北石家庄·期末)某学院为了加强学生身体素质,特推出“校园轻氧打卡”活动,以下是前9天的打卡人数散点图.
(1)求出每天打卡人数y关于天数x的经验回归方程;
(2)利用经验回归方程试着预测第10天的打卡人数;
附:对于一组数据,其回归直线的斜率和截距的最小二乘估计分别为.
【答案】(1)
(2)340
【知识点】根据回归方程进行数据估计、求回归直线方程
【分析】(1)依据题中所给数据先依次求出、、、,再结合最小二乘法即可求出和,进而得解.
(2)将代入(1)所得经验回归方程即可得解.
【详解】(1)由题得,,
,
,
所以,
每天打卡人数y关于天数x的经验回归方程为.
(2)由(1)当时,,
所以第10天的打卡人数预测为人.
18.(23-24高二下·新疆乌鲁木齐·期末)白术是常见的大宗药材,最早记载于《神龙本草经》,又叫于术、片术,具有补脾健胃,燥湿利水等功效.今年白术从1月份到5月份每公斤的平均价格(单位:元)的数据如右表:根据上表可得回归方程,则实数的值为( )
月份
1
2
3
4
5
每公斤平均价格
77
109
137
168
199
A.46 B.47 C.48 D.49
【答案】C
【知识点】根据样本中心点求参数
【分析】求出,,根据回归直线方程必过样本中心点计算可得.
【详解】依题意,,
又回归直线方程必过样本中心点,
所以,解得.
故选:C
19.(23-24高二下·广西玉林·期末)以下关于统计分析的描述,哪一个是正确的?( )
A.样本均值越接近总体均值,样本的代表性越好.
B.样本标准差越大,数据的离散程度越小.
C.相关系数的绝对值越接近1,表示两个变量的线性关系越弱.
D.决定系数R²越接近1,模型的解释能力越强.
【答案】D
【知识点】相关指数的计算及分析、相关系数的意义及辨析、用方差、标准差说明数据的波动程度、计算几个数的平均数
【分析】根据均值、标准差、相关系数、决定系数的含义即可判断.
【详解】对于A,样本均值不能完全说明样本的代表性,A错;
对于B,样本标准差越大,数据的离散程度越大,B错;
对于C,相关系数的绝对值越接近1,表示两个变量的线性关系越强, C错;
对于D,决定系数R²越接近1,模型的解释能力越强,D对.
故选:D
20.(23-24高二下·贵州安顺·期末)下列说法正确的是( )
A.某班共有学生50人,现按性别采用分层随机抽样的方法抽取容量为5的样本,若样本中男生有2人,则该班女生共有20人
B.数据,,,,,,,的第80百分位数为8
C.线性回归分析中,样本相关系数的绝对值越大,成对样本数据的线性相关性越强
D.线性回归模型分析中,模型的决定系数越小,模型的拟合效果越好
【答案】C
【知识点】抽样比、样本总量、各层总数、总体容量的计算、相关系数的意义及辨析、相关指数的计算及分析、总体百分位数的估计
【分析】结合分层抽样的定义,百分位数的定义,相关系数、决定系数的定义,即可求解.
【详解】对于A,按性别采用分层随机抽样的方法抽取容量为5的样本,若样本中男生有2人,
则样本中女生有3人,该班女生共有人,A错误;
对于B,数据2,3,3,5,7,8,10,12,共8个,,则该组数据的第80百分位数为10,B错误;
对于C,线性回归分析中,样本相关系数r的绝对值越大,成对样本数据的线性相关性越强,C正确;
对于D,线性回归模型分析中,模型的决定系数越小,模型的拟合效果越差,D错误.
故选:C
(
题型03
)离散型随机变量的数字特征
21.(23-24高二下·广东中山·期末)某市举行了首届阅读大会,为调查市民对阅读大会的满意度,相关部门随机抽取男女市民各名,每位市民对大会给出满意或不满意的评价,得到下面列联表:
满意
不满意
男市民
女市民
当,时,若在的情况下,我们没有充分的证据推断男、女市民对大会的评价有差异,则的最小值为 .
附:,其中.
【答案】
【知识点】独立性检验解决实际问题
【分析】根据定义算出的表达式,由题意得,结合可得出的最小值.
【详解】由题意得,
并令,即,
近似解得,即,注意到,
故的最小值为.
故答案为:.
22.(23-24高二下·四川德阳·期末)现代科技日新月异,电子产品更是更新换代迅速,某手机开发公司推出一款新手机,为了解某地区消费者对新手机的满意度,从中随机调查了150名消费者,得到如下数据:
满意
不满意
男
60
40
女
40
10
(1)能否有97.5%的把握认为消费者对新手机的满意度与性别有关;
(2)若用频率估计概率,从该地区消费者中随机选取3人,用表示不满意的人数,求的分布列与数学期望.
参考数据:
0.150
0.100
0.050
0.025
2.072
2.706
3.841
5.024
(,其中)
【答案】(1)有
(2)分布列见解析,
【知识点】卡方的计算、独立性检验解决实际问题、写出简单离散型随机变量分布列、求离散型随机变量的均值
【分析】(1)先利用公式求出,利用临界值表进行判定;
(2)先求出不满意的概率为,由二项分布求解概率,列表得到分布列,利用期望公式进行求解
【详解】(1)
所以有97.5%的把握认为消费者对新手机的满意度与性别有关.
(2)由表中数据可知,被调查者中“不满意”的频率为.
所以,,,
,,
其分布列为
0
1
2
3
所以.
23.(23-24高二下·天津滨海新·期末)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵严重的A城市和交通拥堵不严重的B城市分别随机调查了20名市民,得到了一个市民是否认可的样本,具体数据如下列联表:
A
B
总计
认可
15
8
23
不认可
5
12
17
总计
20
20
40
0.10
0.05
0.025
0.01
0.005
2.706
3.841
5.024
6.635
7.879
附:.
根据表中的数据,下列说法中,正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
【答案】C
【知识点】独立性检验解决实际问题、卡方的计算
【分析】先计算出卡方值,再分别与各选项中的相应的小概率值比较,根据独立性检验的原理,即可作出判断
【详解】由
对于A,因,故有95%以上的把握认为“是否认可与城市的拥堵情况有关”,即A错误;
对于B,因,故没有97.5%以上的把握认为“是否认可与城市的拥堵情况有关”,即B错误;
对于C,因,故可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”,即C正确;
对于D,因,故在犯错误的概率不超过0.01的前提下不能认为“是否认可与城市的拥堵情况有关”,即D错误.
故选:C.
24.(23-24高二下·天津滨海新·期末)下列说法正确的个数是( )
①线性相关系数越接近1,两个变量的线性相关程度越强;
②独立性检验可以100%确定两个变量之间是否具有某种关系;
③在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
④甲、乙两个模型的决定系数分别约为0.88和0.80,则模型甲的拟合效果更好.
A.1 B.2 C.3 D.4
【答案】C
【知识点】独立性检验的概念及辨析、相关指数的计算及分析、残差的计算、相关系数的意义及辨析
【分析】根据线性相关系数,独立性检验,残差图及决定系数的概念分别判断即可.
【详解】线性相关系数越接近1,两个变量的线性相关程度越强,故①正确;
独立性检验并不能100%确定两个变量之间是否具有某种关系,故②错误;
回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高,故③正确;
回归分析中,可用判断模型的拟合效果,越大,模型的拟合效果越好,故④正确;
故选:C.
25.(23-24高二下·黑龙江哈尔滨·期末)下列说法正确的是( )
A.回归分析中,线性相关系数的取值范围为
B.回归分析中,残差图中残差比较均匀分布在以取值为0的横轴为对称轴的水平带状区域内,且宽度越窄表示拟合效果越好
C.回归分析中,决定系数越大,说明残差平方和越小,拟合效果越好
D.在列联表中,若每个数据均变成原来的2倍,则也变成原来的2倍(,其中)
【答案】BCD
【知识点】相关系数的意义及辨析、相关指数的计算及分析、卡方的计算
【分析】利用回归分析的相关定义和独立性检验公式对各个选项逐一分析判断即可得到结果.
【详解】选项A,回归分析中,线性相关系数的取值范围为,故选项A错误;
选项B,因为在残差的散点图中,残差分布的水平带状区域的宽度越窄,表明数据越集中,
模型的拟合效果越好,故选项B正确;
选项C,因为决定系数越大,表示残差平方和越小,数据就越集中,
即模型的拟合效果越好,故选项C正确;
选项D,在列联表中,若每个数据均变成原来的2倍,则
,因此也变成原来的2倍,故选项D正确;
故选:BCD.
26.(23-24高二下·黑龙江哈尔滨·期末)某学校在一次调查“篮球迷”的活动中,获得了如下数据,以下结论正确的是( )
男生
女生
篮球迷
30
15
非篮球迷
45
10
附:,
0.10
0.05
0.01
2.706
3.841
6.635
A.有的把握认为是否是篮球迷与性别有关
B.有的把握认为是否是篮球迷与性别有关
C.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
D.在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关
【答案】B
【知识点】独立性检验解决实际问题、卡方的计算、完善列联表
【分析】根据所给数据完善列联表,计算出卡方,即可判断.
【详解】依题意可得列联表如下:
男生
女生
合计
篮球迷
30
15
45
非篮球迷
45
10
55
合计
75
25
100
所以,
所以在犯错误的概率不超过的前提下,可以认为是否是篮球迷与性别有关,
即有的把握认为是否是篮球迷与性别有关,
又,所以没有的把握认为是否是篮球迷与性别有关.
故选:B.
27.(23-24高二下·广西玉林·期末)某校进行健康体检,发现学生中近视率与性别有关.若将近视率超过50%的班级称为“近视班”,未超过的称为“非近视班”.现从该校随机抽取200人进行分析,得到数据如下所示:
近视班男生:60人,女生:70人.
非近视班男生:40人,女生:30人.
合计男生:100人,女生:100人.
(1)依据小概率值的独立性检验,能否认为“近视班”与性别有关联?
(2)若从随机抽取的非近视班学生中采用分层抽样的方法抽取7人,再从7人中抽取3人,求这3人中至少有2名男生的概率.
附:
下表给出了独立性检验中几个常用的小概率值和相应的临界值.
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
【答案】(1)不能
(2)
【知识点】求超几何分布的概率、组合数的计算、独立性检验解决实际问题、卡方的计算
【分析】(1)根据所给数据计算出后与比较即可得;
(2)由分层抽样的性质可得抽取的人中男女生人数,再结合组合数计算这3人中至少有2名男生的概率即可得.
【详解】(1)所给数据可得列联表如下:
性别
是否“近视班”
合计
是
否
男性
60
40
100
女性
70
30
100
合计
130
70
200
设零假设:“近视班”与性别无关,
则,
依据小概率值的独立性检验,可推断成立,
故不能认为“近视班”与性别有关联;
(2),,故将抽取男生人,女生人,
再从中抽取3人,则至少有2名男生的概率.
28.(23-24高二下·黑龙江绥化·期末)为探究药物A对疾病B的治疗效果,将40名患者均分为两组,分别为对照组(未服药)和实验组(服药).测得40名患者血液中的某个指标数据如下(单位:mg):(已按从小到大排好)
对照组:18.3 19.4 20.1 21.4 22.6 23.4 24.4 24.9 25.3 25.9
26.2 26.7 26.8 26.8 26.9 27.3 27.4 27.5 27.6 35.3
实验组:4.4 5.3 5.8 6.9 7.3 8.1 8.4 9.0 10.4 13.2
13.4 16.3 18.2 19.3 23.6 24.1 24.5 24.7 25.2 25.3
(1)求40名患者血液中的某个指标数据的中位数m,并完成下面2×2列联表:
药物A
疾病B
合计
对照组
实验组
合计
(2)依据小概率值α=0.01的独立性检验,能否认为药物A对治疗疾病B有效呢?
附:, .
0.10
0.010
0.001
2.706
6.635
10.828
【答案】(1),填表见解析
(2)不能
【知识点】独立性检验解决实际问题、完善列联表、计算几个数的中位数
【分析】(1)将两组数据合在一起,从小到大排序后的第20位与第21位数据的平均数,可得第20位数据;根据已知数据可完成列联表;
(2)零假设:药物A对治疗疾病B无效,求出与临界值比较可得答案.
【详解】(1)依题意,这40个数据的中位数是将两组数据合在一起,从小到大排序,
4.4,5.3,5.8,6.9,7.3,8.1,8.4,9.0,10.4,13.2,13.4,
16.3,18.2,18.3,19.3,19.4,20.1,21.4,22.6,23.4,23.6,
24.1,24.4,24.5,24.7,24.9,25.2,25.3,25.3,25.9,26.2,
26.7,26.8,26.8,26.9,27.3,27.4,27.5,27.6,35.3,
可得第20位数据为:23.4,第21位数据为:23.6,
所以.
故列联表为:
药物A
疾病B
合计
对照组
6
14
20
实验组
14
6
20
合计
20
20
40
(2)零假设:药物A对治疗疾病B无效,即药物A与治疗疾病B相互独立.
由题意:.
所以依据小概率值的独立性检验,我们没有充分证据推断不成立,
故可认为药物A对治疗疾病B无效.
29.(23-24高二下·河北石家庄·期末)电信诈骗是指通过电话、网络和短信方式,编造虚假信息,设置骗局,对受害人实施远程诈骗的犯罪行为.随着5G时代的全面来临,借助手机、网银等实施的非接触式电信诈骗迅速发展蔓延,不法分子甚至将“魔爪”伸向了学生.为了调查同学们对“反诈”知识的了解情况,某校进行了一次抽样调查.若被调查的男女生人数均为,统计得到以下列联表.经过计算,依据小概率值的独立性检验,认为该校学生对“反诈”知识的了解与性别有关,但依据小概率值的独立性检验,认为该校学生对“反诈”知识的了解与性别无关.
性别
不了解
了解
合计
女生
男生
合计
(1)求的值;
(2)为了增强同学们的防范意识,该校举办了主题为“防电信诈骗,做反诈达人”的知识竞赛.已知全校参加本次竞赛的学生分数近似服从正态分布,若某同学成绩满足,则该同学被评为“反诈标兵”;若,则该同学被评为“反诈达人”.
(i)试判断分数为88分的同学能否被评为“反诈标兵”;
(ii)若全校共有50名同学被评为“反诈达人”,试估计参与本次知识竞赛的学生人数.(四舍五入后取整)
附:,其中.
0.10
0.05
0.025
0.01
0.001
2.706
3.841
5.024
6.635
10.828
若,则,,
【答案】(1)2
(2)(i)能被评为“反诈标兵”;(ii)2198人.
【知识点】完善列联表、卡方的计算、独立性检验解决实际问题、指定区间的概率
【分析】(1)完善列联表,计算卡方值,依题得到不等式,求解即得;
(2)(i)依题意求出,由即可判断;(ii)利用正态曲线的对称性,计算出,即可估计出学生总人数.
【详解】(1)完成列联表:
性别
不了解
了解
合计
女生
男生
合计
则,依题意,,
解得,,因,则;
(2)(i)依题意,,因,故该同学可被评为“反诈标兵”;
(ii)因,
则估计参与本次知识竞赛的学生人数约为人.
30.(23-24高二下·黑龙江牡丹江·期末)为了解某养殖产品在某段时间内的生长情况,在该批产品中随机抽取了120件样本,测量其增长长度(单位:cm),经统计其增长长度均在区间内,将其按成6组,制成频率分布直方图,如图所示其中增长长度为27cm及以上的产品为优质产品.
(1)已知这120件产品来自两个试验区,部分数据如下列联表:
试验区
试验区
合计
优质产品
20
非优质产品
60
合计
将联表补充完整,并判断是否有的把握认为优质产品与两个试验区有关系,并说明理由;
(2)以样本的频率代表产品的概率,从这批产品中随机抽取4件进行分析研究,计算抽取的这4件产品中含优质产品的件数的分布列和数学期望.
参考公式:,其中.
临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
【答案】(1)列联表见解析,没有,理由见解析
(2)分布列见解析,1
【知识点】卡方的计算、独立性检验解决实际问题、利用二项分布求分布列、二项分布的均值
【分析】(1)完成联表,计算再判断相关关系;
(2)应用二项分布求出概率及分布列,再计算数学期望.
【详解】(1)根据频率分布直方图数据,得,
解得.
所以样本中优质产品有,
列联表如下表所示:
试验区
试验区
合计
优质产品
10
20
30
非优质产品
60
30
90
合计
70
50
120
,
没有的把握认为优质产品与两个试验区有关系.
(2)由已知从这批产品中随机抽取一件为优质产品的概率是,随机抽取4件中含有优质产品的件数的可能取值为,且,
,
,
,
的分布列为:
0
1
2
3
4
.
2 / 31
学科网(北京)股份有限公司
$$