内容正文:
湘教版高中数学选择性必修第二册
第4章:统计 单元测试卷
命题人:李文元
(考试时间:120分钟 试卷满分:150分)
班级: 姓名: 成绩:
注意事项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
4.考试范围:湘教版(2019)选择性必修第二册第4章
第一部分(选择题 共58分)
1、 单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的.
1.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
2.某饮料店某5天的日销售收入(单位:百元)与当天平均气温(单位:℃)之间的数据如下表:
0
1
2
5
4
2
2
1
若与之间是线性相关关系,且关于的经验回归方程是,则实数的值是( )
A.3 B.2.8 C.2.6 D.2.4
3.已知变量和变量的一组成对样本数据为,其中,其线性回归方程为,当增加两个样本数据和后,重新得到的回归直线的斜率为3,则在新的线性回归方程下,时,的估计值为( )
A.13 B.12 C.11 D.8
4.某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数是男生人数的,男生喜欢吃水果的人数占被调查的男生人数的,女生喜欢吃水果的人数占被调查的女生人数的,若有的把握认为喜欢吃水果和学生性别有关,则被调查的男生至少有( )(参考数据:)
A.30人 B.24人 C.18人 D.12人
5.根据分类变量x与y的观察数据,计算得到,依据下表给出的独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是( )
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
A.有95%的把握认为变量x与y独立
B.有95%的把握认为变量x与y不独立
C.变量x与y独立,这个结论犯错误的概率不超过10%
D.变量x与y不独立,这个结论犯错误的概率不超过10%
6.某运动制衣品牌为了使成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:),图①为选取的15名志愿者身高与臂展的折线图,图②为身高与臂展所对应的散点图,并求得其回归直线方程为,则下列结论中不正确的为( )
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者身高和臂展成正相关关系
C.可估计身高为的人臂展大约为
D.身高相差的两人臂展都相差
7.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )
肝病
酒性
合计
嗜酒
不嗜酒
患肝病
7775
42
7817
未患肝病
2099
49
2148
合计
9874
91
9965
A. B. C. D.
8.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据如下表:已知该产品的色度y和色差x之间满足线性相关关系,且,现有一组测量数据为,则该数据的残差为( )
色差x
22
24
26
28
色度y
16
19
20
21
A. B. C. D.
二、多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.对两个变量与进行线性相关性和回归效果分析,得到一组样本数据:则下列说法正确的是( )
A.残差平方和越小的模型,拟合的效果越好
B.由样本数据利用最小二乘法得到的经验回归方程表示的直线必过样本点的中心
C.若变量与之间的相关系数,则变量与之间具有很强的线性相关性
D.用决定系数来刻画回归效果,越小,说明模型的拟合效果越好
10.已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( )
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈现负相关关系 B.
C.可以预测,当时,y约为2.6 D.由表格数据知,该回归直线必过点
11.给出下列命题,其中正确命题为( )
A.随机变量,若,则
B.随机变量X服从正态分布,,则
C.一组数据的线性回归方程为,若,则
D.对于独立性检验,随机变量的观测值越小,判定“两变量有关系”犯错误的概率越大
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分.
12.在研究线性回归模型时,样本数据所对应的点均在直线上,则这组样本数据的样本相关系数为______.
13.某产品在某零售摊位上的零售价(单位:元)与每天的销售量(单位:个)的统计资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程中的,则________,据此模型预计零售价定为15元时,每天的销售量为________.
14.下列说法中正确的是__________.
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程,变量增加1个单位时,平均增加5个单位;
③设具有相关关系的两个变量、的相关系数为,则越接近于0,和之间的线性相关程度越强;
④在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大.
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤.
15.(13分)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某省为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,其中和分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得:,,,,.
(1)求这20个县年垃圾产生总量的平均值;
(2)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合.(当时,与的相关关系较强,否则相关关系较弱.)
参考公式:相关系数.
16.(15分)2025年春节假期,文旅市场火爆.文化和旅游部公布的数据显示:春节假期8天,全国国内出游5.01亿人次,同比增长;国内出游总花费6770.02亿元,同比增长.某景区的某网红饮品小店统计了春节假期前7天的营业额(单位:千元),得到与的数据如表所示:
第天
1
2
3
4
5
6
7
营业额
7
9
11
13
16
18
17
(1)已知与有较强的线性相关关系,求关于的线性回归方程,并预测春节假期第8天的营业额;
(2)如果某天营业额大于10(单位:千元),则该天“达标”,从表格中的7组数据中随机选4组,设表示“达标”的数据组数,求的分布列和数学期望.
参考公式:在线性回归方程中,,.
参考数据:,.
17.(15分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1~6月份每月5日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期
1月5日
2月5日
3月5日
4月5日
5月5日
6月5日
昼夜温差X/℃
10
11
13
12
8
6
就诊人数
23
25
29
26
16
13
该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)若选取的是1月与6月的两组数据,请根据2~5月份的数据,求出关于的线性回归方程;(参考数据:设2~5月份每月5日的昼夜温差的平均数为,就诊人数的平均数为,则,)
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是理想的,问:该小组所得线性回归方程是否理想?
18.(17分)在3+1+2的新高考模式下,某学校计划在高一下学期开设“物理”和“历史”两个选修科目.为了了解学生对这两个科目选课意向,以便提前规划教育资源,教务处从高一年级500名学生(其中男生200人,女生300人)中,采用分层抽样的方法从中抽取部分学生进行调查.其中,女生比男生多抽取20人.
性别
选择科目
合计
选择“物理”
选择“历史”
男生
女生
25
总计
55
附:.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
(1)请问总共抽取了多少名学生进行调查;
(2)新高考模式要求每名学生在“物理”和“历史”这两个科目中必须选择一个科目且只能选择一个科目,下表是根据调查结果得到的一个不完整的列联表,请将下面的列联表补充完整,并判断是否有99.9%的把握认为选择科目与性别有关?
19.(17分)为了了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:
年龄
心肺疾病
合计
患心肺疾病
不患心肺疾病
大于40岁
16
小于等于40岁
12
合计
40
已知在40人中随机抽取1人,抽到不患心肺疾病的市民的概率为.
(1)请将列联表补充完整;
(2)已知在大于40岁且患心肺疾病的市民中,有4名重症患者,专家建议以重症患者住院治疗,现从这16名患者中选出2人,记需住院治疗的人数为,求的分布列和数学期望;
(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?
学科网(北京)股份有限公司
$湘教版高中数学选择性必修第二册
第4章:统计单元测试卷
命题人:李文元
(考试时间:120分钟试卷满分:150分)
班级:
姓名:
成绩:
注意事项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。
如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答
题卡上。写在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
4.考试范围:湘教版(2019)选择性必修第二册第4章
第一部分(选择题共58分)
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只
有一项是符合题目要求的,
1.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()
35
30
包
5101520253035
5101520253035
样本相关系数为1
样本相关系数为2
35
●
50
●
●
●
0
5101520253035
0
5101520253035
样本相关系数为3
样本相关系数为r4
A.5<m<0<5<5
B.<3<0<1<5
C.4<72<0<3<i
D.3<14<0<1<3
【答案】A
【分析】由相关系数的意义结合散点图即可求解
【详解】由图可知5,5都是正线性相关关系,2,:都是负线性相关关系,且,2相关性更强,
所以5>5>0>r4>3.故选:A
2.某饮料店某5天的日销售收入y(单位:百元)与当天平均气温x(单位:℃)之间的
数据如下表:
-2
-1
0
2
5
4
2
1
若x与y之间是线性相关关系,且y关于x的经验回归方程是)=-x+,则实数的值是
()
A.3
B.2.8
C.2.6
D.2.4
【答案】B
【分析】根据表格中的数据,求得样本点的中心是(0,2.8),将其代入回归方程,即可求解
【详解1由统计表格中的数据,可符-2+仁D+0+1+20,,-计4+242128。
所以统计数据的样本点的中心为(0,2.8),因为y关于x的经验回归方程是y=-x+m,
代入可得2.8=0+m,解得m=2.8.故选:B.
3.已知变量X和变量了的一组成对样本数据为(s,y)=1,2,3,8),其中x=
8其线性
日归方程为-2X-子当增加两个样本数据(←15)和(2列后,重新得到的日归直线的斜
率为3,则在新的线性回归方程下,X=4时,Y的估计值为()
A.13
B.12
C.11
D.8
【答案】B
【分析】首先求得新的线性回归方程,再代入X=4,即可估算
【详解】之=}x8=9,增加两个样本点后X的平均数为9-1+2=1:
8
9
1
8
10
:增加两个样本点前=2×?2,:是y=2x8=16,六增加两个样本点后Y的平均数
84
6+5+9-3.设新的线性回归方程为了=3X+a,3=3x1+a,解得à=0,
为
10
∴新的线性回归方程为=3X,则当X=4时,氵=12.故选:B
4.某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数
是男生人数的;,男生喜欢吃水果的人数占被调查的男生人数的二,女生喜欢吃水果的人数
6
占被调查的女生人数的,若有9%的把握认为喜欢吃水果和学生性别有关,则被调查的
男生至少有()(参考数据:P(x2≥6.635)≈0.01)
A.30人
B.24人
C.18人
D.12人
【答案】C
【分析】设被调查的男生人数为x,根据题意可得列联表,由卡方的计算公式以及独立性检
验的原理可得X
3x>6.635,运算求解即可.
(详解】设被调查的男生人数为,则被调查的女生人数为,得到2x2列联表如下
喜欢吃水果情况
学生性别
喜欢
不喜欢
总计
男生
5x
6
6
女生
总计
x-2
3x
3xxx x 5x
2
则x=2663x6
3
>6.635,解得x>17.69,
2
21
又因为男、女生人数均为整数,所以被调查的男生至少有18人.故选:C
5.根据分类变量x与y的观察数据,计算得到K2=2.974,依据下表给出的K2独立性检验
中的小概率值和相应的临界值,作出下列判断,正确的是()
P(K2≥k)
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.有95%的把握认为变量x与y独立
B.有95%的把握认为变量x与y不独立
C.变量x与y独立,这个结论犯错误的概率不超过10%
D.变量x与y不独立,这个结论犯错误的概率不超过10%
【答案】D
【分析】根据已知条件,结合独立性检验的定义即可求解
【详解】因为K2=2.974>2.706,所以变量x与y不独立,这个结论犯错误的概率不超过
10%.故选:D
6.某运动制衣品牌为了使成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量
(单位:cm),图①为选取的15名志愿者身高与臂展的折线图,图②为身高(x)与臂展(y)
所对应的散点图,并求得其回归直线方程为少=1.16x-30.75,则下列结论中不正确的为()
长度/cm
臂展ylcm
185
190
185
180
180
175
175
170
165
170
160
165
150
160
0123456789101112131415
155由身高xcm
身高
-臂展
i60165
170175180185
图①
图②
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者身高和臂展成正相关关系
C.可估计身高为190cm的人臂展大约为189.65cm
D.身高相差10cm的两人臂展都相差11.6cm
【答案】D
【分析】运用极差概念,回归直线与散点图知识,回归直线的意义,逐项判断即可
【详解】对于A,身高极差大约为20,臂展极差大约为25,故A正确:
对于B,很明显根据散点图以及回归直线得到,身高矮一些,臂展就可能短一些,身高高一
些,臂展就可能长一些,故B正确:
对于C,身高为190cm,代入回归直线方程可得到臂展的预测值为189.65cm,但不是准确
值,故C正确:对于D,身高相差10cm的两人臂展的预测值相差11.6cm,但并不是准确值,
回归直线上的点并不都是准确的样本点,故D不正确。
故选:D
7.根据下面的列联表判断患肝病与嗜酒有关系的把握有()
酒性
肝病
合计
嗜酒
不嗜酒
患肝病
7775
42
7817
未患肝病
2099
49
2148
合计
9874
91
9965
A.90%
B.95%
C.99.5%
D.99.9%
【答案】D
【分析】由2×2列联表中的数据,求得X2≈56.6>10.828,即可得到答案
【详解】由2×2列联表中的数据,计算得X2=
9965×(7775×49-2099×42
≈56.610.828,
7817×2148×9874×91
故有99.9%的把握认为患肝病与嗜酒有关系.故选:D.
8.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据如下表:已
知该产品的色度y和色差x之间满足线性相关关系,且y=0.8x+a,现有一组测量数据为
(31,22.4),则该数据的残差为()
色差x
22
24
26
28
色度y
16
19
20
21
A.1.4
B.1.2
C.-1.2
D.-1.4
【答案】D
【分析】根据题意,由回归直线方程过样本中心点,即可得到a=-1,然后代入计算,即可
得到结果
【详解】由愚意可知,元=22+24+26+28-25,y=16+19+20+21=19,
4
4
将(25,19)代入y=0.8x+a,即19=0.8x25+a,解得a=-1,
所以y=0.8x-1,当x=31时,y=0.8×31-1=23.8,
所以该数据的残差为22.4-23.8=-1.4.故选:D.
二、多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项
符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分,
9.对两个变量x与y进行线性相关性和回归效果分析,得到一组样本数据:
(3,y),(2,y2),,(xy),则下列说法正确的是()
A.残差平方和越小的模型,拟合的效果越好
B.由样本数据利用最小二乘法得到的经验回归方程表示的直线必过样本点的中心(x,y)
C.若变量x与y之间的相关系数r=0.80,则变量x与y之间具有很强的线性相关性
D.用决定系数R2来刻画回归效果,越小,说明模型的拟合效果越好
【答案】ABC
【分析】由残差的意义判断A:由回归方程必过样本点的中心,即可判断B:由相关系数
r=0.80>0.75得到变量x与y之间具有很强的线性相关性,可判断C:由R2越大,说明模
型的拟合效果越好,即可判断D
【详解】对两个变量x与y进行线性相关性和回归效果分析,
得到一组样本数据.残差平方和越小的模型,拟合的效果越好,故A正确:
由样本数据利用最小二乘法得到的经验回归方程表示的直线必过样本点的中心(仅,),故B
正确:若变量x与y之间的相关系数r=0.80,则变量x与y之间具有很强的线性相关性,故
C正确:用决定系数R2来刻画回归效果,R越大,说明模型的拟合效果越好,故D错误,
故选:ABC
10.己知变量x,y之间的线性回归方程为y=-0.7x+10.3,且变量x,y之间的一组相关数
据如表所示,则下列说法正确的是()
6
8
10
12
6
A.变量x,y之间呈现负相关关系
B.=4
C.可以预测,当x=11时,y约为2.6D.由表格数据知,该回归直线必过点(9,4)
【答案】ACD
【分析】根据回归直线斜率知A正确:利用回归直线必过样本中心点可构造方程求得,
可知B错误,D正确:将x=11代入回归直线知C正确.
【详解】对于A,由y=0.7x+10.3,得b=-0.7,故x,y呈负相关关系,故A正确:
对于B,x=6+8+10+12-9,=6+m+3+2_m+1业,
4
4
4
:+1业=-0.7×9+10.3,解得m=5,故B错误:
4
对于C,当x=11时,y=-0.7×11+10.3=2.6,故C正确:
对于D,由m=5得y=4,回归直线必过点(:,),即必过点(9,4),故D正确故选:ACD.
11.给出下列命题,其中正确命题为()
A.随机变量5~B(,p),若E()=30,D(5)=20,则n=9
B.随机变量X服从正态分布NQ,o2),P(X>1.5)=0.34,则P(X<0.5)=0.16
C.一组数据(5,y)(i=123,4,5,6)的线性回归方程为y=2x+3,若∑x=30,则
2y=63
D.对于独立性检验,随机变量K的观测值k越小,判定“两变量有关系”犯错误的概率
越大
【答案】AD
【分析】A项,由二项分布的期望与方差公式解方程可得:B项,由正态曲线的对称性可得:
6
C项,先求出x,由样本中心点在回归直线上,代入x,可得,进而求得∑y:D项,根
1=1
据对独立性检验思想的理解可得,
【详解】A项,随机变量5~B(n,P),
n=90
E(5)=迎=30
若E(5)=30,D(5)=20,则
{D()=p0-p)=20,解得D=1,故A项正确:
P-3
B项,由于随机变量X服从正态分布,X~N(,σ),
P(X>1.5)=0.34,P(X<0.5)=P(X>1.5)=0.34,故B项错误:
C项,一组数据(x,y)(i=1,2,3,4,5,6)的线性回归方程为y=2x+3,
因为∑x=30,则。
二=5”由样本中心点(,列在回归直线方程上得,
=1
6
=2×5+3=13;即∑y=6=13×6=78,故C项错误:
j=1
D项,对于独立性检验,随机变量K的观测值k值越小,
判定“两变量有关系”犯错误的概率越大,故D项正确.故选:AD
第二部分(非选择题共92分)
三、填空题:本题共3小题。每小题5分,共15分
12.在研究线性回归模型时,样本数据(x,y)(i=1,2,3,,n)所对应的点均在直线
y=}x+3上,则这组样本数据的样本相关系数r为】
2
【答案】-1
【分析】根据回归模型性质判断即可
【详解】因为样本数据所对应的点都在直线y=之+3上,所以川1,
又样本数据负相关,所以r=-1.故答案为:-1.
13.某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计
资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程=x+à中的6=-6,则a=」
据此模型预计零售价定为
15元时,每天的销售量为
【答案】
146.5
56.5
【分析】根据题意,求得x,y的值,代入回归方程,求得à=146.5,得到回归方程,进而求
得答案
【详解】由表格中的数据,可得x=6+17+18+19)=175少-(50+4+41+3)=41.5,
4
因为回归方程y=bx+à中的b=-6,代入可得a=146.5,
所以经验回归方程为y=-6x+146.5,
当x=15时,y=146.5-15×6=56.5,即每天的销售量约为56.5个.故答案为:146.5;56.5
14.下列说法中正确的是
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变:
②设有一个线性回归方程少=3-5x,变量x增加1个单位时,)平均增加5个单位;
③设具有相关关系的两个变量x、y的相关系数为r,则越接近于0,x和y之间的线性
相关程度越强;
④在一个2×2列联表中,由计算得x的值,则x的值越大,判断两个变量间有关联的把握
就越大。
【答案】①④
【分析】利用方差的性质判断①的正误:利用回归直线的性质判断②,相关系数判断③,独
立检验判断④
【详解】对于①,将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,满足
方差的性质,①正确:
对于②,设有一个线性回归方程少=3-5x,变量x增加1个单位时,少平均减少5个单位:
所以②不正确:
对于③,设具有相关关系的两个变量x,y的相关系数为,则越接近于0,x和y之间的
线性相关程度越弱,所以③不正确:
对于④,在一个2×2列联表中,由计算得x的值,则x的值越大,判断两个变量间有关联
的把握就越大,所以④正确:
故答案为:①④
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤
15.(13分)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,
且具有污染性,所以需要无害化、减量化处理.某省为调查产生的垃圾数量,采用简单随机
抽样的方法抽取20个县城进行了分析,得到样本数据(x,y=1,2,,20),其中x和y,分别
20
表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得:∑x=80,
立-0m,
20
20
20
x-刀2=80,】
0可=800.
(x-x)0y-可=700,
(1)求这20个县年垃圾产生总量的平均值:
(2)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合.(当
0.75r飞1时,y与x的相关关系较强,否则相关关系较弱.)
(x-x)(y.-y)
参考公式:相关系数”
x)∑(y-)
【答案】(1)200
(2)理由见解析
20
【分析】(1)根据∑y直接计算可得;
1=1
(2)根据所给数据计算出相关系数”,即可说明.
1y=20
【详解】(1)依题意这20个县年垃圾产生总量的平均值为20习
1
×4000=200(吨).
700
(2)依题意
-0.875>0.75,
20
V80×80008
(-∑0,-可2
2m1
21
因为y与x的相关系数接近1,所以y与x之间具有较强的线性相关关系,可用线性回归模
型进行拟合
16.(15分)2025年春节假期,文旅市场火爆.文化和旅游部公布的数据显示:春节假期8
天,全国国内出游5.01亿人次,同比增长5.9%;国内出游总花费6770.02亿元,同比增长
7.0%.某景区的某网红饮品小店统计了春节假期前7天的营业额y(单位:千元),得到y
与x的数据如表所示:
第x天
1
2
3
4
5
6
7
营业额
7
9
11
13
16
18
17
(1)已知y与x有较强的线性相关关系,求y关于x的线性回归方程,并预测春节假期第8天
的营业额:
(2)如果某天营业额大于10(单位:千元),则该天“达标”,从表格中的7组数据中随机选4
组,设X表示“达标的数据组数,求X的分布列和数学期望.
∑xy-派刀
参考公式:在线性回归方程)=x+a中,方=
à=-bm.
参考数据:
∑xy=417,∑=140
【答案】)-8x
38144千元
28x+7,
7
(②)分布列见解析,数学期望为20
【分析】(1)先求x,夕,结合题中公式求b,a和回归直线方程,代入x=8即可得预测结果;
(2)由题意可知X的所有可能取值为:2,3,4,结合超几何分别求分布列和期望
湘教版高中数学选择性必修第二册
第4章:统计 单元测试卷
命题人:李文元
(考试时间:120分钟 试卷满分:150分)
班级: 姓名: 成绩:
注意事项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
4.考试范围:湘教版(2019)选择性必修第二册第4章
第一部分(选择题 共58分)
1、 单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只有一项是符合题目要求的.
1.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是( )
A. B.
C. D.
【答案】A
【分析】由相关系数的意义结合散点图即可求解.
【详解】由图可知都是正线性相关关系,都是负线性相关关系,且相关性更强,
所以.故选:A
2.某饮料店某5天的日销售收入(单位:百元)与当天平均气温(单位:℃)之间的数据如下表:
0
1
2
5
4
2
2
1
若与之间是线性相关关系,且关于的经验回归方程是,则实数的值是( )
A.3 B.2.8 C.2.6 D.2.4
【答案】B
【分析】根据表格中的数据,求得样本点的中心是,将其代入回归方程,即可求解.
【详解】由统计表格中的数据,可得,,
所以统计数据的样本点的中心为,因为关于的经验回归方程是,
代入可得,解得.故选:B.
3.已知变量和变量的一组成对样本数据为,其中,其线性回归方程为,当增加两个样本数据和后,重新得到的回归直线的斜率为3,则在新的线性回归方程下,时,的估计值为( )
A.13 B.12 C.11 D.8
【答案】B
【分析】首先求得新的线性回归方程,再代入,即可估算.
【详解】,增加两个样本点后的平均数为;
增加两个样本点前,,增加两个样本点后的平均数为.设新的线性回归方程为,,解得,
新的线性回归方程为,则当时,.故选:B.
4.某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数是男生人数的,男生喜欢吃水果的人数占被调查的男生人数的,女生喜欢吃水果的人数占被调查的女生人数的,若有的把握认为喜欢吃水果和学生性别有关,则被调查的男生至少有( )(参考数据:)
A.30人 B.24人 C.18人 D.12人
【答案】C
【分析】设被调查的男生人数为,根据题意可得列联表,由卡方的计算公式以及独立性检验的原理可得,运算求解即可.
【详解】设被调查的男生人数为,则被调查的女生人数为,得到列联表如下:
学生性别
喜欢吃水果情况
喜欢
不喜欢
总计
男生
女生
总计
则,解得,
又因为男、女生人数均为整数,所以被调查的男生至少有18人.故选:C
5.根据分类变量x与y的观察数据,计算得到,依据下表给出的独立性检验中的小概率值和相应的临界值,作出下列判断,正确的是( )
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
A.有95%的把握认为变量x与y独立
B.有95%的把握认为变量x与y不独立
C.变量x与y独立,这个结论犯错误的概率不超过10%
D.变量x与y不独立,这个结论犯错误的概率不超过10%
【答案】D
【分析】根据已知条件,结合独立性检验的定义即可求解.
【详解】因为,所以变量x与y不独立,这个结论犯错误的概率不超过10%.故选:D.
6.某运动制衣品牌为了使成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:),图①为选取的15名志愿者身高与臂展的折线图,图②为身高与臂展所对应的散点图,并求得其回归直线方程为,则下列结论中不正确的为( )
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者身高和臂展成正相关关系
C.可估计身高为的人臂展大约为
D.身高相差的两人臂展都相差
【答案】D
【分析】运用极差概念,回归直线与散点图知识,回归直线的意义,逐项判断即可.
【详解】对于A,身高极差大约为20,臂展极差大约为25,故A正确;
对于B,很明显根据散点图以及回归直线得到,身高矮一些,臂展就可能短一些,身高高一些,臂展就可能长一些,故B正确;
对于C,身高为,代入回归直线方程可得到臂展的预测值为,但不是准确值,故C正确;对于D,身高相差的两人臂展的预测值相差,但并不是准确值,回归直线上的点并不都是准确的样本点,故D不正确.
故选:D.
7.根据下面的列联表判断患肝病与嗜酒有关系的把握有( )
肝病
酒性
合计
嗜酒
不嗜酒
患肝病
7775
42
7817
未患肝病
2099
49
2148
合计
9874
91
9965
A. B. C. D.
【答案】D
【分析】由列联表中的数据,求得,即可得到答案.
【详解】由列联表中的数据,计算得,
故有的把握认为患肝病与嗜酒有关系.故选:D.
8.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据如下表:已知该产品的色度y和色差x之间满足线性相关关系,且,现有一组测量数据为,则该数据的残差为( )
色差x
22
24
26
28
色度y
16
19
20
21
A. B. C. D.
【答案】D
【分析】根据题意,由回归直线方程过样本中心点,即可得到,然后代入计算,即可得到结果.
【详解】由题意可知,,,
将代入,即,解得,
所以,当时,,
所以该数据的残差为.故选:D.
二、多项选择题:本题共3小题,每小题6分,共18分.在每小题给出的选项中,有多项符合题目要求.全部选对的得6分,部分选对的得部分分,有选错的得0分.
9.对两个变量与进行线性相关性和回归效果分析,得到一组样本数据:则下列说法正确的是( )
A.残差平方和越小的模型,拟合的效果越好
B.由样本数据利用最小二乘法得到的经验回归方程表示的直线必过样本点的中心
C.若变量与之间的相关系数,则变量与之间具有很强的线性相关性
D.用决定系数来刻画回归效果,越小,说明模型的拟合效果越好
【答案】ABC
【分析】由残差的意义判断A;由回归方程必过样本点的中心,即可判断B;由相关系数得到变量与之间具有很强的线性相关性,可判断C;由越大,说明模型的拟合效果越好,即可判断D.
【详解】对两个变量与进行线性相关性和回归效果分析,
得到一组样本数据.残差平方和越小的模型,拟合的效果越好,故A正确;
由样本数据利用最小二乘法得到的经验回归方程表示的直线必过样本点的中心,故B正确;若变量与之间的相关系数,则变量与之间具有很强的线性相关性,故C正确;用决定系数来刻画回归效果,越大,说明模型的拟合效果越好,故D错误.
故选:ABC.
10.已知变量x,y之间的线性回归方程为,且变量x,y之间的一组相关数据如表所示,则下列说法正确的是( )
x
6
8
10
12
y
6
m
3
2
A.变量x,y之间呈现负相关关系 B.
C.可以预测,当时,y约为2.6 D.由表格数据知,该回归直线必过点
【答案】ACD
【分析】根据回归直线斜率知A正确;利用回归直线必过样本中心点可构造方程求得,可知B错误,D正确;将代入回归直线知C正确.
【详解】对于A,由,得,故呈负相关关系,故A正确;
对于B,,,
,解得,故B错误;
对于C,当时,,故C正确;
对于D,由得,回归直线必过点,即必过点,故D正确.故选:ACD.
11.给出下列命题,其中正确命题为( )
A.随机变量,若,则
B.随机变量X服从正态分布,,则
C.一组数据的线性回归方程为,若,则
D.对于独立性检验,随机变量的观测值越小,判定“两变量有关系”犯错误的概率越大
【答案】AD
【分析】A项,由二项分布的期望与方差公式解方程可得;B项,由正态曲线的对称性可得;C项,先求出,由样本中心点在回归直线上,代入,可得,进而求得;D项,根据对独立性检验思想的理解可得.
【详解】A项,随机变量,
若,则,解得,故A项正确;
B项,由于随机变量X服从正态分布,,
,,故B项错误;
C项,一组数据的线性回归方程为,
因为,则,由样本中心点在回归直线方程上得,
;即,故C项错误;
D项,对于独立性检验,随机变量的观测值值越小,
判定“两变量有关系”犯错误的概率越大,故D项正确.故选:AD.
第二部分(非选择题 共92分)
三、填空题:本题共3小题,每小题5分,共15分.
12.在研究线性回归模型时,样本数据所对应的点均在直线上,则这组样本数据的样本相关系数为______.
【答案】
【分析】根据回归模型性质判断即可.
【详解】因为样本数据所对应的点都在直线上,所以,
又样本数据负相关,所以.故答案为:.
13.某产品在某零售摊位上的零售价(单位:元)与每天的销售量(单位:个)的统计资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程中的,则________,据此模型预计零售价定为15元时,每天的销售量为________.
【答案】
【分析】根据题意,求得的值,代入回归方程,求得,得到回归方程,进而求得答案.
【详解】由表格中的数据,可得,
因为回归方程中的,代入可得,
所以经验回归方程为,
当时,,即每天的销售量约为个.故答案为:;.
14.下列说法中正确的是__________.
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;
②设有一个线性回归方程,变量增加1个单位时,平均增加5个单位;
③设具有相关关系的两个变量、的相关系数为,则越接近于0,和之间的线性相关程度越强;
④在一个列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大.
【答案】①④
【分析】利用方差的性质判断①的正误;利用回归直线的性质判断②,相关系数判断③,独立检验判断④.
【详解】对于①,将一组数据中的每一个数据都加上或减去同一个常数后,方差不变,满足方差的性质,①正确;
对于②,设有一个线性回归方程,变量x增加1个单位时,平均减少5个单位;所以②不正确;
对于③,设具有相关关系的两个变量x,y的相关系数为r,则越接近于0,x和y之间的线性相关程度越弱,所以③ 不正确;
对于④,在一个2×2列联表中,由计算得的值,则的值越大,判断两个变量间有关联的把握就越大,所以④正确;
故答案为:①④.
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤.
15.(13分)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,且具有污染性,所以需要无害化、减量化处理.某省为调查产生的垃圾数量,采用简单随机抽样的方法抽取20个县城进行了分析,得到样本数据,其中和分别表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得:,,,,.
(1)求这20个县年垃圾产生总量的平均值;
(2)请用相关系数说明该组数据中与之间的关系可用线性回归模型进行拟合.(当时,与的相关关系较强,否则相关关系较弱.)
参考公式:相关系数.
【答案】(1)
(2)理由见解析
【分析】(1)根据直接计算可得;
(2)根据所给数据计算出相关系数,即可说明.
【详解】(1)依题意这个县年垃圾产生总量的平均值为(吨).
(2)依题意,
因为与的相关系数接近,所以与之间具有较强的线性相关关系,可用线性回归模型进行拟合.
16.(15分)2025年春节假期,文旅市场火爆.文化和旅游部公布的数据显示:春节假期8天,全国国内出游5.01亿人次,同比增长;国内出游总花费6770.02亿元,同比增长.某景区的某网红饮品小店统计了春节假期前7天的营业额(单位:千元),得到与的数据如表所示:
第天
1
2
3
4
5
6
7
营业额
7
9
11
13
16
18
17
(1)已知与有较强的线性相关关系,求关于的线性回归方程,并预测春节假期第8天的营业额;
(2)如果某天营业额大于10(单位:千元),则该天“达标”,从表格中的7组数据中随机选4组,设表示“达标”的数据组数,求的分布列和数学期望.
参考公式:在线性回归方程中,,.
参考数据:,.
【答案】(1),千元
(2)分布列见解析,数学期望为
【分析】(1)先求,,结合题中公式求和回归直线方程,代入即可得预测结果;
(2)由题意可知的所有可能取值为:2,3,4,结合超几何分别求分布列和期望.
【详解】(1)由题意可得:,,
则,,
可知线性回归方程为,当时,,
所以预测春节假期第8天的营业额为千元.
(2)由题意可知的所有可能取值为:2,3,4,
则,,,
所以的分布列为
2
3
4
的数学期望为.
17.(15分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1~6月份每月5日的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
日期
1月5日
2月5日
3月5日
4月5日
5月5日
6月5日
昼夜温差X/℃
10
11
13
12
8
6
就诊人数
23
25
29
26
16
13
该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.
(1)若选取的是1月与6月的两组数据,请根据2~5月份的数据,求出关于的线性回归方程;(参考数据:设2~5月份每月5日的昼夜温差的平均数为,就诊人数的平均数为,则,)
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的线性回归方程是理想的,问:该小组所得线性回归方程是否理想?
【答案】(1)
(2)得到的线性回归方程是理想的
【分析】(1)应用最小二乘法求回归方程的系数,写出关于的线性回归方程即可;
(2)根据理想线性回归方程定义,将对应代入求值,再与表格中对应值比较,即可判断是否理想.
【详解】(1)因为,,所以,,
可得,,
所以关于的线性回归方程为.
(2)由(1)可得,
当时,,且;
当时,,且.
可知由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,
所以得到的线性回归方程是理想的.
18.(17分)在3+1+2的新高考模式下,某学校计划在高一下学期开设“物理”和“历史”两个选修科目.为了了解学生对这两个科目选课意向,以便提前规划教育资源,教务处从高一年级500名学生(其中男生200人,女生300人)中,采用分层抽样的方法从中抽取部分学生进行调查.其中,女生比男生多抽取20人.
性别
选择科目
合计
选择“物理”
选择“历史”
男生
女生
25
总计
55
附:.
0.05
0.01
0.005
0.001
3.841
6.635
7.879
10.828
(1)请问总共抽取了多少名学生进行调查;
(2)新高考模式要求每名学生在“物理”和“历史”这两个科目中必须选择一个科目且只能选择一个科目,下表是根据调查结果得到的一个不完整的列联表,请将下面的列联表补充完整,并判断是否有99.9%的把握认为选择科目与性别有关?
【答案】(1)100 (2)列联表见解析,没有
【分析】(1)设女生抽取人,则男生抽取人,根据题意,列出方程,求得的值,即可得到答案;
(2)根据题意补充完整列联表如表,求得,结合附表,即可得到结论.
【详解】(1)设女生抽取人,则男生抽取人,
根据题意,可得,解得,所以总共抽取了人.
(2)根据题意补充完整列联表如表.
性别
选择科目
合计
选择“物理”
选择“历史”
男生
30
10
40
女生
25
35
60
合计
55
45
100
由表中数据,计算得,
所以没有的把握认为选择科目与性别有关.
19.(17分)为了了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下表:
年龄
心肺疾病
合计
患心肺疾病
不患心肺疾病
大于40岁
16
小于等于40岁
12
合计
40
已知在40人中随机抽取1人,抽到不患心肺疾病的市民的概率为.
(1)请将列联表补充完整;
(2)已知在大于40岁且患心肺疾病的市民中,有4名重症患者,专家建议以重症患者住院治疗,现从这16名患者中选出2人,记需住院治疗的人数为,求的分布列和数学期望;
(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?
【答案】(1)答案见解析 (2)分布列见解析,
(3)能在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关.
【分析】(1)根据题意,求得抽到不患心肺疾病的市民的人数为人,进而完成列联表
(2)根据题意,得到需住院治疗的人数为可能取值为,利用超几何分布的概率公式,求得相应的概率,列出分布列,结合期望的公式,即可求解;
(3)由(1)中的列联表,求得,结合附表,即可得到结论.
【详解】(1)解:由题意知,在40人中随机抽取1人,抽到不患心肺疾病的市民的概率为,
所以抽到不患心肺疾病的市民的人数为人,
将列联表补充完整,如下表所示:
年龄
心肺疾病
合计
患心肺疾病
不患心肺疾病
大于40岁
16
4
20
小于等于40岁
8
12
20
合计
24
16
40
(2)解:由题意知,需住院治疗的人数为可能取值为,
可得,,,
所以随机变量的分布列为
0
1
2
所以随机变量的数学期望.
(3)解:零假设为:是否患心肺疾病与年龄无关,
由(1)中的列联表,可得,
所以能在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关.
学科网(北京)股份有限公司
$相教版高中数学选择性必修第二册
第4章:统计单元测试卷
命题人:李文元
(考试时间:120分钟试卷满分:150分)
班级:
姓名:
成绩:
注意事项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。
如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答
题卡上。写在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
4.考试范围:湘教版(2019)选择性必修第二册第4章
第一部分(选择题共58分)
一、单项选择题:本题共8小题,每小题5分,共40分。在每小题给出的四个选项中,只
有一项是符合题目要求的.
1.对四组数据进行统计,获得以下散点图,关于其相关系数的比较,正确的是()
35
5
5101520253035
5101520253035
样本相关系数为
样本相关系数为r2
35
●
35
30
30
0
●
5101520253035
5101520253035
样本相关系数为r3
样本相关系数为r4
A.5<m<0<5<5
B.r4<2<0<1<5
C.4<72<0<3<i
D.3<14<0<1<3
2.某饮料店某5天的日销售收入y(单位:百元)与当天平均气温x(单位:℃)之间的
数据如下表:
-2
0
1
2
4
2
2
1
若x与y之间是线性相关关系,且y关于x的经验回归方程是少=-x+,则实数m的值是
()
A.3
B.2.8
C.2.6
D.2.4
3.已知变量X和变量r的一组成对样本数据为(s,y)=12,3,8,其中x=
8,其线性
回归方程为=2X-子
当增加两个样本数据(-1,5)和(2,9)后,重新得到的回归直线的斜
率为3,则在新的线性回归方程下,X=4时,Y的估计值为()
A.13
B.12
C.11
D.8
4.某校团委对“喜欢吃水果和学生性别是否有关”进行了一次调查,其中被调查的女生人数
是男生人数的:,男生喜欢吃水果的人数占被调查的男生人数的后,女生喜欢吃水果的人数
占被调查的女生人数的,若有99%的把握认为喜欢吃水果和学生性别有关,则被调查的
3
男生至少有()(参考数据:P(x2≥6.635)≈0.01)
A.30人
B.24人
C.18人
D.12人
5.根据分类变量x与y的观察数据,计算得到K2=2.974,依据下表给出的K2独立性检验
中的小概率值和相应的临界值,作出下列判断,正确的是()
P(K2≥k)
0.1
0.05
0.01
0.005
0.001
k
2.706
3.841
6.635
7.879
10.828
A.有95%的把握认为变量x与y独立
B.有95%的把握认为变量x与y不独立
C.变量x与y独立,这个结论犯错误的概率不超过10%
D.变量x与y不独立,这个结论犯错误的概率不超过10%
6.某运动制衣品牌为了使成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量
(单位:cm),图①为选取的15名志愿者身高与臂展的折线图,图②为身高(x)与臂展(y)
所对应的散点图,并求得其回归直线方程为少=1.16x-30.75,则下列结论中不正确的为()
个长度/cm
185
臂展ylcm
190
185
180
180
175
175
10
5
170
165
150
160
0123456789101112131415
15606
由身高x/cm
身高
--臂展
165170175180185
图①
图②
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者身高和臂展成正相关关系
C.可估计身高为190cm的人臂展大约为189.65cm
D.身高相差10cm的两人臂展都相差11.6cm
7.根据下面的列联表判断患肝病与嗜酒有关系的把握有()
酒性
肝病
合计
嗜酒
不嗜酒
患肝病
7775
42
7817
未患肝病
2099
49
2148
合计
9874
91
9965
A.90%
B.95%
C.99.5%
D.99.9%
8.色差和色度是衡量毛绒玩具质量优劣的重要指标,现抽检一批产品测得数据如下表:已
知该产品的色度y和色差x之间满足线性相关关系,且y=0.8x+a,现有一组测量数据为
(31,22.4),则该数据的残差为()
色差x
22
24
26
28
色度y
16
19
20
21
A.1.4
B.1.2
C.-1.2
D.-1.4
二、多项选择题:本题共3小题,每小题6分,共18分。在每小题给出的选项中,有多项
符合题目要求。全鄗选对的得6分,部分选对的得部分分,有选错的得0分
9.对两个变量x与y进行线性相关性和回归效果分析,得到一组样本数据:
(化,),(化22),,(y),则下列说法正确的是()
A.残差平方和越小的模型,拟合的效果越好
B.由样本数据利用最小二乘法得到的经验回归方程表示的直线必过样本点的中心(x,y)
C.若变量x与y之间的相关系数r=0.80,则变量x与y之间具有很强的线性相关性
D.用决定系数R2来刻画回归效果,R越小,说明模型的拟合效果越好
10.己知变量x,y之间的线性回归方程为y=-0.7x+10.3,且变量x,y之间的一组相关数
据如表所示,则下列说法正确的是()
6
P
10
12
6
3
2
A.变量x,y之间呈现负相关关系
B.L=4
C.可以预测,当x=11时,y约为2.6D.由表格数据知,该回归直线必过点(9,4)
11.给出下列命题,其中正确命题为()
A.随机变量5~B,p),若E()=30,D(5)=20,则n=9
B.随机变量X服从正态分布N1,o2),P(X>1.5)=0.34,则P(X<0.5)=0.16
C.一组数据(化,y)6=L23,45.0的线性曰归方程为5=2x3,若23=30,则
宫的
D.对于独立性检验,随机变量的观测值k越小,判定“两变量有关系”犯错误的概率
越大
第二部分(非选择题共92分)
三、填空题:本题共3小题,每小题5分,共15分
12.在研究线性回归模型时,样本数据(x,y)(i=1,2,3,,n)所对应的点均在直线
y=x+3上,则这组样本数据的样本相关系数?为一
13.某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计
资料如表所示:
16
17
18
19
50
44
41
31
由上表可得经验回归方程y=br+à中的b=-6,则a=
据此模型预计零售价定为
15元时,每天的销售量为
14.下列说法中正确的是
①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变:
②设有一个线性回归方程少=3-5x,变量x增加1个单位时,)平均增加5个单位:
③设具有相关关系的两个变量x、y的相关系数为”,则越接近于0,x和y之间的线性
相关程度越强:
④在一个2×2列联表中,由计算得x的值,则x2的值越大,判断两个变量间有关联的把握
就越大。
四、解答题:本题共5小题,共77分。解答应写出文字说明、证明过程或演算步骤
15.(13分)垃圾是人类日常生活和生产中产生的废弃物,由于排出量大,成分复杂多样,
且具有污染性,所以需要无害化、减量化处理.某省为调查产生的垃圾数量,采用简单随机
抽样的方法抽取20个县城进行了分析,得到样本数据(3y)=1,2,,20),其中x,和y分别
20
表示第i个县城的人口(单位:万人)和该县年垃圾产生总量(单位:吨),并计算得:∑x,=80,
8=400,2k-0=0.2g-=00.2x-0-0=0
(1)求这20个县年垃圾产生总量的平均值;
(2)请用相关系数说明该组数据中y与x之间的关系可用线性回归模型进行拟合.(当
0.75<rs1时,y与x的相关关系较强,否则相关关系较弱.)
∑(x-x)0y,-)
参考公式:相关系数”
11
16.(15分)2025年春节假期,文旅市场火爆.文化和旅游部公布的数据显示:春节假期8
天,全国国内出游5.01亿人次,同比增长5.9%:国内出游总花费6770.02亿元,同比增长
7.0%.某景区的某网红饮品小店统计了春节假期前7天的营业额y(单位:千元),得到y
与x的数据如表所示:
第x天
1
2
3
5
7
营业额
>
0
11
13
16
18
17
2
(1)已知y与x有较强的线性相关关系,求'关于x的线性回归方程,并预测春节假期第8天
的营业额;
(2)如果某天营业额大于10(单位:千元),则该天“达标”,从表格中的7组数据中随机选4
组,设X表示“达标”的数据组数,求X的分布列和数学期望,
y-派可
参考公式:在线性回归方程)=bx+à中,b=回
、,à=-br.
参考数据:
三男-417,=10.
17.(15分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气
象局与某医院抄录了16月份每月5日的昼夜温差情况与因患感冒而就诊的人数,得到如下
资料:
1月5
日期
2月5日
3月5日
4月5日
5月5日
6月5日
日
昼夜温差
10
11
13
12
8
6
XIC
就诊人数Y
23
25
29
26
16
13
该兴趣小组确定的研究方案是:先从这6组数据中选取2组,用剩下的4组数据求线性回归
方程,再用被选取的2组数据进行检验
(1)若选取的是1月与6月的两组数据,请根据2~5月份的数据,求出Y关于X的线性回归
方程;(参考数据:设2~5月份每月5日的昼夜温差的平均数为x,就诊人数的平均数为y,
则x=11,y=24)
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2,则认为得到的
线性回归方程是理想的,问:该小组所得线性回归方程是否理想?
18.(17分)在3+1+2的新高考模式下,某学校计划在高一下学期开设“物理和“历史”两个
选修科目.为了了解学生对这两个科目选课意向,以便提前规划教育资源,教务处从高一年
级500名学生(其中男生200人,女生300人)中,采用分层抽样的方法从中抽取部分学生
进行调查.其中,女生比男生多抽取20人.
选择科目
性别
合计
选择“物理
选择“历史”
男生
女生
25
总计
55
n(ad-be)
附:x2=
(a+b)(a+e)(cd(ba ed.
0.05
0.01
0.005
0.001
a
3.841
6.635
7.879
10.828
(1)请问总共抽取了多少名学生进行调查:
(2)新高考模式要求每名学生在“物理”和“历史”这两个科目中必须选择一个科目且只能选择
一个科目,下表是根据调查结果得到的一个不完整的列联表,请将下面的列联表补充完整,
并判断是否有99.%的把握认为选择科目与性别有关?
19.(17分)为了了解心肺疾病是否与年龄相关,现随机抽取了40名市民,得到数据如下
表:
心肺疾病
年龄
合计
患心肺疾病
不患心肺疾病
大于40岁
16
小于等于40岁
12
合计
40
已知在40人中晓机描取1人,拍到不光心防疾病的市民的传车为号
(1)请将2×2列联表补充完整:
(2)已知在大于40岁且患心肺疾病的市民中,有4名重症患者,专家建议以重症患者住院治
疗,现从这16名患者中选出2人,记需住院治疗的人数为5,求的分布列和数学期望;
(3)能否在犯错误的概率不超过0.01的前提下认为患心肺疾病与年龄有关?