内容正文:
1
2
3
4
5
6
7
8
9
10
11
12
1.(2025·山东威海模拟)下列散点图中,样本线性相关系数最小的是( )
基础巩固练
A
1
2
3
4
5
6
7
8
9
10
11
12
解析:观察选项A的散点图,样本点紧密地聚集在一条直线附近,其样本线性相关系数接近于-1;
选项B的散点图中,线性负相关程度不及A,比较分散,即样本线性相关系数要比选项A的大.
选项C的散点图中,样本点呈现出一定的上升趋势,变量x和y之间具有正线性相关关系,其样本线性相关系数为正数.
选项D的散点图中,样本点比较分散,线性相关程度比选项A要弱,样本线性相关系数比选项A的大.综合比较四个选项,选项A的线性负相关程度最强,所以样本线性相关系数最小.
1
2
3
4
5
6
7
8
9
10
11
12
D
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
3.(2025·安徽黄山模拟)为了解某市居民用水情况,通过简单随机抽样,获得了100户居民的月均用水量(单位:t),将该数据按照[1.2,4.2),[4.2,7.2),…,[25.2,28.2],分成9组,绘制了如图所示的频率分布直方图.政府要对节约用水的用户予以表彰,制定了一个用水量标准x,使表彰的居民不超过15.4%,则以下比较适合作为标准x的为( )
A.3.2 B.5
C.5.04 D.15.7
A
1
2
3
4
5
6
7
8
9
10
11
12
解析:由题意及0.077×3=0.231>0.154,则0.077×(x-1.2)=0.154,可得x=3.2.
1
2
3
4
5
6
7
8
9
10
11
12
4.(2025·湖北武汉模拟)随着AI的发展,各种AI大模型层出不穷,现有甲、乙两个AI大模型,在对甲、乙两个大模型进行深度体验后,6位评委分别对甲、乙进行打分(满分10分),得到如表所示的数据,则下列结论不正确的是( )
A.甲得分的平均数大于乙得分的平均数
B.甲得分的众数大于乙得分的众数
C.甲得分的中位数大于乙得分的中位数
D.甲得分的方差大于乙得分的方差
评委编号
模型名称 1 2 3 4 5 6
甲 7.0 9.3 8.3 9.2 8.9 8.9
乙 8.1 9.1 8.5 8.6 8.7 8.6
A
1
2
3
4
5
6
7
8
9
10
11
12
解析:甲、乙的得分从小到大排列如下:
甲:7.0,8.3,8.9,8.9,9.2,9.3,乙:8.1,8.5,8.6,8.6,8.7,9.1,
甲得分的中位数为8.9,乙得分的中位数为8.6,甲得分的中位数大于乙得分的中位数,故C正确;
甲得分的众数为8.9,乙得分的众数为8.6,甲得分的众数大于乙得分的众数,故B正确;
甲得分的平均数为=8.6,
1
2
3
4
5
6
7
8
9
10
11
12
乙得分的平均数为=8.6,所以甲得分的平均数等于乙得分的平均数,故A错误;
甲的方差=×[(7.0-8.6)2+(8.3-8.6)2+(8.9-8.6)2+(8.9-8.6)2+(9.2-8.6)2+(9.3-8.6)2]≈0.613 3,
乙的方差=×[(8.1-8.6)2+(8.5-8.6)2+(8.6-8.6)2+(8.6-8.6)2+(8.7-8.6)2+(9.1-8.6)2]≈0.086 7,
故甲得分的方差大于乙得分的方差,故D正确.
1
2
3
4
5
6
7
8
9
10
11
12
5.(多选)(2025·湖南长沙模拟)已知某品牌手机在2025年前六周的销量如表所示:
则( )
A.销量的平均数为135
B.销量的第40百分位数为124
C.由样本数据计算得样本相关系数为0.952,因此这两个变量y与x线性相关程度很强
周次x 1 2 3 4 5 6
销量y/台 117 124 138 132 146 153
ACD
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
6.(多选)(2025·山东临沂模拟)下列关于成对数据统计的表述中,正确的是( )
A.成对样本数据的经验回归直线一定经过点(,)
B.依据小概率值α=0.1的独立性检验对零假设H0进行检验,根据2×2列联表中的数据计算发现χ2≈0.837<x0.1=2.706,可推断H0不成立,即认为X和Y不相互独立,该推断犯错误的概率不超过0.1
C.在残差图中,残差点的分布随解释变量增大呈现扩散的趋势,说明残差的方差是一个常数,满足一元线性回归模型对随机误差的假设
D.决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好
AD
1
2
3
4
5
6
7
8
9
10
11
12
解析:对于A,成对样本数据的经验回归直线一定经过点(,),故A正确;
对于B,因为χ2≈0.837<x0.1=2.706,根据小概率值α=0.1的独立性检验,可推断H0成立,
即认为X和Y相互独立,故B错误;
对于C,在残差图中,残差点的分布随解释变量增大呈现扩散的趋势,说明残差的方差不是一个常数,不满足一元线性回归模型对随机误差的假设,故C错误;
对于D,决定系数R2越大,表示残差平方和越小,即模型的拟合效果越好,故D正确.
1
2
3
4
5
6
7
8
9
10
11
12
x/万件 1 2 3 4
y/万元 4.8 m 7.4 9.2
6.6
1
2
3
4
5
6
7
8
9
10
11
12
8.(2025·陕西延安模拟)人工智能对人们的生活有较大的影响,为了让老师更加重视人工智能,某校随机抽出30名男教师和20名女教师参加学校组织的“人工智能”相关知识问卷调查(满分100分),若分数为80分及以上的为优秀,其他为非优秀,统计并得到如下列联表:
男教师 女教师 总计
优秀 20 15 35
非优秀 10 5 15
总计 30 20 50
1
2
3
4
5
6
7
8
9
10
11
12
(1)根据小概率值α=0.1的独立性检验,能否认为这次成绩是否优秀与性别有关?
解:零假设为H0:这次成绩是否优秀与性别无关,由表中数据可得χ2===≈0.397<2.706=x0.1,
根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,因此可以认为H0成立,可以认为这次成绩是否优秀与性别无关.
1
2
3
4
5
6
7
8
9
10
11
12
(2)从样本中成绩非优秀的15名老师中,随机抽取2人进行调研,记抽出的2人中女老师的人数为X,求X的分布列和数学期望.
附:χ2=,其中n=a+b+c+d.
α 0.1 0.05 0.01 0.001
xα 2.706 3.841 6.635 10.828
1
2
3
4
5
6
7
8
9
10
11
12
解:由题意得,随机变量X的可能取值为0,1,2,
则P(X=0)==,P(X=1)==,P(X=2)==,
所以随机变量X的分布列为
所以期望E(X)=0×+1×+2×=.
X 0 1 2
P
1
2
3
4
5
6
7
8
9
10
11
12
9.(多选)(2025·江苏苏州模拟)为比较甲、乙两所学校学生的数学水平,采取简单随机抽样的方法抽取88名学生进行数学测验.通过测验得到了如表所示数据:
能力提升练
学校 数学成绩 合计
不优秀 优秀
甲校 33 10 43
乙校 38 7 45
合计 71 17 88
附:χ2=,n=a+b+c+d.
参考数据:
α 0.100 0.050 0.010 0.005
xα 2.706 3.841 6.635 7.879
1
2
3
4
5
6
7
8
9
10
11
12
则下列说法正确的有( )
A.甲校的数学抽测成绩优秀率一定比乙校的数学抽测成绩优秀率高
B.甲校的数学成绩优秀率一定比乙校的数学成绩优秀率高
C.甲校的数学优秀人数可能比乙校的数学优秀人数多
D.根据小概率值α=0.1的独立性检验,可以认为两校的数学成绩优秀率几乎没有差异
ACD
1
2
3
4
5
6
7
8
9
10
11
12
解析:对于A,因为甲校的数学抽测成绩优秀率为,乙校的数学抽测成绩优秀率为,
所以甲校的数学抽测成绩优秀率一定比乙校的数学抽测成绩优秀率高,故A正确;
对于B,抽测的样本的优秀率可能代表性差,不一定能真实的反映两校的优秀率,故B错误;
对于C,有可能甲校的数学优秀人数比乙校的数学优秀人数多,故C正确;
1
2
3
4
5
6
7
8
9
10
11
12
对于D,零假设为H0:两校的数学成绩优秀率没有差异,
χ2=≈0.836 5<2.706=x0.1,
根据小概率值α=0.1的独立性检验,没有充分证据推断H0不成立,可以认为H0成立,可以认为两校的数学成绩优秀率几乎没有差异,故D正确.
1
2
3
4
5
6
7
8
9
10
11
12
10.(2025·上海模拟)为了考察某种药物预防疾病的效果,进行动物试验,得到如下所示列联表:
药物 疾病 合计
未患病 患病
服用 m 50-m 50
未服用 80-m m-30 50
合计 80 20 100
1
2
3
4
5
6
7
8
9
10
11
12
若根据小概率值α=0.05的独立性检验,可以认为该药物对疾病预防有显著效果,则m(m≥40,m∈N)的最小值为 .
附:χ2=,n=a+b+c+d.
α 0.1 0.05 0.025 0.01
xα 2.706 3.841 5.024 6.635
44
1
2
3
4
5
6
7
8
9
10
11
12
解析:零假设为H0:该药物对疾病预防没有效果,由题意可知H0不成立,则χ2=
≥3.841=x0.05,
则(100m-4 000)2≥502×42×3.841,
解得m≥43.92或m≤36.08,又m≥40,m∈N,故m的最小值为44.
1
2
3
4
5
6
7
8
9
10
11
12
11.红蜘蛛是柚子树的主要害虫之一,能对柚子树造成严重伤害,每只红蜘蛛的平均产卵数y(个)和平均温度x(℃)有关,现收集了以往某地的7组数据,得到下面的散点图及一些统计量的值.
参考数据(z=ln y)
xiyi xizi
5 215 17 713 714 27 81.3 3.6
1
2
3
4
5
6
7
8
9
10
11
12
(1)根据散点图判断,y=bx+a与y=cedx(其中e≈2.718为自然对数的底数)哪一个更适合作为平均产卵数y(个)关于平均温度x(℃)的回归方程类型?(给出判断即可,不必说明理由)
解:由散点图可以判断,随温度升高,产卵数增长速度变快,符合指数函数模型的增长,
所以y=cedx更适宜作为平均产卵数y关于平均温度x的回归方程类型.
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
12.(2025·河北秦皇岛模拟)某答题竞赛中,答题类型有科普类与文学类两种,随机抽取了50名参赛人员进行答题偏好的问卷调查,调查所得数据如表所示:
创新拓展练
科普类 文学类 合计
男生 5
女生 10
合计 25 50
1
2
3
4
5
6
7
8
9
10
11
12
(1)完成以上列联表,依据小概率值α=0.01的独立性检验,能否推断该竞赛的答题偏好与性别有关联?
解:完成列联表如表所示:
科普类 文学类 合计
男生 15 5 20
女生 10 20 30
合计 25 25 50
零假设为H0:该竞赛的答题偏好与性别无关.
χ2==≈8.33>6.635=x0.01,
根据小概率值α=0.01的独立性检验,推断H0不成立,即认为该竞赛的答题偏好与性别有关联.
1
2
3
4
5
6
7
8
9
10
11
12
1
2
3
4
5
6
7
8
9
10
11
12
参考数据:
α 0.10 0.05 0.010 0.005 0.001
xα 2.706 3.841 6.635 7.879 10.828
1
2
3
4
5
6
7
8
9
10
11
12
感谢您的观看
2.(2025·山东聊城模拟)为了研究某市高中生的脚长x(单位:cm)和身高y(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生作调查,经统计,所调查数据的=19.25,=161,根据最小二乘法算得脚长和身高的经验回归方程为=4x+.已知被调查的某学生的脚长为25 cm,身高为180 cm,则该样本点的残差为( )
A.1 cm B.-1 cm
C.4 cm D.-4 cm
解析:因为=19.25,=161,又经验回归方程=4x+必过点(,),所以161=4×19.25+,解得=84,所以=4x+84,当x=25时,=4×25+84=184,所以该样本点的残差为180-184=-4(cm).
D.经计算销量y关于周次x的经验回归方程为=x+,则=111
解析:对于A,销量的平均数=(117+124+132+138+146+153)=135,故A正确;
对于B,将销量按升序排列得117,124,132,138,146,153,由6×40%=2.4,得销量的第40百分位数是132,故B错误;
对于C,样本相关系数为0.952,很接近1,因此这两个变量y与x线性相关程度很强,故C正确;
对于D,周次的平均数=(1+2+3+4+5+6)=3.5,回归方程=x+过样本中心点(3.5,135),即135=×3.5+,解得=111,故D正确.
7.(2025·河南许昌模拟)某工厂产品的月总成本y(单位:万元)与月产量x(单位:万件)有如表所示一组数据,已知y与x线性相关.如果经验回归方程是=1.4x+3.5,那么表格中数据m的值为 .
解析:由题意知==,=(4.8+m+7.4+9.2)=,又经验回归方程是=1.4x+3.5,所以=1.4×+3.5,解得m=6.6.
(2)由(1)的判断结果及表中数据,求出y关于x的回归方程.(计算结果精确到0.1)
附:回归方程中=x+, ==, =-.
解:将y=cedx两边同时取自然对数,可得ln y=ln c+dx,令z=ln y,
由题中的数据可得,xizi-7=33.6,(xi-)2=-7=112,
所以d===0.3,
则ln c=-d=3.6-0.3×27=-4.5,
所以z关于x的经验回归方程为z=0.3x-4.5,故y关于x的回归方程为
y=e0.3x-4.5.
(2)随着参赛人员越多,题库提供的题量越多,某同学统计了当参赛人数分别为2~6人时,题库给出的题量y的数据,用最小二乘法得到答题量y关于参赛人数x的回归直线方程为=x-16,已知该组数据的相关系数r=0.99,题量y的方差=600,求的值(结果精确到0.1).
附:参考公式:χ2=,其中n=a+b+c+d.
回归系数=,相关系数r=,≈1.73.
解:由题意可得=×(2+3+4+5+6)=4,
(xi-)2=4+1+0+1+4=10.
因为=(yi-)2=600,可得(yi-)2=3 000.
又因为r===0.99,
可得(xi-)(yi-)=0.99×100≈171.27,
所以=≈≈17.1.
$