内容正文:
中学生教理化离整数学名统务降创朝云爷聚与提示
成对数据的统计分析单元创新卷叁考登案
一、单选题
的自变量与因变量符合线性回归模型,故A
1.B2.B3.D4.B5.C6.B
正确。
7.A提示:由4=3+4+6+5=4,5,得
根据实验结果1的散点图可知,异常样
4
本点的自变量的值可能为0.33,故B正确。
0=0.7u+0.35=3.5=2.5+a+b+4
所以
由于R<R:,则实验结果2相较于实验
4
结果1拟合效果更好,故C错误。
a+b=7.5。
由于实验结果1中异常样本点对应的因
而b一(0.7×6+0.35)=0.1,所以b=
变量值接近一4.6,比其他正常样本点对应的
4.65,从而a=7.5-4.65=2.85。
因变量值小得多,故实验结果1的因变量的
8,B提示:由题表知x=号×(1+2+
平均值小于实验结果2的因变量的平均值,D
错误。
3+4+5)=3,2=1×(0.85+1.3+1.85+
5
11.ABD提示:加入新数据(x,y)后,
2.3+2.7)=1.8。
1
1
(空x,十x)=n十x十x)=,同理
将x=3,之=1.8代入回归方程之=0.5x
n+1
+lgc,可得1.8=0.5×3+lgc,即lgc=
”有(空十少)=y,故A正确
1
1.8一0.5×3=0.3,所以之关于x的回归方
程为之=0.5x十0.3。
岂(x,-x)(y:-y)=2(x,-x)(y
2026年的年份代码为x=8,则:=0.5×
y)+(x-x)(y-y)=2(x,-x)(y,-y),
8+0.3=4.3=1gy,故y=103。
二、多选题
克(:-x)=之(x,-x)2+(x-x)=
9.BD提示:将数据从小到大排列为3,
2(x,-x),同理岁(y,-y)=2(y,-y)。
=1
4,6,7,8,9,10,11,由8×75%=6,得数据的
(x,-x)(y-y)+(x-x)(y-y)
=1
上四分位数为9十10=9.5,A错误。
b,=
2
2(x,-x)2+(x-x)
=1
。越大,对应的正态曲线越“矮胖”,随机
变量的分布越分散,因此该物理量在一次测
2(x:-x)(y:一y)
=1
=61,a2=y-b2x=y
量中在(9.8,10.2)内的概率越小,B正确。
2(x,-x)月
散点不一定在回归直线上,即将该点代
b,x=a1,且变化后相关系数r的值没变,故
入回归直线方程,方程不一定成立,C错误。
B正确,C错误。
R2=1-
-5
,y变成了y+3,
(0-5P=20-,)r+[-6x
=1
2(y:-y)
=1
+a)门=之(y,一y),故变化前后残差的平
;=
则y'=y+3,y':=bx:+a+3=y:+3,因此
方和没变,D正确。
y一y:,y:一y都不变,则决定系数R不变,
三、填空题
D正确。
12.④提示:根据表中数据,画出图像
10.AB提示:由散点图可知,该实验中
(图1),通过图像可看出,y=1ogx能比较近
46
黄悠府名枝密西翻酱益繁室餐秀中学生款理化
似地反映这些数据的规律。
则2(x:-x)(y-y)=13,之(x:-x)
i=1
y=log2x
=10,所以6=1
=1.3,a=8-1.3×7=
一1.1,故y与x的回归方程为y=1.3x一11。
02345678
2026年对应的编号x=10,此时y=1.3
×10一1.1=11.9,故预测2026年的日均发
图1
电量为11.9MWh。
提示:修正前样本点的中心为
16.(1)x=
5×1+2+3+4+5)=3,
(2,m),代入y=2x+5,可知m=2×2+5=
9。假设甲输入的(x1,y1)为(7,3),(x2,y2)
5×(0.3+0.3+0.5+0.9+1)=0.6,
为(4,一6),则7+4十xg十x:十…十xg=2×
22y-5xy=1×0.3+2×0.3+3×0.5+
8=16,3-6+y3十y:+…+y8=9×8=72,
4×0.9+5×1-5×3×0.6=2,2x-5x=
解得x3十x:十…十xg=5,y3十y:十…十
i三1
(1+4+9+16+25)一5×9=10.
yg=75。
故修正后3十4十x3十x,十…十xg=12,
所以i=2=0.2,a=0.6-0.2×3=0,
10
7十6十y3十y:+…十yg=88。则修正后样本
故销售量关于温度变量的线性回归方程为)
点的中心为(号,山),将其代入线性回归方程
=0.2x。
13
当x=6时,y=1.2。
+,得=1-×-号
所以估计温度在[24,25)区间时该饮品
140.9提示:由题意知2=子×1十
的日销售量为1.2万份。
(2)零假设为H。:对饮品的喜欢程度与
2+3+4+5+6+7)=4y=号×2.90+
性别相互独立,即对饮品的喜欢程度与性别
无关联。
3.30+3.60+4.40+4.80+5.20+5.90)
220×(90×40-20×70)
4.30,2(x-x)=(1-4)2+(2-4)+
X:=
110×110×160×60
≈9.167>
=1
(3-4)+(4-4)2+(5-4)2+(6-4)2+
6.635
(7-4)2=28。
依据小概率值α=0.01的独立性检验,
14.00
14.0014.00
我们推断H。不成立,即认为对饮品的喜欢
所以x=
√28×7.08
198.2414.10
程度与性别有关,此推断犯错误的概率不超
0.99,故y与x的相关系数近似为0.99。
过0.01。
四、解答题
(3)由频率分布直方图可知,这100天的
15.(1)由题意知,平均数是
日均销售量为2×0.05×2+4×0.1×2+6×
2+3+5+4+5+7+8+10+10=6。
0.15×2+8×0.125×2+10×0.075×2=6.3,
9
所以这100天的日均销售量为6300份。
方差为号×[(2-6)+(3-6)+(5
17.(1)根据列联表可得X2=
50×(7×6-19×18)2
6)+(4-6)+(5-6)2+(7-6)+(8-6)
25×25×26×24
≈11.538>10.828。
+(10-6)2+(10-6)]=69
所以在犯错误的概率不超过0.001的前
94
提下,认为接种该疫苗与预防该疾病有关。
(2)近五年的数据依次是(5,5),(6,7),
(7,8),(8,10),(9,10),所以x=7,y=8。
(2)因为1-P(A1B)=1-
P(AB)
P(B)
47
演练篇名校名师创新卷答案与提示
中学生数理化高数学226年月
P(B)-P(AB)_P(AB)=P(A1B),所以
C_1
P(B)
P(B)
R。=
P(AB)
P(AB)
R=
所以”的分布列如表2所示。
1-P(AB)
P(AB)
表2
P(A)
P(A)
1
2
1-P(A)
P(A)
3
3
1
P(AB)
10
10
R2
P(AB)
P(AB)P(A)
P(A)
P(AB)P(A)
E)=1×是+2×g+8×0-号
105
P(A)
19.(1)设每件产品的销售利润为元,
P(AB)
P(AB)
P(A)
P(B)
则的所有可能取值为1.5,3.5,5.5。
P(A)
P(BA)
P(AB)
P(AB)
P(BA)
由直方图可得,A,B,C三类产品的频率
P(A)
P(B)
P(A)
分别为0.15,0.45,0.4。
7
所以P(g=1.5)=0.15,P(=3.5)=
由列联表中的数据可得P(B|A)=
26
0.45,P(=5.5)=0.4,则E()=1.5×
18
R214
0.15+3.5×0.45+5.5×0.4=4,故每件产
P(BA)-
,所以R一39°
2
品的平均销售利润为4元。
18.(1)如表1所示。
(2)(i)由y=a·x得,lny=ln(a·
表1
xb)=lna+blnx。令u=lnx,v=lny,c=
患肺癌
不患肺癌
合计
lna,则o=c十buo
吸烟
0.4m
0.1m
0.5n
(u,-)(0:-0)
由表中数据可得,6=
=1
不吸烟
0.2m
0.3m
0.5m
2(u:-u)2
=1
合计
0.6m
0.4m
0.41
1.64
=0.25,则c=0-6=24.87
5
-0.25
(2)零假设为H。:吸烟与患肺癌无关联。
根据列联表中的数据,经计算得到X=
×16.30
=4.159。
m(0.4m×0.3m-0.2m×0.1m)2_m
所以0=4.159+0.25u,即lny=4.159
0.6n×0.4m×0.5m×0.5m
60
当g≥6.635,即m≥39.81时,根据小
+0.251nx=1n(ci·x
概率值a=0.010的独立性检验,我们推断
因为e1"=64,所以y=64x
H。不成立,即认为吸烟与患肺癌有关联,此
故y关于x的回归方程为y=64。
推断犯错误的概率不超过0.010。
(i)设年收益为之万元,则之=E()·
当g<6.635,即m<39.81时,根据小
y-x=256x-。i设1=x,f04)=256t
概率值a=0.010的独立性检验,没有充分的
-t,则f'(t)=256-4t3=4(64-t)。
证据推断H。不成立,因此可以认为H。成
当t∈(0,4)时,'(t)>0,f(t)单调递增:当
立,即认为吸烟与患肺癌无关联。
t∈(4,+∞)时,f'(t)<0,f(t)单调递减。
(3)由分层抽样的特点知:从不吸烟人群
所以当t=4,即x=256时,之取最大值
中随机抽取5人,有2人患肺癌,3人不患肺
为768,即该公司应投入256万元营销费用,
癌。则7的可能取值为1,2,3。
才能使得该产品一年的收益达到最大,收益
P(7=1)=
CC3
C=10P(7=2)=
CC
最大为768万元。
C
(责任编辑赵待)
48中学生数理化
演练篇名校名师创新卷
高二数学2026年5月
成对数据的统计分析单元创新卷
■河北省南宫中学
霍忠林
一、单选题(本题共8小题,每小题5分,
有观测数据(u:,v:)(i=1,2,3,…,10),得散
共40分。在每个小题给出的四个选项中,只
点图(图2)。由这两个散点图可以判断
有一项是符合题目要求的)
(
)
1.下列变量间的关系,不是相关关系的
60
60·
是()。
0
40
40
A.一块农田的水稻产量与施肥量之间
30H
30H
20
20H
的关系
0··.
10叶
B.正方形的面积与其边长之间的关系
01234567x01234567
C.商品销售收入与其广告费支出之间的
图1
图2
关系
A.变量x与y正相关,u与v正相关
D.人体内的脂肪含量与年龄之间的
B.变量x与y正相关,u与o负相关
关系
C.变量x与y负相关,“与v正相关
2.已知A,B,C,D四组成对样本数据对
D.变量x与y负相关,u与o负相关
应的线性相关系数分别为r1=一0.625,r2=
5.假设有两个分类变量X与Y,它们的
一0.985,r3=0.211,r,=0.718,则线性相关
可能取值分别为{x1,x2}和{y1y},其2×2
程度最强的是()。
列联表如表1所示。
A.A组
B.B组
表1
C.C组
D.D组
合计
3.观察下列等高条形图,其中最有把握认
Y=y
Y=y:
为两个分类变量x,y之间有关系的是(
)。
X=x
6
a+b
X=I:
d
c+d
合计
a十c
bd
a+b+c+d
下列各组数据中,对于同一样本能说明
X与Y有关系的可能性最大的一组为
B
()。
A.a=2,b=3,c=3,d=7
B.a=1,b=4,c=2,d=8
C.a=1,b=4,c=4,d=1
D.a=9,b=1,c=4,d=1
1
D
6.为大力提倡“厉行节约,反对浪费”,某
4.对变量x,y有观测数据(x:,y:)(i=
大学通过随机询问100名学生能否做到光盘
1,2,3,…,10),得散点图(图1):对变量1,0
行动,得到如表2所示的列联表(单位:人)。
12
滴售盘多牧名费梨暂育中学生数理化
表2
若根据上表得到经验回归方程文=0,5x
光盘行动
十1gc,则该科技公司2026年云计算市场规
性别
做不到
能做到
模约为()。
女
46
9
A.108
B.10.3
男
31
14
C.10.8
D.10.3
二、多选题(本题共3小题,每小题6分,
附:X=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
共18分。在每个小题给出的四个选项中,有
表3
多项符合题目要求。全部选对的得6分,部
分选对得部分分,有选错的得0分)
a
0.1
0.05
0.01
0.005
9.下列说法正确的是()。
2.706
3.841
6.635
7.879
经计算X2心3.04。参考表3,则下列结
2(x:-x)(y:-y)
附:6=
,a=y-bx,
论正确的是()。
(x:-x)
=】
A.依据a=0.005的独立性检验,认为
2(y:-y)
“该校学生能否做到光盘行动与性别有关”
R2=1
B.依据a=0.01的独立性检验,认为“该
(y:-y)
:=1
校学生能否做到光盘行动与性别无关”
A.数据8,6,4,11,3,7,9,10的上四分
C.依据a=0.05的独立性检验,认为“该
位数为9
校学生能否做到光盘行动与性别有关”
B.某物理量的测量结果服从正态分布
D.依据α=0.1的独立性检验,认为“该
N(10,。),。越大,该物理量在一次测量中在
校学生能否做到光盘行动与性别无关”
(9.8,10.2)内的概率越小
7.两个线性相关变量u与o的统计数据
C.根据一组样本数据的散点图判断出两
如表4所示。
个变量线性相关,由最小二乘法求得其回归
表4
直线方程为y=0.4x十a,若其中一个散点坐
标为(-a,5.4),则a=9
3
4
6
5
D.将两个具有相关关系的变量x,y的
2.5ab
4
一组数据(x1,y1),(x,y2),…,(xm,ym)调
其回归直线方程为0=0.7u十0.35,若
整为(x1,y1+3),(x2,y+3),…,(xm,ym十
点(6,b)对应的残差为0.1,则a=(
)。
3),决定系数R2不变
A.2.85
B.3.05
10.为更好地促进同学们的动手能力,某
C.4.55
D.4.65
学校拟开展物理实验周活动,组织同学们到
8.近年来,我国云计算市场规模持续增
实验室中开展物理实验。在某个实验中,某
长。某科技公司云计算市场规模y与年份代
同学利用自已测量得出的实验数据(已知其
码x的关系可以用模型y=c·10拟合,设
中含1个异常样本点),利用最小二乘法进行
之=1gy,2019年至2023年的数据统计如表
计算得出了经验回归方程及决定系数R,并
5所示。
利用计算机处理得到了实验结果1(图3)。
表5
实验结果2(图4)为删除该异常样本点后利
年份
2019年2020年2021年2022年2023年
用最小二乘法进行计算得到的经验回归方程
年份代码x
2
3
4
5
及决定系数R,则()。
云计算市场
A.可认为该实验中的自变量与因变量
20
71
200
510
规模y
符合线性回归模型
z=lg y
0.85
1.3
1.85
2.3
2.7
B.推测实验结果1中的异常样本点的自
13
中学生数理化
演练篇名校名师创新卷
高二数学2026年5月
变量的值可能为0.33
择一个模拟函数,使它能近似地反映这些数
C.由于R<R:,则实验结果1相较于实
据的规律,应选一。(填序号)
验结果2拟合效果更好
13.某学习小组用计算机软件对一组数
D.实验结果1的因变量的平均值一定大
据(xy:)(i=1,2,3,…,8)进行回归分析,
于实验结果2的因变量的平均值
甲同学首先求出线性回归方程为y=2x+5,
实验结果1
实验结果2
样本点的中心为(2,m)。乙同学对甲的计算
过程进行检查,发现甲将数据(3,7)误输成
(7,3),数据(4,6)误输成(4,一6),将这两个
=53.093x-21.267
R=0.951
45.932r-18.45
数据修正后得到线性回归方程为夕-兰十
R-0.9944
图3
图4
k,则实数k=一。
11.已知由一组具有线性相关关系的样
14.某种机械设备随着使用年限的增加,
本数据(x1y1),(x2,y2),…,(xm,y)得到的
它的使用功能逐渐减退,使用价值逐年减少,
通常把使用价值逐年减少的“量”换算成费
回归直线方程为y=b1x十a1。现在增加一个
用,称之为失效费。某种机械设备的使用年
数据(,y),其中x=之xy=之y
限x(单位:年)与失效费y(单位:万元)的统
n=1
n=1
得到的新的回归直线方程为y=b,x+a,则
计数据如表7所示。
表7
)。
参考公式:相关系数
r=
使用年限x
1
23
4
5
67
失效费y
之(x:-x)(y:一y)
2.903.303.604.404.805.205.90
回归直线方程为
由上表数据可知,y与x的相关系数为
。(结果精确到0.01)
2(x:-x)(y:-y)
参考公式和数据:相关系数”=
y=bx+a,其中6=
,a=
(x-x)
2(x:-x)(y:-y)
=1
=
3(x-x)(y:一
y-bx。
(x-x)(y:-y)
=1
A.两条回归直线都一定过点(x,y)
y)=14.00,(y:-y)2=7.08,√198.24≈
B.a1=a2,b1=b2
14.10。
C.变化后相关系数r的值变大
四、解答题(本题共5小题,共77分。解
D.变化前后残差的平方和没变
答应写出文宇说明、证明过程或演算步骤)
三、填空题(本题共3小题,每小题5分,
15.(本小题13分)某科研机构对一座新
共15分)
型光伏电站持续监测九年(2017年至2025
12.某学校开展研究性学习活动,一组同
年),记录其日均发电量(单位:兆瓦时,
学获得了如表6所示的试验数据。
MWh),数据如下:2017年2.0MWh,2018
表6
年3.0MWh,2019年5.0MWh,2020年
x
1.99
37
45.1
4.0MWh,2021年5.0MWh,2022年
y
0.991.582.012.353.00
7.0MWh,2023年8.0MWh,2024年和2025
现有如下5个模拟函数:①y=0.58x
年均为10.0MWh。
0.16;②y=2-3.02:③3y=x2-5.5.x+8:
(1)求该电站这九年日均发电量的平均
数和方差。
④y=log2x;⑤y=
2
十1.74。请从中选
(2)为方便计算,将每年的日均发电量用y
14
演练筒数争校名师细新着中学生教理化
高二数学2026年5月
表示,将年份的编号用x表示,2017年编号为1,
频率分布直方图。根据频率分布直方图估计
2018年编号为2,以此类推。若近五年x和y的
这100天的日均销售量(同一组中的数据用
数据可看作线性关系,请利用最小二乘法求出y
该组区间的中点值代表)。
与x的回归方程,并预测2026年的日均发电量。
riyi-nxy
参考公式:回归方程y=a十bx中斜率
附:b
=
-,a=y-6x,X2=
和截距的最小二乘估计公式分别为=
2x-nx
=1
-)-
n(ad-bc)?
-,a=y-bx。
(a+b)(c+d)(a+c)(b+d)'n=a+b+c
(x:-x)
+d。
三1
16.(本小题15分)某超市正在销售一种
表10
饮品,销售人员发现日销售量与当日的气温
0.1
0.05
0.01
0.005
0.001
有关,随着气温的升高,销售量也有明显的增
2.706
3.841
6.635
7.879
10.828
加,表8是该超市连续五天的日销售情况。
17.(本小题15分)预防接种是预防传染
表8
病最经济、最有效的手段,是预防疾病传播和
温度/℃
19,20)
「20,21)厂21,22)
「22,23)
「23,24)
保护群众的重要措施。为考查一种新疫苗预
温度变量x
1
2
3
4
5
防某一疾病的效果,研究人员对一地区某种
销售量y:/万份
0.3
0.3
0.5
0.9
1
动物(数量较大)进行试验,从该试验群中随
其中i=1,2,3,4,5,温度变量x:对应的
机抽查了50只,得到如表11所示的样本数
销售量为y:。
据(单位:只)。
(1)建立销售量关于温度变量的一元线
表11
性回归模型,并估计温度在[24,25)区间时该
发病没发病合计
饮品的日销售量。
接种疫苗
18
25
(2)为了解消费群体中男、女对该饮品的
没接种疫苗
19
6
25
喜欢程度,销售人员随机采访了220名消费
合计
26
24
50
者,将他们的意见进行统计,得到了如表9所
示的2×2列联表。
(1)参考表12,能否在犯错误的概率不
表9
超过0.001的前提下,认为接种该疫苗与预
防该疾病有关?
喜欢
一般
合计
(2)从该地区此动物群中任取一只,记A
女
90
20
110
表示此动物发病,A表示此动物没发病,B表
男
70
40
110
示此动物接种疫苗,定义事件A的优势R,
合计
160
60
220
-PA),在事件B发生的条件下A的优势
P(A)
参考表10,依据小概率值a=0.01的独
立性检验,分析对饮品的喜欢程度是否与性
P(AB)
R,
别有关联。
R,=1一PAB,利用抽样的样本数据,求R
(3)超市销售该饮品一个阶段后,统计了
的估计值。
100天的日销售量,将100个样本数据分成
附:X2=
n(ad-bc)2
[1,3),[3,5),频率m电个
(a+b)(c+d)(a+c)(b+d)'
0.150
其中n=a十b+c+d。
[5,7),[7,9),
0.125
0.100
0.075
表12
[9,11)(单位:千
0.050
份)五组,并绘制
0.050
0.010
0.001
1357.911销售量/仟份
了如图5所示的
3.841
6.635
10.828
图5
15
中学生表理化离链皱学名放条留新整
18.(本小题17分)为研究吸烟是否与肺
1.5,3.5,5.5(单位:元)。以这100件产品的
癌有关,某肿瘤研究所采取有放回简单随机
性能指数位于各区间的频率代替产品的性能
抽样的方法,调查了m(m∈N",单位:千)
指数位于各区间的概率。
人,其中吸烟患肺癌约0.4m人,吸烟不患肺
频率阻即个
癌约0.1m人,不吸烟患肺癌约0.2m人,不
88
0.020
吸烟不患肺癌约0.3n人。
0.017
0.011
(1)根据以上数据,将下面的2×2列联
0.004
表(表13)补充完整。
0007080901010性能指衣
表13
图6
合计
(1)求每件产品的平均销售利润。
(2)该公司为了解年营销费用x(单位:
万元)对年销售量y(单位:万件)的影响,对
合计
近5年的年营销费用x:和年销售量y:(i=
1,2,3,4,5)数据做了初步处理,得到散点图
(2)参考表14,根据小概率值&=0.010的
(图7)及一些统计量的值(表15)。
独立性检验,分析吸烟与患肺癌是否有关联。
年销售量(万作)
(3)现采用是否患肺癌的分层抽样方式,
从不吸烟人群中随机抽取5人,再从这5人
87
中随机抽取3人,记这3人中不患肺癌的人
数为7,求?的分布列和数学期望。
华皆第费州H万买
附:X2
n(ad-bc)2
01020304050607080
(a+b)(c+d)(a+c)(b+d)
图7
表14
表15
0.100
0.050
0.010
u
2(,-u)(u:-v)
2.706
3.841
6.635
16.30
24.87
0.41
1.64
19.(本小题17分)某公司研发了一种帮
表中u:=lnx,o=lny,u=
助家长解决孩于早教问题的萌宠机器人。萌
宠机器人的语音功能让它就像孩于的小伙伴
0-
5
根据散点图判断,y=a·x可以作
一样和孩于交流,记忆功能还可以记住孩于的
为年销售量y关于年营销费用x的回归方程。
使用习惯,很快找到孩于想听的内容。同时提
(i)建立y关于x的回归方程:
供快乐儿歌、国学经典、启蒙英语等阜期教有
(i)用所求的回归方程估计该公司应投
内容,且云端内容可以持续更新。萌宠机器人
入多少营销费用,才能使得该产品一年的收
一投放市场就受到了很多家长的欢迎。为了
益达到最大。(收益=销售利润一营销费用,
更好地服务广大家长,该公司研究部门从流水
取e4.19=64)
线上随机抽取100件萌宠机器人(以下简称产
参考公式:对于一组数据(u1,o1),(u2,
品),统计其性能指数并绘制频率分布直方图
v),…,(um,0n),其回归直线0=&十u的斜
(图6)。产品的性能指数在[50,70)的适合托
班幼儿使用(简称A类产品),在[70,90)的适
率和截距的最小二乘估计分别为=
合小班和中班幼儿使用(简称B类产品),在
之(u:-u)(o:-o)
[90,110)的适合大班幼儿使用(简称C类产
,a=v-Bu.
之(u:-u)
品),A,B,C三类产品的销售利润分别为每件
i=1
(责任编辑赵倩)
16