内容正文:
重点题型针对训练---统计与统计案例
一、变量间的相关关系
例1:(2024·天津·高考真题)下列图中,线性相关性系数最大的是( )
A. B.
C. D.
【答案】A
【知识点】根据散点图判断是否线性相关
【分析】由点的分布特征可直接判断
【详解】观察4幅图可知,A图散点分布比较集中,且大体接近某一条直线,线性回归模型拟合效果比较好,呈现明显的正相关,值相比于其他3图更接近1.
故选:A
变式训练:
1.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
【答案】B
【知识点】判断正、负相关
【分析】根据散点图点的变化关系确定正负相关性即可.
【详解】由变量,的散点图,知随增大,也增大,变量与正相关,
由变量,的散点图,知随增大,减小,与负相关.
故选:B
2.(2025·天津·二模)为研究某奶茶店每日的热奶茶销售量和气温之间是否具有线性相关关系,统计该店(2025年2月6日至3月24日)每天的热奶茶销售量及当天气温得到如图所示的散点图(轴表示气温,轴表示热奶茶销售量),由散点图可知与的相关关系为( )
A.正相关,相关系数的值为0.8 B.负相关,相关系数的值为0.8
C.正相关,相关系数的值为 D.负相关,相关系数的值为
【答案】D
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】根据正负相关的概念判断.
【详解】由散点图知随着的增大而减小,因此是负相关.相关系数为负.
故选:D.
3.(24-25高三·上海·随堂练习)已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
【答案】C
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】根据线性相关系数越接近1,表示两个变量之间的相关性越强,线性相关系数的正负表示两个变量之间呈正相关关系或负相关关系.
【详解】因为线性相关系数,,
所以变量x与y之间呈正相关关系,变量u与v之间呈负相关关系.
因为|r|越接近1,两个变量的线性相关程度越高,所以x与y之间的相关性弱于u与v之间的相关性.
故选:C.
4.(2025·四川德阳·三模)下列结论不正确的是( )
A.两个变量的线性相关系数反映了两个变量线性相关程度的强弱,且越大,线性相关性越强
B.若两个变量的线性相关系数,则之间不具有线性相关性
C.由简单随机抽样得到的成对样本数据的样本相关系数不一定能确切地反映变量之间的相关关系.
D.在一组样本数据的散点图中,若所有的样本点都在直线上,则这组样本数据的相关系数为0.8
【答案】D
【知识点】相关系数的意义及辨析
【分析】根据相关系数的概念和性质逐项分析判断.
【详解】对于A,线性相关系数反映了两个变量线性相关程度的强弱,且越大,线性相关性越强,A正确;
对于B,变量的线性相关系数,则之间不具有线性相关性,B正确;
对于C,成对样本数据的样本相关系数反映变量间相关性强弱,不一定能确切地反映变量之间的相关关系,C正确;
对于D,样本点都在直线上,则这组样本数据的相关系数为1,D错误.
故选:D
5.(2025·宁夏银川·一模)有一散点图如图所示,在5个数据中去掉后,下列说法错误的是( )
A.残差平方和变小 B.相关系数r变大
C.决定系数变大 D.解释变量x与响应变量y的相关性变弱
【答案】D
【知识点】判断正、负相关、相关系数的意义及辨析、残差的计算
【分析】利用散点图分析数据,判断相关系数,相关指数,残差的平方和的变化情况.
【详解】从散点图可分析出,若去掉D点,
则解释变量x与响应变量y的线性相关性变强,且是正相关,
所以相关系数r变大,决定系数变大,残差平方和变小,
故选:D.
例2:(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的经验回归方程为,根据以上信息,如下判断正确的为( )
A.花瓣长度和花萼长度不存在相关关系
B.花瓣长度和花萼长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为
D.若从样本中抽取一部分,则这部分的相关系数一定是
【答案】C
【知识点】判断正、负相关、相关系数的意义及辨析
【分析】根据散点图的特点及经验回归方程可判断ABC选项,根据相关系数的定义可以判断D选项.
【详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误
散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,
把代入可得,C选项正确;
由于是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是,D选项错误
故选:C
变式训练:
1.(2025·辽宁锦州·二模)5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了1至5月份5G手机的实际销量,如下表所示:
月份x
1月
2月
3月
4月
5月
销售量y(千只)
0.5
0.6
1.0
1.4
1.7
若y与x线性相关,且求得线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,
B.由题中数据可知,6月份该商城5G手机的实际销量为2(千只)
C.由题中数据可知,变量x和y正相关,且相关系数一定小于1
D.若不考虑本题中的数据,回归直线可能不过,,…,中任一个点
【答案】B
【知识点】解释回归直线方程的意义、计算样本的中心点、根据回归方程进行数据估计、根据样本中心点求参数
【分析】根据题意,由回归直线方程的性质,对选项逐一判断,即可得到结果.
【详解】对于A,由表格可知,,,
则,故A正确;
对于B,将代入,可得,
所以6月份该商城5G手机的实际销量预测为2(千只),故B错误;
对于C,因为回归方程为,所以变量x和y正相关,
且样本点不全在回归方程上,所以相关系数一定小于1,故C正确;
对于D,回归直线可能不过样本点中的任何一个点,故D正确;
故选:B
2.(2025·天津·二模)小明研究温差(单位:)与本单位当天新增感冒人数(单位:人)的关系,他记录了5天的数据:
3
4
5
6
7
16
20
25
28
36
由表中数据求得温差与新增感冒人数满足经验回归方程,则下列结论不正确的是( )
A.与正相关 B.经验回归直线经过点
C.当时,残差为1.8 D.
【答案】C
【知识点】判断正、负相关、残差的计算、计算样本的中心点、根据样本中心点求参数
【分析】观察数据或者求得,可知正相关,从而判定A;利用样本中心点在回归直线上,可以判定B;求出b的估计值,进而计算残差,从而判定CD.
【详解】选项A:观察数据,增大时也增大,说明正相关,故A正确;
选项B: 易得,,样本中心点为,回归直线方程经过样本中心点,故B正确;
将样本中心点坐标代入回归直线方程得
,故D正确.
计算预测值,实际值,
残差.
题目中残差为1.8(未考虑符号),故C错误,
故选:C
3.(2025·上海长宁·二模)某书店为了分析书籍销量与宣传投入之间的关系,对宣传投入x(千元)和书籍销量y(百本)的情况进行了调研,并统计得到表中几组对应数据,同时用最小二乘法得到y关于x的线性回归方程为,则下列说法不正确的是( )
x
3
4
5
6
y
5
6.2
7.4
m
A.变量x、y之间呈正相关 B.预测当宣传投入2千元时,书籍销量约为400本
C. D.拟合误差
【答案】C
【知识点】判断正、负相关、用回归直线方程对总体进行估计、根据回归方程进行数据估计、根据样本中心点求参数
【分析】根据线性回归方程即可判断;将代入线性回归方程即可判断;由在线性回归方程上,即可求解;根据拟合误差计算公式求解即可.
【详解】因为线性回归方程为,,
所以变量x、y之间呈正相关,故正确;
当时,(百本),所以书籍销量约为400本,故正确;
由表中数据可得,,
所以,解得,故错误;
当时,,,
当时,,,
当时,,,
当时,,,
所以,故正确.
故选:.
4.(2025·山东聊城·二模)为了研究某市高中生的脚长(单位:cm)和身高(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生做调查,经统计,所调查数据的,根据最小二乘法算得脚长和身高的经验回归方程为.已知被调查的某学生的脚长为25cm,身高180cm,则该样本点的残差为( )
A.1cm B.cm C.4cm D.cm
【答案】D
【知识点】残差的计算、根据样本中心点求参数
【分析】根据回归方程必过点求出,即可得到回归方程,再根据残差的定义计算可得.
【详解】因为,又经验回归方程必过点,
所以,解得,所以,
当时,
所以该样本点的残差为.
故选:D
5.(2025·河南·三模)人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为市统计的2024年11月至2025年3月这5个月该市AI电脑的月销量,其中为月份代号,(单位:万台)为AI电脑的月销量.
月份
2024年11月
2024年12月
2025年1月
2025年2月
2025年3月
月份代号
1
2
3
4
5
月销量
0.5
0.9
1
1.2
1.4
经过分析,与线性相关,且其线性回归方程为,则2025年3月的残差为( )(实际值与预计值之差)
A. B. C.0.02 D.0.04
【答案】B
【知识点】残差的计算、计算样本的中心点、根据回归方程进行数据估计
【分析】求出样本中心点,带入回归方程求出,在求出对应的月销量预测值,结合月销量求出残差
【详解】因为,
所以,所以关于的线性回归方程为,
2025年3月对应的,故此时残差为.
故选:B.
二、独立性检验
例3:(2025·甘肃金昌·二模)某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20.下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.有的把握认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
【答案】B
【知识点】独立性检验的概念及辨析、独立性检验解决实际问题
【分析】求得卡方值,比对临界值,逐个判断即可.
【详解】由题意,列出列联表:
接受
不接受
合计
男
40
60
100
女
20
80
100
合计
60
140
200
零假设为:是否接受去外地长时间出差与性别相互独立,即是否接受去外地长时间出差与性别无关,
所以,
根据小概率值的独立性检验,我们推断不成立,
即认为是否接受去外地长时间出差与性别有关,此推断犯错误的概率不大于0.005.
故选:B.
变式训练:
1.(2023·甘肃兰州·模拟预测)为了检测某种新药的效果,现随机抽取100只小白鼠进行试验,得到如下列联表:
未治愈
治愈
合计
服用药物
10
40
50
未服用药物
20
30
50
合计
30
70
100
则下列说法一定正确的是( )
附:(其中).
临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
B.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
C.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
D.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
【答案】A
【知识点】卡方的计算、独立性检验的基本思想、独立性检验解决实际问题
【分析】根据表中数据求出的值,即可得答案.
【详解】解:由列联表中数据,计算,
且,
所以有的把握认为“小白鼠是否被治愈与是否服用新药有关”
所以在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”.
故选:A.
2.(2024·山东枣庄·一模)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的列联表:
疗法
疗效
合计
未治愈
治愈
甲
15
52
67
乙
6
63
69
合计
21
115
136
经计算得到,根据小概率值的独立性检验(已知独立性检验中),则可以认为( )
A.两种疗法的效果存在差异
B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005
C.两种疗法的效果没有差异
D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005
【答案】C
【知识点】独立性检验的概念及辨析、独立性检验解决实际问题
【分析】根据条件可得列联表,计算的值,结合临界值表可得结论.
【详解】零假设为:疗法与疗效独立,即两种疗法效果没有差异.
根据列联表中的数据,,根据小概率值的独立性检验,
没有充分证据推断不成立,
因此可以认为成立,
即认为两种疗法效果没有差异.
故选:C.
3.(2024·黑龙江·二模)根据分类变量x与y的成对样本数据,计算得,依据的独立性检验,结论为( )参考值:
0.1
0.05
0.01
2.706
3.841
6.635
A.x与y不独立
B.x与y不独立,这个结论犯错误的概率不超过0.05
C. x与y独立
D.x与y独立,这个结论犯错误的概率不超过0.05
【答案】C
【知识点】独立性检验的基本思想、独立性检验解决实际问题
【分析】利用独立性检验的基本思想即可得解.
【详解】零假设为:x与y独立,
由,依据的独立性检验,可得成立,
故可以认为x与y独立.
故选:C.
4.(2024·江苏盐城·模拟预测)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到,则( )
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.变量Ⅰ与Ⅱ相关
B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1
C.变量Ⅰ与Ⅱ不相关
D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1
【答案】B
【知识点】独立性检验的基本思想
【分析】根据独立性检验的原理,将与临界值表比较,即可得结论.
【详解】零假设为:变量Ⅰ与Ⅱ不相关,
因为,
依据得独立性检验可知,推断不成立,
即认为变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1,
故选:B
5.(2025·上海·模拟预测)在研究“温度是否影响庄稼生长”时,对实验数据利用2×2列联表进行独立性检验,计算得实验数据的统计量的值为.已知,则( )
A.的值小于3.841,就有95%的把握认为“温度会影响庄稼生长”
B.的值大于3.841,就有95%的把握认为“温度会影响庄稼生长”
C.的值越大,说明实验数据的观测值与预测值的总体偏差越小
D.的值越小,说明实验数据的观测值与预测值的总体偏差越大
【答案】B
【知识点】独立性检验解决实际问题
【分析】根据独立性检验判断各个选项即可.
【详解】因为,则的值大于3.841,
就有95%的把握认为“温度会影响庄稼生长”,A选项错误,B选项正确;
的值的大小不能说明实验数据的观测值与预测值的总体偏差,C,D选项错误.
故选:B.
6.(2025·四川·三模)为考察某种药物对预防疾病的效果,进行了动物试验,根据120个有放回随机样本的数据,得到如下列联表:
药物
疗效
合计
未患疾病
患疾病
未服用
10
50
60
服用
18
42
60
合计
28
92
120
经计算得到,根据小概率值的独立性检验(已知独立性检验中),结论为( )
A.药物对预防疾病没有效果
B.药物对预防疾病没有效果,这种判断犯错误的概率不超过
C.药物对预防疾病有效果
D.药物对预防疾病有效果,这种判断犯错误的概率不超过
【答案】A
【知识点】独立性检验的基本思想
【分析】根据独立性检验的判断方法,结合已知条件,即可判断和选择.
【详解】设零假设:药物对预防疾病没有效果;因为,
故零假设不成立,药物对预防疾病没有效果.
故选:A.
三、统计综合辨析
例4:(2025·天津·一模)下列说法中,不正确的是( )
A.在1,3,6,7,9,10,12,15这组数据中,第50百分位数为8
B.分类变量A与B的统计量越大,说明“A与B有关系”的可信度越大
C.根据具有线性相关关系的两个变量的统计数据所得的经验回归方程为,若,,,则
D.两个模型中,残差平方和越大的模型拟合的效果越好
【答案】D
【知识点】残差的计算、独立性检验的基本思想、根据样本中心点求参数、总体百分位数的估计
【分析】求数据的第50百分位数,判断A的真假;根据的意义,判断B的真假;根据线性回归方程必过求判断C的真假;根据残差平方和的意义判断D的真假.
【详解】对A:因为,所以这组数据的第50百分位数为:,故A选项内容正确;
对B:根据统计量的意义可知,B选项内容正确;
对C:根据线性回归方程必过得:,故C选项内容正确;
对D:因为残差平方和越小,模型拟合的效果越好,故D选项内容错误.
故选:D
变式训练:
1.(24-25高三上·天津北辰·阶段练习)下列说法正确的是( )
A.若两个随机变量的线性相关性越强,则相关系数的值越接近于1
B.根据分类变量与的成对样本数据,计算得到.依据的独立性检验(),可判断与无关
C.对具有线性相关关系的变量,,其线性回归方程为,若样本点的中心为,则实数的值是.
D.已知随机变量服从二项分布,若,则.
【答案】C
【知识点】相关系数的意义及辨析、独立性检验解决实际问题、二项分布的均值、根据样本中心点求参数
【分析】根据两个随机变量的线性相关性的强弱与相关系数的关系即可判断A;根据卡方检验即可判断B,利用线性回归方程必过样本中心点,即可判断选C;利用二项分布的数学期望计算公式以及期望的运算性质,即可判断D.
【详解】对于A,若两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,故A错误;
对D,由可判断X与Y有关,故B错误;
对于C:因为线性回归直线过样本点中心,所以,可得,故C正确;
对于D:因为随机变量服从二项分布,所以,
2.(2025·天津·一模)下列说法错误的是( )
A.若随机变量,则当较小时,对应的正态曲线“瘦高”,随机变量的分布比较集中
B.在做回归分析时,可以用决定系数刻画模型的回归效果,若越大,则说明模型拟合的效果越好
C.若样本数据的平均数为3,则的平均数为10
D.一组数据6,7,7,8,10,12,14,16,19,21的第30百分位数为7
【答案】D
【知识点】计算几个数的平均数、相关指数的计算及分析、概率分布曲线的认识、总体百分位数的估计
【分析】由正态分布的性质,可得A的正误;由决定系数的作用,可得B的正误;由平均数的计算公式,可得C的正误;由百分位数的计算,可得D的正误.
【详解】对于A,由为标准差,该值越小,数据越集中,则曲线越高瘦,故A正确;
对于B,当决定系数越大时,残差平方和越小,即模型拟合的效果越好,故B正确;
对于C,由,则,故C正确;
对于D,由,由,则第百分位数为,故D错误.
故选:D.
3.(2024·江苏南京·模拟预测)给出下列说法,其中正确的是( )
A.某病8位患者的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为
B.已知数据的平均数为2,方差为3,那么数据,,的平均数和方差分别为5,13
C.在回归直线方程中,相对于样本点的残差为
D.样本相关系数
【答案】C
【知识点】各数据同时乘除同一数对方差的影响、相关系数的意义及辨析、根据回归方程进行数据估计、总体百分位数的估计
【分析】根据百分位数的概念可判断A的真假;根据两组相关数据的平均数和方差的计算方法判断B的真假;计算残差判断C的真假;根据相关系数的取值范围判断D.
【详解】对A:将3,3,8,4,2,7,10,18由小到大排列为2,3,3,4,7,8,10,18,第50百分位数即为中位数,这组数的中位数为,所以A错误;
对B:由数据的平均数为2,方差为3,则数据,,的平均数为,方差为,所以B错误;
对C:残差,故C正确;
对D:样本的相关系数应满足,所以D错误.
故选:C
4.(24-25高三上·山西运城·开学考试)下列说法错误的是( )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
【答案】C
【知识点】抽样比、样本总量、各层总数、总体容量的计算、相关系数的意义及辨析、独立性检验解决实际问题、总体百分位数的估计
【分析】利用分层抽样计算判断A;求出第75百分位数判断B;利用线性相关系数的意义判断C;利用独立性检验的思想判断D.
【详解】对于A,该校高一年级女生人数是,A正确;
对于B,由,得第75百分位数为,B正确;
对于C,线性回归方程中,线性相关系数绝对值越大,两个变量的线性相关性越强,C错误;
对于D,由,可判断与有关联,此推断犯错误的概率不大于0.05,D正确.
故选:C
5(24-25高三上·天津北辰·阶段练习)下列说法正确的是( )
A.若两个随机变量的线性相关性越强,则相关系数的值越接近于1
B.根据分类变量与的成对样本数据,计算得到.依据的独立性检验(),可判断与无关
C.对具有线性相关关系的变量,,其线性回归方程为,若样本点的中心为,则实数的值是.
D.已知随机变量服从二项分布,若,则.
【答案】C
【知识点】相关系数的意义及辨析、独立性检验解决实际问题、二项分布的均值、根据样本中心点求参数
【分析】根据两个随机变量的线性相关性的强弱与相关系数的关系即可判断A;根据卡方检验即可判断B,利用线性回归方程必过样本中心点,即可判断选C;利用二项分布的数学期望计算公式以及期望的运算性质,即可判断D.
【详解】对于A,若两个随机变量的线性相关性越强,则相关系数的绝对值越接近于1,故A错误;
对D,由可判断X与Y有关,故B错误;
对于C:因为线性回归直线过样本点中心,所以,可得,故C正确;
对于D:因为随机变量服从二项分布,所以,
则,
因为,则,所以,故D错误.
故选:C.
6.(24-25高三上·四川遂宁·阶段练习)下列说法错误的是( )
A.线性相关系数越接近1,两个变量的线性相关程度越强;
B.独立性检验可以100%确定两个变量之间是否具有某种关系;
C.在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
D.甲、乙两个模型的决定系数分别约为0.88和0.80,则模型甲的拟合效果更好.
【答案】B
【知识点】根据散点图判断是否线性相关、相关系数的意义及辨析、残差的计算、独立性检验的概念及辨析
【分析】利用线性相关系数、独立性检验、残差图、决定系数等相关概念,逐一判断选项即可得出结论.
【详解】对于A,根据线性相关系数的定义可判断A正确;
对于B,独立性检验是存在某种程度的错误概率的,因此可得B错误;
对于C,利用回归分析残差概念以及残差图可判断C正确;
对于D,决定系数的值越大,说明拟合效果越好,显然,即模型甲的拟合效果更好,可得D正确.
故选:B
7.(2024·天津北辰·模拟预测)下列命题中,不正确的是( )
A.若随机变量,则
B.若随机变量,且,则
C.若,,则的最小值为
D.两个随机变量的相关系数越大,两个变量的线性相关性越强
【答案】D
【知识点】基本不等式求和的最小值、相关系数的意义及辨析、二项分布的方差、指定区间的概率
【分析】对于A,由二项分布方差公式计算即可;对于B,由正态分布的对称性计算即可;对于C,由基本不等式计算即可;对于D,根据相关系数的意义即可判断.
【详解】对于A,随机变量,由二项分布方差公式得,故A正确;
对于B,随机变量,由正态分布的对称性得,故B正确;
对于C,由,则,
所以
当且仅当,则或取等号,故C正确;
对于D,线性相关系数的范围在到之间,有正有负,相关有正相关和负相关,
相关系数的绝对值的大小越接近于,两个变量的线性相关性越强;
反之,线性相关性越弱,故D错误.
故选:D.
8.(2025·天津河东·二模)2024年12月26日,Deep Seek—V3首个版本正式上线,截至2025年2月9日,Deep Seek APP的累计下载量已超1.1亿次,AI成为当下的热门话题.立德中学高中数学社团以16至40岁人群使用Deep Seek频率为课题,分小组自主选题进行调查研究,下列说法正确的是( )
A.甲小组开展了Deep Seek每周使用频次与年龄的相关性研究,经计算样本相关系数,可以推断两个变量正线性相关,但相关程度很弱
B.乙小组利用最小二乘法得到Deep Seek每周使用频次y关于年龄x的经验回归方程为,可以推断年龄为30岁的群体每周使用频次一定为17次
C.丙小组用决定系数来比较模型的拟合效果,经验回归方程①和②的分别约为0.733和0.998,因此经验回归方程②的刻画效果比经验回归方程①的好很多
D.丁小组研究性别因素是否影响Deep Seek使用频次,根据小概率值的独立性检验,计算得到,可以认为不同性别的Deep Seek使用频次没有差异
【答案】C
【知识点】相关系数的意义及辨析、相关指数的计算及分析、独立性检验解决实际问题、根据样本中心点求参数
【分析】由相关系数,回归方程,决定系数,卡方的检验逐项判断即可.
【详解】对于A,由的绝对值越接近1,相关性越强可得A错误,故A错误;
对于B,回归方程为给出的是预测值,实际值会有随机误差,所以年龄为30岁的群体每周使用频次不一定为17次,故B错误;
对于C,表示模型对因变量的解释比例,大说明经验回归方程②的刻画效果比经验回归方程①的好很多,故C正确;
对于D,,可以认为不同性别的Deep Seek使用频次有差异,故D错误.
故选:C
四、用样本估计总体
例5:(2025·湖南长沙·一模)对于数据,下列说法错误的是( )
A.平均数为5 B.众数为6
C.极差为10 D.中位数为6
【答案】D
【知识点】计算几个数的众数、计算几个数的中位数、计算几个数的平均数、计算几个数据的极差、方差、标准差
【分析】利用平均数,众数,极差,中位数的意义计算可判断每个选项的正误.
【详解】平均数为,故A正确;众数为6,故B正确;
极差为,故C正确;数据的中位数为5,故D错误.
故选:D.
变式训练:
1.(2025·甘肃庆阳·二模)样本数据15,13,12,31,29,25,43,19,17,38的中位数为( ).
A.19 B.22 C.21 D.18
【答案】B
【知识点】计算几个数的中位数
【分析】根据中位数定义计算即可得出结果.
【详解】将样本数据从小到大重新排列为12,13,15,17,19,25,29,31,38,43;
共10个数据,因此中位数应为第5个数和第6个数的平均数,即.
故选:B
2.(2025·河北秦皇岛·三模)数据16,22,13,14,25,17,18,19,21,10的第70百分位数是( )
A.18 B.19 C.20 D.21
【答案】C
【知识点】总体百分位数的估计
【分析】将给定数据由小到大排列,再利用第70百分位数的定义求解.
【详解】将给定数据由小到大排列为:10,13,14,16,17,18,19,21,22,25,
由,得第70百分位数是.
故选:C
3.(2025·江西萍乡·二模)已知一组数据为:123,117,117,121,122,120,116,114,120,119,则这组数据的分位数是( )
A.114 B.115 C.120.5 D.121
【答案】D
【知识点】总体百分位数的估计
【分析】根据百分位数公式,即可求解.
【详解】共10个数据,按顺序排列为:114,116,117,117,119,120,120,121,122,123,
,
则第75%分位数是第8个数据121,
故选:D.
4.(2020·全国III卷·高考真题)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
【答案】C
【知识点】计算几个数据的极差、方差、标准差
【分析】根据新数据与原数据关系确定方差关系,即得结果.
【详解】因为数据的方差是数据的方差的倍,
所以所求数据方差为
故选:C
【点睛】本题考查方差,考查基本分析求解能力,属基础题.
例6:(2022·天津·高考真题)将1916到2015年的全球年平均气温(单位:),共100个数据,分成6组:,并整理得到如下的频率分布直方图,则全球年平均气温在区间内的有( )
A.22年 B.23年 C.25年 D.35年
【答案】B
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】由频率分布直方图可得所求区间的频率,进而可以求得结果.
【详解】全球年平均气温在区间内的频率为,
则全球年平均气温在区间内的有年.
故选:B.
变式训练:
1.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
【答案】D
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】利用频率分布直方图可计算出评分在区间内的影视作品数量.
【详解】由频率分布直方图可知,评分在区间内的影视作品数量为.
故选:D.
2.(2020·天津·高考真题)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A.10 B.18 C.20 D.36
【答案】B
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量
【分析】根据直方图确定直径落在区间之间的零件频率,然后结合样本总数计算其个数即可.
【详解】根据直方图,直径落在区间之间的零件频率为:,
则区间内零件的个数为:.
故选:B.
【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题.
3.(2025·山西·二模)AI正悄然改变着我们的生活.某在线平台利用AI技术为学生提供个性化学习路径,为了解学生对平台的满意程度,随机抽取使用该平台的学生进行打分,将收集到的分数数据按照分组,画出频率分布直方图如图所示,则这些数据的中位数约为( )
A.85 B.80 C.77.5 D.75
【答案】C
【知识点】由频率分布直方图估计中位数
【分析】根据中位数的意义,在样本中,有的个体小于或等于中位数,也有的个体大于或等于中位数,然后解题即可.
【详解】由于,,
因此中位数落在区间内,设中位数为,
由,得,因此,中位数约为77.5.
故选:C
4.(2025·黑龙江·二模)某学校为了拓展学生的国际视野,培养学生的创新精神,让学生学有动力,学有信心,举办了英语手抄报比赛.为了解考生的成绩情况,抽取了样本容量为的部分考生成绩,得到如图所示的频率分布直方图,则估计考生成绩的第70百分位数为( )
A.74 B.75 C.76 D.77
【答案】C
【知识点】总体百分位数的估计
【分析】结合百分位数的计算公式,代入计算,即可得到结果.
【详解】由频率分布直方图可知,考生成绩的第70百分位数为.
故选:C.
5.(2025·天津和平·二模)某人工智能公司为优化新开发的语言模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,图中,则下列结论不正确的是( )
A. B.满意度计分的众数约为75分
C.满意度计分的平均分约为79分 D.满意度计分的第一四分位数约为70分
【答案】C
【知识点】由频率分布直方图计算频率、频数、样本容量、总体容量、由频率分布直方图估计平均数、总体百分位数的估计、根据频率分布直方图计算众数
【分析】由频率分布直方图的面积和为1可得A正确;由频率分布直方图计算众数,平均数,第一四分位数可得B正确,C错误,D正确.
【详解】对于A,由频率分布直方图可得,
又,解得,故A正确;
对于B,由频率分布直方图可得,满意度计分的众数为最高矩形底边中点横坐标75分,故B正确;
对于C,满意度计分的平均分约为,故C错误;
对于D,前两组的频率之和为,所以满意度计分的第一四分位数约为70分,故D正确.
故选:C
6.(2025·黑龙江辽宁·模拟预测)为了了解某小区居民月用电情况,供电部门从该小区随机抽取100户居民进行月用电量调查,统计他们的月用电量(单位:kW·h),将数据整理后绘制成如图所示的频率分布直方图(每组为左闭右开的区间).
用样本估计总体,则下列说法中正确的个数是( )
①本小区居民月用电量的分位数不小于200kW·h;②本小区居民月用电量的平均数位于中;③本小区居民月用电量的众数为225kW·h;④本小区居民月用电量的极差位于中.
A.1 B.2 C.3 D.4
【答案】C
【知识点】由频率分布直方图估计平均数、总体百分位数的估计
【分析】通过计算各区间频率,利用频率和判断分位数范围,以组中值与对应频率乘积之和算平均数,根据最高矩形底边中点求众数,用第一组和最后一组区间端点来估计极差的范围,从而对各说法正误进行判断.
【详解】由题意各区间的频率分别为:.
计算前四个区间频率和为,
前三个区间频率和为,
则分位数在,即本小区居民月用电量的分位数不小于200kW·h,故①正确;
kW·h,故②正确;
由图可知,本小区居民月用电量的众数为kW·h,故③错误;
由,可知,本小区居民月用电量的极差位于中,故④正确;
故选:C
学科网(北京)股份有限公司
$$
重点题型针对训练---统计与统计案例
一、变量间的相关关系
例1:(2024·天津·高考真题)下列图中,线性相关性系数最大的是( )
A. B.
C. D.
变式训练:
1.(2025·天津河西·一模)对变量,有观测数据,得散点图;对变量,有观测数据,得散点图2.由这两个散点图可以判断( )
A.变量与正相关,与正相关 B.变量与正相关,与负相关
C.变量与负相关,与正相关 D.变量与负相关,与负相关
2.(2025·天津·二模)为研究某奶茶店每日的热奶茶销售量和气温之间是否具有线性相关关系,统计该店(2025年2月6日至3月24日)每天的热奶茶销售量及当天气温得到如图所示的散点图(轴表示气温,轴表示热奶茶销售量),由散点图可知与的相关关系为( )
A.正相关,相关系数的值为0.8 B.负相关,相关系数的值为0.8
C.正相关,相关系数的值为 D.负相关,相关系数的值为
3.(24-25高三·上海·随堂练习)已知表示变量x与y之间的相关系数,表示变量u与v之间的相关系数,且,,则( )
A.变量x与y之间呈正相关关系,且x与y之间的相关性强于u与v之间的相关性
B.变量x与y之间呈负相关关系,且x与y之间的相关性强于u与v之间的相关性
C.变量u与v之间呈负相关关系,且x与y之间的相关性弱于u与v之间的相关性
D.变量u与v之间呈正相关关系,且x与y之间的相关性弱于u与v之间的相关性
4.(2025·四川德阳·三模)下列结论不正确的是( )
A.两个变量的线性相关系数反映了两个变量线性相关程度的强弱,且越大,线性相关性越强
B.若两个变量的线性相关系数,则之间不具有线性相关性
C.由简单随机抽样得到的成对样本数据的样本相关系数不一定能确切地反映变量之间的相关关系.
D.在一组样本数据的散点图中,若所有的样本点都在直线上,则这组样本数据的相关系数为0.8
5.(2025·宁夏银川·一模)有一散点图如图所示,在5个数据中去掉后,下列说法错误的是( )
A.残差平方和变小 B.相关系数r变大
C.决定系数变大 D.解释变量x与响应变量y的相关性变弱
例2:(2023·天津·高考真题)鸢是鹰科的一种鸟,《诗经·大雅·旱麓》曰:“鸢飞戾天,鱼跃余渊”. 鸢尾花因花瓣形如鸢尾而得名,寓意鹏程万里、前途无量.通过随机抽样,收集了若干朵某品种鸢尾花的花萼长度和花瓣长度(单位:cm),绘制散点图如图所示,计算得样本相关系数为,利用最小二乘法求得相应的经验回归方程为,根据以上信息,如下判断正确的为( )
A.花瓣长度和花萼长度不存在相关关系
B.花瓣长度和花萼长度负相关
C.花萼长度为7cm的该品种鸢尾花的花瓣长度的平均值为
D.若从样本中抽取一部分,则这部分的相关系数一定是
变式训练:
1.(2025·辽宁锦州·二模)5G技术在我国已经进入高速发展的阶段,5G手机的销量也逐渐上升.某手机商城统计了1至5月份5G手机的实际销量,如下表所示:
月份x
1月
2月
3月
4月
5月
销售量y(千只)
0.5
0.6
1.0
1.4
1.7
若y与x线性相关,且求得线性回归方程为,则下列说法不正确的是( )
A.由题中数据可知,
B.由题中数据可知,6月份该商城5G手机的实际销量为2(千只)
C.由题中数据可知,变量x和y正相关,且相关系数一定小于1
D.若不考虑本题中的数据,回归直线可能不过,,…,中任一个点
2.(2025·天津·二模)小明研究温差(单位:)与本单位当天新增感冒人数(单位:人)的关系,他记录了5天的数据:
3
4
5
6
7
16
20
25
28
36
由表中数据求得温差与新增感冒人数满足经验回归方程,则下列结论不正确的是( )
A.与正相关 B.经验回归直线经过点
C.当时,残差为1.8 D.
3.(2025·上海长宁·二模)某书店为了分析书籍销量与宣传投入之间的关系,对宣传投入x(千元)和书籍销量y(百本)的情况进行了调研,并统计得到表中几组对应数据,同时用最小二乘法得到y关于x的线性回归方程为,则下列说法不正确的是( )
x
3
4
5
6
y
5
6.2
7.4
m
A.变量x、y之间呈正相关 B.预测当宣传投入2千元时,书籍销量约为400本
C. D.拟合误差
4.(2025·山东聊城·二模)为了研究某市高中生的脚长(单位:cm)和身高(单位:cm)的关系,市卫健委从该市随机抽取若干名高中生做调查,经统计,所调查数据的,根据最小二乘法算得脚长和身高的经验回归方程为.已知被调查的某学生的脚长为25cm,身高180cm,则该样本点的残差为( )
A.1cm B.cm C.4cm D.cm
5.(2025·河南·三模)人工智能技术(简称AI技术)已成为引领世界新一轮科技革命和产业改革的战略性技术,AI技术加持的电脑(以下简称AI电脑)也在全国各地逐渐热销起来.下表为市统计的2024年11月至2025年3月这5个月该市AI电脑的月销量,其中为月份代号,(单位:万台)为AI电脑的月销量.
月份
2024年11月
2024年12月
2025年1月
2025年2月
2025年3月
月份代号
1
2
3
4
5
月销量
0.5
0.9
1
1.2
1.4
经过分析,与线性相关,且其线性回归方程为,则2025年3月的残差为( )(实际值与预计值之差)
A. B. C.0.02 D.0.04
二、独立性检验
例3:(2025·甘肃金昌·二模)某公司男、女职工人数相等,该公司为了了解职工是否接受去外地长时间出差,在男、女职工中各随机抽取了100人进行调查,数据显示男职工和女职工接受去外地长时间出差的人数分别为40和20.下列结论正确的是( )
附表:
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
附:,其中.
A.依据小概率值的独立性检验,不能认为是否接受去外地长时间出差与性别有关
B.依据小概率值的独立性检验,可以认为是否接受去外地长时间出差与性别有关
C.有的把握认为是否接受去外地长时间出差与性别有关
D.是否接受去外地长时间出差与性别无关
变式训练:
1.(2023·甘肃兰州·模拟预测)为了检测某种新药的效果,现随机抽取100只小白鼠进行试验,得到如下列联表:
未治愈
治愈
合计
服用药物
10
40
50
未服用药物
20
30
50
合计
30
70
100
则下列说法一定正确的是( )
附:(其中).
临界值表:
0.15
0.10
0.05
0.025
0.010
0.005
0.001
2.072
2.706
3.841
5.024
6.635
7.879
10.828
A.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
B.在犯错误的概率不超过0.05的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
C.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药有关”
D.在犯错误的概率不超过0.005的前提下,认为“小白鼠是否被治愈与是否服用新药无关”
2.(2024·山东枣庄·一模)某儿童医院用甲、乙两种疗法治疗小儿消化不良.采用有放回简单随机抽样的方法对治疗情况进行检查,得到两种疗法治疗数据的列联表:
疗法
疗效
合计
未治愈
治愈
甲
15
52
67
乙
6
63
69
合计
21
115
136
经计算得到,根据小概率值的独立性检验(已知独立性检验中),则可以认为( )
A.两种疗法的效果存在差异
B.两种疗法的效果存在差异,这种判断犯错误的概率不超过0.005
C.两种疗法的效果没有差异
D.两种疗法的效果没有差异,这种判断犯错误的概率不超过0.005
3.(2024·黑龙江·二模)根据分类变量x与y的成对样本数据,计算得,依据的独立性检验,结论为( )参考值:
0.1
0.05
0.01
2.706
3.841
6.635
A.x与y不独立
B.x与y不独立,这个结论犯错误的概率不超过0.05
C. x与y独立
D.x与y独立,这个结论犯错误的概率不超过0.05
4.(2024·江苏盐城·模拟预测)根据分类变量Ⅰ与Ⅱ的统计数据,计算得到,则( )
0.1
0.05
0.01
0.005
0.001
2.706
3.841
6.635
7.879
10.828
A.变量Ⅰ与Ⅱ相关
B.变量Ⅰ与Ⅱ相关,这个结论犯错误的概率不超过0.1
C.变量Ⅰ与Ⅱ不相关
D.变量Ⅰ与Ⅱ不相关,这个结论犯错误的概率不超过0.1
5.(2025·上海·模拟预测)在研究“温度是否影响庄稼生长”时,对实验数据利用2×2列联表进行独立性检验,计算得实验数据的统计量的值为.已知,则( )
A.的值小于3.841,就有95%的把握认为“温度会影响庄稼生长”
B.的值大于3.841,就有95%的把握认为“温度会影响庄稼生长”
C.的值越大,说明实验数据的观测值与预测值的总体偏差越小
D.的值越小,说明实验数据的观测值与预测值的总体偏差越大
6.(2025·四川·三模)为考察某种药物对预防疾病的效果,进行了动物试验,根据120个有放回随机样本的数据,得到如下列联表:
药物
疗效
合计
未患疾病
患疾病
未服用
10
50
60
服用
18
42
60
合计
28
92
120
经计算得到,根据小概率值的独立性检验(已知独立性检验中),结论为( )
A.药物对预防疾病没有效果
B.药物对预防疾病没有效果,这种判断犯错误的概率不超过
C.药物对预防疾病有效果
D.药物对预防疾病有效果,这种判断犯错误的概率不超过
三、统计综合辨析
例4:(2025·天津·一模)下列说法中,不正确的是( )
A.在1,3,6,7,9,10,12,15这组数据中,第50百分位数为8
B.分类变量A与B的统计量越大,说明“A与B有关系”的可信度越大
C.根据具有线性相关关系的两个变量的统计数据所得的经验回归方程为,若,,,则
D.两个模型中,残差平方和越大的模型拟合的效果越好
变式训练:
1.(24-25高三上·天津北辰·阶段练习)下列说法正确的是( )
A.若两个随机变量的线性相关性越强,则相关系数的值越接近于1
B.根据分类变量与的成对样本数据,计算得到.依据的独立性检验(),可判断与无关
C.对具有线性相关关系的变量,,其线性回归方程为,若样本点的中心为,则实数的值是.
D.已知随机变量服从二项分布,若,则.
2.(2025·天津·一模)下列说法错误的是( )
A.若随机变量,则当较小时,对应的正态曲线“瘦高”,随机变量的分布比较集中
B.在做回归分析时,可以用决定系数刻画模型的回归效果,若越大,则说明模型拟合的效果越好
C.若样本数据的平均数为3,则的平均数为10
D.一组数据6,7,7,8,10,12,14,16,19,21的第30百分位数为7
3.(2024·江苏南京·模拟预测)给出下列说法,其中正确的是( )
A.某病8位患者的潜伏期(天)分别为3,3,8,4,2,7,10,18,则它们的第50百分位数为
B.已知数据的平均数为2,方差为3,那么数据,,的平均数和方差分别为5,13
C.在回归直线方程中,相对于样本点的残差为
D.样本相关系数
4.(24-25高三上·山西运城·开学考试)下列说法错误的是( )
A.某校高一年级共有男女学生500人,现按性别采用分层抽样的方法抽取容量为50人的样本,若样本中男生有30人,则该校高一年级女生人数是200
B.数据1,3,4,5,7,9,11,16的第75百分位数为10
C.在一元线性回归方程中,若线性相关系数r越大,则两个变量的线性相关性越强
D.根据分类变量与的成对样本数据,计算得到,根据小概率值的独立性检验,可判断与有关联,此推断犯错误的概率不大于0.05
5(24-25高三上·天津北辰·阶段练习)下列说法正确的是( )
A.若两个随机变量的线性相关性越强,则相关系数的值越接近于1
B.根据分类变量与的成对样本数据,计算得到.依据的独立性检验(),可判断与无关
C.对具有线性相关关系的变量,,其线性回归方程为,若样本点的中心为,则实数的值是.
D.已知随机变量服从二项分布,若,则.
6.(24-25高三上·四川遂宁·阶段练习)下列说法错误的是( )
A.线性相关系数越接近1,两个变量的线性相关程度越强;
B.独立性检验可以100%确定两个变量之间是否具有某种关系;
C.在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适,带状区域的宽度越窄,说明模型的拟合精度越高;
D.甲、乙两个模型的决定系数分别约为0.88和0.80,则模型甲的拟合效果更好.
7.(2024·天津北辰·模拟预测)下列命题中,不正确的是( )
A.若随机变量,则
B.若随机变量,且,则
C.若,,则的最小值为
D.两个随机变量的相关系数越大,两个变量的线性相关性越强
8.(2025·天津河东·二模)2024年12月26日,Deep Seek—V3首个版本正式上线,截至2025年2月9日,Deep Seek APP的累计下载量已超1.1亿次,AI成为当下的热门话题.立德中学高中数学社团以16至40岁人群使用Deep Seek频率为课题,分小组自主选题进行调查研究,下列说法正确的是( )
A.甲小组开展了Deep Seek每周使用频次与年龄的相关性研究,经计算样本相关系数,可以推断两个变量正线性相关,但相关程度很弱
B.乙小组利用最小二乘法得到Deep Seek每周使用频次y关于年龄x的经验回归方程为,可以推断年龄为30岁的群体每周使用频次一定为17次
C.丙小组用决定系数来比较模型的拟合效果,经验回归方程①和②的分别约为0.733和0.998,因此经验回归方程②的刻画效果比经验回归方程①的好很多
D.丁小组研究性别因素是否影响Deep Seek使用频次,根据小概率值的独立性检验,计算得到,可以认为不同性别的Deep Seek使用频次没有差异
四、用样本估计总体
例5:(2025·湖南长沙·一模)对于数据,下列说法错误的是( )
A.平均数为5 B.众数为6
C.极差为10 D.中位数为6
变式训练:
1.(2025·甘肃庆阳·二模)样本数据15,13,12,31,29,25,43,19,17,38的中位数为( ).
A.19 B.22 C.21 D.18
2.(2025·河北秦皇岛·三模)数据16,22,13,14,25,17,18,19,21,10的第70百分位数是( )
A.18 B.19 C.20 D.21
3.(2025·江西萍乡·二模)已知一组数据为:123,117,117,121,122,120,116,114,120,119,则这组数据的分位数是( )
A.114 B.115 C.120.5 D.121
4.(2020·全国III卷·高考真题)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为( )
A.0.01 B.0.1 C.1 D.10
例6:(2022·天津·高考真题)将1916到2015年的全球年平均气温(单位:),共100个数据,分成6组:,并整理得到如下的频率分布直方图,则全球年平均气温在区间内的有( )
A.22年 B.23年 C.25年 D.35年
变式训练:
1.(2021·天津·高考真题)从某网络平台推荐的影视作品中抽取部,统计其评分数据,将所得个评分数据分为组:、、、,并整理得到如下的频率分布直方图,则评分在区间内的影视作品数量是( )
A. B. C. D.
2.(2020·天津·高考真题)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A.10 B.18 C.20 D.36
3.(2025·山西·二模)AI正悄然改变着我们的生活.某在线平台利用AI技术为学生提供个性化学习路径,为了解学生对平台的满意程度,随机抽取使用该平台的学生进行打分,将收集到的分数数据按照分组,画出频率分布直方图如图所示,则这些数据的中位数约为( )
A.85 B.80 C.77.5 D.75
4.(2025·黑龙江·二模)某学校为了拓展学生的国际视野,培养学生的创新精神,让学生学有动力,学有信心,举办了英语手抄报比赛.为了解考生的成绩情况,抽取了样本容量为的部分考生成绩,得到如图所示的频率分布直方图,则估计考生成绩的第70百分位数为( )
A.74 B.75 C.76 D.77
5.(2025·天津和平·二模)某人工智能公司为优化新开发的语言模型,在其模型试用人群中开展满意度问卷调查,满意度采用计分制(满分100分),统计满意度并绘制成如下频率分布直方图,图中,则下列结论不正确的是( )
A. B.满意度计分的众数约为75分
C.满意度计分的平均分约为79分 D.满意度计分的第一四分位数约为70分
6.(2025·黑龙江辽宁·模拟预测)为了了解某小区居民月用电情况,供电部门从该小区随机抽取100户居民进行月用电量调查,统计他们的月用电量(单位:kW·h),将数据整理后绘制成如图所示的频率分布直方图(每组为左闭右开的区间).
用样本估计总体,则下列说法中正确的个数是( )
①本小区居民月用电量的分位数不小于200kW·h;②本小区居民月用电量的平均数位于中;③本小区居民月用电量的众数为225kW·h;④本小区居民月用电量的极差位于中.
A.1 B.2 C.3 D.4
学科网(北京)股份有限公司
$$