内容正文:
专题15 数字特征、统计
及分布列、期望方差小题
1.百分位数、众数、平均数的定义
(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.
一般地,一组数据的第p百分位数是这样一个值,
它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)第25百分位数又称第一四分位数或下四分位数;
第75百分位数又称第三四分位数或上四分位数.
(3)众数
一组数据中出现次数最多的数据叫做这组数据的众数.
(4)平均数
一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数=(x1+x2+…+xn).
2.样本的数字特征之方差
如果有n个数据x1,x2,…,xn,那么这n个数的
(1)标准差s= .
(2)方差s2=[(x1-)2+(x2-)2+…+(xn-)2].
3.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
4.离散型随机变量的分布列的两个性质
(1);(2).
5. 数学期望
6. 数学期望的性质
(1).(2)若~,则.
(3) 若服从几何分布,且,则.
7. 方差
8. 标准差=.
9.方差的性质
(1);(2)若~,则.
(3) 若服从几何分布,且,则.
10.方差与期望的关系.
11.正态分布密度函数
,式中的实数μ,(>0)是参数,分别表示个体的平均数与标准差.
12.对于,取值小于x的概率
.
.
【金题】1.(河南省郑州市郑州中学2024-2025学年高三上学期一测模拟演练)设为样本数据,则函数的最小值点为( )
A.样本众数 B.样本中位数 C.样本平均数 D.样本方差
【金题】2.(河北省衡水中学2024届高三下学期模拟押题(一)已知随机变量服从正态分布,且,则( )
A.0.2 B.0.3 C.0.7 D.0.8
【金题】3.(河南省郑州市郑州中学2024-2025学年高三上学期一测模拟演练)(多选)给出下列命题,其中正确命题为( )
A.已知数据,满足:,若去掉后组成一组新数据,则新数据的方差为21
B.随机变量服从正态分布,若,则
C.一组数据的线性回归方程为,若,则
D.对于独立性检验,随机变量的值越大,则推断“两变量有关系”犯错误的概率越小
【金题】4.(陕西省西北工业大学附属中学2025届高三上学期第六次适应性训练)(多选)已知随机变量,若,,则( )
A. B.
C. D.
【金题】5.(重庆市西南大学附属中学校2024-2025学年高三上学期12月一诊模拟)(多选)下列说法正确的是( )
A.数据5,7,9,11,13,14,15,22的平均数为12
B.一组数据6,7,7,8,10,12,14,16,19,21的第30百分位数为7
C.若随机变量服从二项分布,且,则
D.若随机变量服从正态分布,则
【金题】6.(河北省衡水中学2024届高三下学期模拟押题(一)(多选)某校在运动会期间进行了一场“不服来战”对抗赛,由篮球专业的1名体育生组成甲组,3名非体育生的篮球爱好者组成乙组,两组进行对抗比赛.具体规则为甲组的同学连续投球3次,乙组的同学每人各投球1次.若甲组同学和乙组3名同学的命中率依次分别为,则( )
A.乙组同学恰好命中2次的概率为
B.甲组同学恰好命中2次的概率小于乙组同学恰好命中2次的概率
C.甲组同学命中次数的方差为
D.乙组同学命中次数的数学期望为
【金题】7.(河北省衡水市第二中学2025届高三高考模拟一)某同学统计最近5次考试成绩,发现分数恰好组成一个公差不为0的等差数列,设5次成绩的平均分数为,第60百分位数为,当去掉某一次的成绩后,4次成绩的平均分数为,第60百分位数为n.若,则( )
A. B. C. D.与大小无法判断
【金题】8.(湖南省长沙市长郡中学2023-2024学年高三下学期保温卷一)传输信号会受到各种随机干扰,为了在强干扰背景下提取微弱信号,可用同步累积法.设s是需提取的确定信号的值,每隔一段时间重复发送一次信号,共发送m次,每次接收端收到的信号,其中干扰信号为服从正态分布的随机变量,令累积信号,则Y服从正态分布,定义信噪比为信号的均值与标准差之比的平方,例如的信噪比为,则累积信号Y的信噪比是接收一次信号的( )倍
A. B.m C. D.
【金题】9.(湖南省长沙市长郡中学2023-2024学年高三下学期保温卷一)(多选)下列命题中正确的是( )
A.若样本数据,,,的样本方差为3,则数据,,,的方差为7
B.经验回归方程为时,变量x和y负相关
C.对于随机事件A与B,,,若,则事件A与B相互独立
D.若,则取最大值时
【金题】10.(江苏省南京大学附属中学2024-2025学年高三下学期2月模拟)(多选)下列说法正确的是( )
A.决定系数越小,模型的拟合效果越好
B.若随机变量服从两点分布,,则
C.若随机变量服从正态分布,,则
D.一组数()的平均数为,若再插入一个数,则这个数的方差变大
单选+填空
1.(湖南省长沙市长郡中学2024届考前模拟)已知随机变量,则 .
2.(浙江杭州二中2024届6月热身考试)若设随机变量,且 ,则c的值为( )
A.0 B. C.- D.
3.(2024届福建厦门一中最后一卷)已知随机变量,且,,则的值为( )
A. B. C. D.
4.(贵州贵阳一中2024届高三一模)设随机变量服从正态分布,若,则的值为( )
A.9 B.7 C.5 D.4
5.(湖南省长沙市长郡中学2024届高三一模)为了了解学生们的身体状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行各项指标测试.已知高三年级有500人,高二年级有700人,高一年级有800人,则高三年级抽取的人数为( )
A.30 B.25 C.20 D.15
6.(湖南长沙雅礼中学2024届高三下学期3月测试)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
7.(河南郑州外国语2024高三适应性考试)某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的分位数为( )
A.93 B.93.5 C.94 D.94.5
8.(2024吉林长春东北师大附中高三六模)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
9.(2024广东华南师大附中综合测试)一组样本数据删除一个数后,得到一组新数据:10,21,25,35,36,40.若这两组数据的中位数相等,则删除的数为( )
A.25 B.30 C.35 D.40
10.(安徽合肥一六八中学2024届最后一卷)某停车场在统计停车数量时数据不小心丢失一个,其余六个数据分别是10,8,8,11,16,8,若这组数据的平均数、中位数、众数成等差数列,则丢失数据的所有可能值的和为( )
A.21 B.24 C.27 D.32
11.(贵州贵阳一中2024届高三一模)为了树立和践行绿水青山就是金山银山的理念,市某高中全体教师于2023年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计1200棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为( )
A.60棵 B.100棵 C.144棵 D.160棵
12.(河南郑州一中2024届考前全真模拟)对三组数据进行统计,获得以下散点图,关于其相关系数依次是,,,则它们的大小关系是( )
A. B. C. D.
13.(湖南省长沙市长郡中学2024届考前模拟)恩格尔系数是由德国统计学家恩斯特•恩格尔提出的,计算公式是“恩格尔系数”.恩格尔系数是国际上通用的衡量居民生活水平高低的一项重要指标,一般随居民家庭收入和生活水平的提高而下降,恩格尔系数达60%以上为贫困,为温饱,为小康,为富裕,低于为最富裕.如图是近十年我国农村与城镇居民的恩格尔系数折线图,由图可知下列结论正确的是( )
A.城镇居民从2013年开始进入“最富裕”水平
B.农村居民恩格尔系数的平均数低于
C.城镇居民恩格尔系数的第45百分位数高于
D.全国居民恩格尔系数等于农村居民恩格尔系数和城镇居民恩格尔系数的平均数
14.(辽宁沈阳东北育才2024高三六模)某班学生每天完成数学作业所需的时间的频率分布直方图如右图,为响应国家减负政策,若每天作业布置量在此基础上减少5分钟,则减负后完成作业的时间的说法中正确的是( )
A.减负后完成作业的时间的标准差减少25
B.减负后完成作业的时间的方差减少25
C.减负后完成作业的时间在60分钟以上的概率为
D.减负后完成作业的时间的中位数为25
15.(江苏南京外国语2024年2月开学考试)如图所示是中国2012-2021年汽车进、出口量统计图,则下列结论错误的是( )
A.2012-2021年中国汽车进口量和出口量都是有增有减的
B.从2018年开始,中国汽车的出口量大于进口量
C.2012-2021年中国汽车出口量的第60百分位数是106万辆
D.2012-2021年中国汽车进口量的方差大于出口量的方差
16.(广西柳州高级中学2024届高三5月适应性考试)如图所示,已知一质点在外力的作用下,从原点出发,每次向左移动的概率为,向右移动的概率为.若该质点每次移动一个单位长度,设经过5次移动后,该质点位于的位置,则( )
A. B. C. D.
17.(广西柳州高级中学2024届高三5月适应性考试)甲乙两名同学参加系列知识问答节目,甲同学参加了5场,得分是3,4,5,5,8,乙同学参加了7场,得分是3,3,4,5,5,7,8,那么有关这两名同学得分数据下列说法正确的是( )
A.得分的中位数甲比乙要小 B.两人的平均数相同
C.两人得分的极差相同 D.得分的方差甲比乙小
18.(山东青岛二中二模)为了解某中学学生假期中每天自主学习的时间,采用样本量比例分配的分层随机抽样,现抽取高一学生40人,其每天学习时间均值为8小时,方差为0.5,抽取高二学生60人,其每天学习时间均值为9小时,方差为0.8,抽取高三学生100人,其每天学习时间均值为10小时,方差为1,则估计该校学生每天学习时间的方差为( )
A.1.4 B.1.45 C.1.5 D.1.55
19.(2024届福建厦门一中最后一卷)在一次数学模考中,从甲、乙两个班各自抽出10个人的成绩,甲班的十个人成绩分别为,乙班的十个人成绩分别为.假设这两组数据中位数相同、方差也相同,则把这20个数据合并后( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
20.(辽宁省实验2024届高三考前模拟)有一组样本数据:,其平均数为.(辽宁省实验2024届高三考前模拟)由这组数据得到新的样本数据:,2024,那么这两组数据一定有相同的( )
A.极差 B.中位数 C.方差 D.众数
21.(湖北武汉华师一2024届高三五月适应性考试)一只口袋装有形状、大小完全相同的3只小球,其中红球、黄球、黑球各1只.现从口袋中先后有放回地取球次,且每次取1只球,表示次取球中取到红球的次数,,则的数学期望为_________________________(用表示).
多选
22.(河北衡水中学2023-2024学年高三下学期自我提升测试)下列命题为真命题的是( )
A.若样本数据的方差为2,则数据的方差为17
B.一组数据8,9,10,11,12的第80百分位数是11.5
C.用决定系数比较两个模型的拟合效果时,若越大,则相应模型的拟合效果越好
D.以模型 去拟合一组数据时,为了求出经验回归方程,设,求得线性回归方程为,则c,k的值分别是和2
23.(湖南长沙雅礼中学2024届高三一模)已知一组数据:,若去掉12和45,则剩下的数据与原数据相比,下列结论正确的是( )
A.中位数不变 B.平均数不变
C.方差不变 D.第40百分位数不变
24.(浙江宁波镇海中学2024适应性测试)下列选项中正确的有( )
A.若两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于1
B.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
C.已知随机变量服从正态分布,则
D.若数据的方差为8,则数据的方差为2
25.(2024吉林长春东北师大附中高三七模)下列说法中,正确的命题是( )
A.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和.
B.在线性回归模型拟合中,若相关系数的绝对值越小,则样本的线性相关性越强.
C.在回归分析中,决定系数的值越大,说明残差平方和越大.
D.在具有线性相关关系的两个变量的统计数据所得的回归直线方程中,,则.
26.(湖南师大附中2023-2024学年高三下一模)下列说法中,正确的是( )
A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位
B.已知随机变量,若,则
C.两组样本数据和.若已知且,则
D.已知一系列样本点的经验回归方程为,若样本点与的残差相等,则
27.(湖北武汉二中2024高三最后一卷)盒子中有编号一次为1,2,3,4,5,6的6个小球(大小相同),从中不放回地抽取4个小球并记下编号,根据以下统计数据,可以判断一定抽出编号为6的小球的是( )
A.极差为5 B.上四分位数为5 C.平均数为3.5 D.方差为4.25
28.(湖南师大附中2024二模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这名学生中,成绩位于内的学生成绩方差为,成绩位于内的同学成绩方差为.则( )
参考公式:样本划分为层,各层的容量、平均数和方差分别为:、、;、、.记样本平均数为,样本方差为,.
A.
B.估计该年级学生成绩的中位数约为
C.估计该年级成绩在分及以上的学生成绩的平均数为
D.估计该年级成绩在分及以上的学生成绩的方差为
29.(河南郑州外国语2024高三适应性考试)近年来,中国电影行业发展迅猛,消费者追求电影剧情的高质量,重视电影内容正面传达的积极情绪,并且愿意为其买单.某机构调查到观众在观看电影时除了关注电影的剧情、情节外,还会关注电影的幕后团队、精神内涵价值观、参演人员等方面.如图所示为该机构调查的2023年中国网民观看电影时关注方面占比的统计表,则下列结论正确的是( )
A.2023年中国网民观看电影时超过40%的网民会关注参演人员
B.这8个方面占比的极差是31.77%
C.这8个方面占比的中位数为37.69%
D.2023年中国网民观看电影时至少有10.73%的网民既关注剧情、情节,又关注精神内涵价值观
30.(广东广州华南师大附中2024年5月月考)使用统计手段科学预测传染病可以保障人民群众的生命健康.下表和散点图为某段时间内全球某传染病感染病例在第一次监测到之后数量随时间的变化,以时间为自变量(单位为天),以监测到的病例总数为因变量,选择以下两个回归模型拟合随的变化:回归模型一:;回归模型二:,通过计算得出,则下列说法正确的是( )
1
5
7
12
16
20
2
9
12
29
63
101
A.使用回归模型一拟合的决定系数大于使用回归模型二的决定系数
B.通过模型二得出的经验回归方程的预报效果好于通过模型一得出的经验回归方程
C.在首例病例出现后45天,该传染病感染人数很有可能在200人左右
D.在首例病例出现后45天,该传染病的感染人数很有可能超过10000人
31.(浙江杭州二中2024高三下开学考试)有一组互不相等的样本数据,平均数为.若随机剔除其中一个数据,得到一组新数据,记为,平均数为,则( )
A.新数据的极差可能等于原数据的极差
B.新数据的中位数不可能等于原数据的中位数
C.若,则新数据的方差一定大于原数据方差
D.若,则新数据的40%分位数一定大于原数据的40%分位数
32.(安徽合肥一中2024届最后一卷)下表是某人上班的年收入(单位:万元)与上班年份的一组数据:
年份
1
2
3
4
5
6
7
收入
2.9
3.3
3.6
4.4
4.8
5.2
5.9
则下列命题正确的有( )
A.年收入的均值为4.3
B.年收入的方差为1.2
C.年收入的上四分位数为5
D.若与可用回归直线方程来模拟,则
年份
1
2
3
4
5
6
7
收入
2.9
3.3
3.6
4.4
4.8
5.2
5.9
1.96
1
0.49
0.01
0.25
0.81
2.56
33.(山东省实验2024届高三一模)下列命题正确的是( )
A.若样本数据的方差为2,则数据的方差为8
B.已知互不相同的30个样本数据,若去掉其中最大和最小的数据,剩下28个数据的20%分位数不等于原样本数据的20%分位数
C.若A,B两组成对数据的样本相关系数分别为,,则A组数据比B组数据的线性相关程度更强
D.若决定系数的值越接近于1,则表示回归模型的拟合效果越好
34.(山东省实验2024届高三二模)某景点工作人员记录了国庆假期七天该景点接待的旅游团数量.已知这组数据均为整数,中位数为18,唯一众数为20,极差为5,则( )
A.该组数据的第80百分位数是20
B.该组数据的平均数大于18
C.该组数据中最大数字为20
D.将该组数据从小到大排列,第二个数字是17
35.(山西大学附中2024届高三下月考)某地教师招聘考试,有3200人参加笔试,满分为100分,笔试成绩前20%(含20%)的考生有资格参加面试,所有考生的笔试成绩和年龄分别如频率分布直方图和扇形统计图所示,则( )
A.90后考生比00后考生多150人 B.笔试成绩的60%分位数为80
C.参加面试的考生的成绩最低为86分 D.笔试成绩的平均分为76分
36.(重庆巴蜀中学2024届高考适应性考试)在跳水比赛中,裁判给分计算运动员成绩规则如下:有7位裁判,对某选手一次跳水的给分均不相同,去掉一个最高分和一个最低分后,下列说法正确的是( )
A.剩下5位裁判给分的平均值一定变大
B.剩下5位裁判给分的极差一定变小
C.剩下5位裁判给分的中位数一定变大
D.剩下5位裁判给分的方差一定变小
37.(福建福州一中2024届高三5月模拟)下列说法中,正确的是( )
A.数据的第50百分位数为32
B.已知随机变量服从正态分布,;则
C.已知两个变量具有线性相关关系,其回归直线方程为;若,,,则
D.若样本数据的方差为2,则数据的方差为4
38.(广东东莞高级中学三模)某设备生产的10件产品中有6件一等品,4件二等品,现从中任取4件,记随机变量为取出一等品的件数,随机变量为取出二等品的件数,若取出一件一等品得2分,取出一件二等品得分,随机变量为取出4件产品的总得分,则下列结论中正确的是( )
A.
服从超几何分布 B.
C. D.
39.(江苏南京外国语2024年2月开学考试)已知离散型随机变量服从二项分布,其中,记为奇数的概率为,为偶数的概率为,则下列说法中正确的有( )
A. B.时,
C.时,随着的增大而增大 D.时,随着的增大而减小
40.(重庆南开中学2024届高三5月模拟)某动物园研究了大量的A、B两种相似物种.记录其身长为x(单位:m)与体重y(单位:kg),通过计算得A、B两物种的平均身长为,标准差分别为,令A、B两物种的平均体重分别为、若A、B两物种其体重y对身长x的回归直线分别为,相关系数分别为现有两种物种中一身长为5.6m,体重为8.6kg的个体P,下列说法中正确的有( )
参考公式:相关系数回归方程中斜率和截距的最小二乘法估计公式分别为:;
方差:
A.
B.点到直线的距离大于其到直线的距离
C.点与点的距离大于其与点(的距离
D.A物种的体重标准差小于B物种的体重标准差
1
学科网(北京)股份有限公司
$$
专题15 数字特征、统计
及分布列、期望方差小题
1.百分位数、众数、平均数的定义
(1)如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数.
一般地,一组数据的第p百分位数是这样一个值,
它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
(2)第25百分位数又称第一四分位数或下四分位数;
第75百分位数又称第三四分位数或上四分位数.
(3)众数
一组数据中出现次数最多的数据叫做这组数据的众数.
(4)平均数
一组数据的算术平均数即为这组数据的平均数,n个数据x1,x2,…,xn的平均数=(x1+x2+…+xn).
2.样本的数字特征之方差
如果有n个数据x1,x2,…,xn,那么这n个数的
(1)标准差s= .
(2)方差s2=[(x1-)2+(x2-)2+…+(xn-)2].
3.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
4.离散型随机变量的分布列的两个性质
(1);
(2).
5. 数学期望
6. 数学期望的性质
(1).
(2)若~,则.
(3) 若服从几何分布,且,则.
7. 方差
8. 标准差=.
9.方差的性质
(1);
(2)若~,则.
(3) 若服从几何分布,且,则.
10.方差与期望的关系
.
11.正态分布密度函数
,式中的实数μ,(>0)是参数,分别表示个体的平均数与标准差.
12.对于,取值小于x的概率
.
.
【金题】1.(河南省郑州市郑州中学2024-2025学年高三上学期一测模拟演练)设为样本数据,则函数的最小值点为( )
A.样本众数 B.样本中位数 C.样本平均数 D.样本方差
【答案】C
【分析】将整理成二次函数的形式,然后根据二次函数的性质来求得正确答案.
【详解】,
这是一个开口向上的二次函数,当时,
取得最小值,所以答案是样本平均数.
故选:C
【金题】2.(河北省衡水中学2024届高三下学期模拟押题(一)已知随机变量服从正态分布,且,则( )
A.0.2 B.0.3 C.0.7 D.0.8
【答案】A
【分析】根据正态分布的对称性结合题意求解即可
【详解】根据正态曲线的对称性,由,得,
因为,
所以.
故选:A
【金题】3.(河南省郑州市郑州中学2024-2025学年高三上学期一测模拟演练)(多选)给出下列命题,其中正确命题为( )
A.已知数据,满足:,若去掉后组成一组新数据,则新数据的方差为21
B.随机变量服从正态分布,若,则
C.一组数据的线性回归方程为,若,则
D.对于独立性检验,随机变量的值越大,则推断“两变量有关系”犯错误的概率越小
【答案】ABD
【分析】根据方差计算判断A,应用正态分布概率计算求参判断B,根据回归直线过样本中心点求解判断C,应用独立性检验判断D.
【详解】对于A选项,去掉后的平均数为,
方差为故A选项正确;
对于B选项,由于随机变量服从正态分布,
则,关于1对称,则故B选项正确;
对于C选项,因为,所以,又因为回归方程为,
所以,所以,故C选项错误;
对于D选项,对于独立性检验,随机变量的值越大,则两变量有关系的程度的错误率更低,故越大,判定“两变量有关系”的错误率更低,D选项正确.
故选:ABD.
【金题】4.(陕西省西北工业大学附属中学2025届高三上学期第六次适应性训练)(多选)已知随机变量,若,,则( )
A. B.
C. D.
【答案】ABD
【分析】借助正态分布的对称性可得A、B,借助正态分布定义及期望与方差的性质可得C、D.
【详解】由随机变量,则,,
则,
,
,
,
故A、B、D正确,C错误.
故选:ABD.
【金题】5.(重庆市西南大学附属中学校2024-2025学年高三上学期12月一诊模拟)(多选)下列说法正确的是( )
A.数据5,7,9,11,13,14,15,22的平均数为12
B.一组数据6,7,7,8,10,12,14,16,19,21的第30百分位数为7
C.若随机变量服从二项分布,且,则
D.若随机变量服从正态分布,则
【答案】AC
【分析】根据平均数、百分位数的定义,给合二项分布、正态分布的性质逐一判断即可.
【详解】A:这个数的平均数为:,所以本选项说法正确;
B:由可知:这个数据的第30百分位数为,所以本选项说法正确;
C:因为, 所以由,
因此,所以本选项说法正确;
D:因为,
所以,
因此,所以本选项说说不正确,
故选:AC
【金题】6.(河北省衡水中学2024届高三下学期模拟押题(一)(多选)某校在运动会期间进行了一场“不服来战”对抗赛,由篮球专业的1名体育生组成甲组,3名非体育生的篮球爱好者组成乙组,两组进行对抗比赛.具体规则为甲组的同学连续投球3次,乙组的同学每人各投球1次.若甲组同学和乙组3名同学的命中率依次分别为,则( )
A.乙组同学恰好命中2次的概率为
B.甲组同学恰好命中2次的概率小于乙组同学恰好命中2次的概率
C.甲组同学命中次数的方差为
D.乙组同学命中次数的数学期望为
【答案】BCD
【分析】根据题意,利用概率乘法和加法公式,可判定A错误;根据独立重复试验的概率公式,可得判定B正确,结合二项分布的方差,可判定C中,由乙组同学命中次数为随机变量的所有可能取值为,求得相应的概率,结合期望的公式,可判定D正确.
【详解】对于A中,设“乙组同学恰好命中2次”为事件,则,所以A错误;
对于B中,设“甲组同学恰好命中2次”为事件,则,因为,所以B正确;
对于C中,因为甲组同学每次命中的概率都为,设甲组同学命中次数为,则,可得,所以C正确;
对于D中,设乙组同学命中次数为随机变量,则的所有可能取值为,
所以,
,
,
故,所以D正确.
故选:BCD.
【金题】7.(河北省衡水市第二中学2025届高三高考模拟一)某同学统计最近5次考试成绩,发现分数恰好组成一个公差不为0的等差数列,设5次成绩的平均分数为,第60百分位数为,当去掉某一次的成绩后,4次成绩的平均分数为,第60百分位数为n.若,则( )
A. B. C. D.与大小无法判断
【答案】C
【分析】依题意不妨设这次的分数从小到大分别为、、、、,即可求出、,要使去掉一个数据之后平均数不变,则去掉的一定是,从而求出,即可判断.
【详解】依题意不妨设这次的分数从小到大分别为、、、、,
所以,
又,所以第百分位数为,
要使次成绩的平均分数为且,则去掉的数据一定是,
即还剩下、、、,
又,所以第百分位数为,
因为,所以.
故选:C
【金题】8.(湖南省长沙市长郡中学2023-2024学年高三下学期保温卷一)传输信号会受到各种随机干扰,为了在强干扰背景下提取微弱信号,可用同步累积法.设s是需提取的确定信号的值,每隔一段时间重复发送一次信号,共发送m次,每次接收端收到的信号,其中干扰信号为服从正态分布的随机变量,令累积信号,则Y服从正态分布,定义信噪比为信号的均值与标准差之比的平方,例如的信噪比为,则累积信号Y的信噪比是接收一次信号的( )倍
A. B.m C. D.
【答案】B
【分析】利用正态分布性质,根据信噪比的定义列式计算即可求解.
【详解】由Y服从正态分布,则的信噪比为,
又接收一次信号的信噪比为,所以,
所以累积信号Y的信噪比是接收一次信号的m倍.
故选:B
【金题】9.(湖南省长沙市长郡中学2023-2024学年高三下学期保温卷一)(多选)下列命题中正确的是( )
A.若样本数据,,,的样本方差为3,则数据,,,的方差为7
B.经验回归方程为时,变量x和y负相关
C.对于随机事件A与B,,,若,则事件A与B相互独立
D.若,则取最大值时
【答案】BC
【分析】根据方差的性质可判断A;根据变量x,y的线性回归方程的系数,可判断B;利用条件概率及独立事件的定义可判断C;根据二项分布概率公式可判断D.
【详解】对于A,数据,,…,的方差为,所以A错误;
对于B,回归方程的直线斜率为负数,所以变量x与y呈负的线性相关关系,所以B正确;
对于C,由,得,所以事件A与事件B独立,所以C正确;
对于D,由,即,
解得或,所以D错误.
故选:BC.
【金题】10.(江苏省南京大学附属中学2024-2025学年高三下学期2月模拟)(多选)下列说法正确的是( )
A.决定系数越小,模型的拟合效果越好
B.若随机变量服从两点分布,,则
C.若随机变量服从正态分布,,则
D.一组数()的平均数为,若再插入一个数,则这个数的方差变大
【答案】BC
【分析】利用决定系数的性质判断A,利用两点分布的方差公式判断B,利用正态分布的对称性判断C,举反例判断D即可.
【详解】由决定系数性质得,决定系数越大,模型的拟合效果越好,故A错误,
若随机变量服从两点分布,,
则,故B正确,
若随机变量服从正态分布,,
由正态分布性质得,故C正确,
我们令,,此时平均数,
方差为,插入一个数,
此时平均数为,方差为,
方差显然变小了,即再插入一个数,则这个数的方差不可能变大,故D错误.
故选:BC
单选+填空
1.(湖南省长沙市长郡中学2024届考前模拟)已知随机变量,则 .
【答案】
【分析】由二项分布的概率计算公式运算即可得解.
【详解】因为,所以.
故答案为:.
2.(浙江杭州二中2024届6月热身考试)若设随机变量,且 ,则c的值为( )
A.0 B. C.- D.
【答案】B
【分析】根据正态分布的性质,即可求解.
【详解】随机变量,且,,为该随机变量的图象的对称轴,,
故选:.
3.(2024届福建厦门一中最后一卷)已知随机变量,且,,则的值为( )
A. B. C. D.
【答案】A
【分析】由正态分布曲线的性质即可得解.
【详解】.
故选:A.
4.(贵州贵阳一中2024届高三一模)设随机变量服从正态分布,若,则的值为( )
A.9 B.7 C.5 D.4
【答案】B
【分析】由正态分布曲线的对称性可列方程求解.
【详解】因为随机变量服从正态分布,若,
所以,解得.
故选:B.
5.(湖南省长沙市长郡中学2024届高三一模)为了了解学生们的身体状况,某学校决定采用分层抽样的方法,从高一、高二、高三三个年级共抽取100人进行各项指标测试.已知高三年级有500人,高二年级有700人,高一年级有800人,则高三年级抽取的人数为( )
A.30 B.25 C.20 D.15
【答案】B
【分析】根据分层抽样的抽样比公式进行求解即可.
【详解】根据分层抽样的性质可知:
高三年级抽取的人数为.
故选:B
6.(湖南长沙雅礼中学2024届高三下学期3月测试)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
【答案】C
【分析】根据题意算出极差,进而得到该组数据的中位数,列式求出,进而利用百分位数的定义得出答案.
【详解】根据题意,数据按从小到大的顺序排列为2,4,m,12,16,17,
则极差为,故该组数据的中位数是,
数据共6个,故中位数为,解得,
因为,所以该组数据的第40百分位数是第3个数6,
故选:C.
7.(河南郑州外国语2024高三适应性考试)某校高一年级18个班参加艺术节合唱比赛,通过简单随机抽样,获得了10个班的比赛得分如下:91,89,90,92,94,87,93,96,91,85,则这组数据的分位数为( )
A.93 B.93.5 C.94 D.94.5
【答案】B
【分析】利用百分位数的定义即可得解.
【详解】将比赛得分从小到大重新排列:85,87,89,90,91,91,92,93,94,96,
因为,
所以这组数据的分位数第8个数与第9个数的平均值,即.
故选:B.
8.(2024吉林长春东北师大附中高三六模)一组数据按从小到大的顺序排列为2,4,m,12,16,17,若该组数据的中位数是极差的,则该组数据的第40百分位数是( )
A.4 B.5 C.6 D.9
【答案】C
【分析】根据题意算出极差,进而得到该组数据的中位数,列式求出,进而利用百分位数的定义得出答案.
【详解】根据题意,数据按从小到大的顺序排列为2,4,m,12,16,17,
则极差为,故该组数据的中位数是,
数据共6个,故中位数为,解得,
因为,所以该组数据的第40百分位数是第3个数6,
故选:C.
9.(2024广东华南师大附中综合测试)一组样本数据删除一个数后,得到一组新数据:10,21,25,35,36,40.若这两组数据的中位数相等,则删除的数为( )
A.25 B.30 C.35 D.40
【答案】B
【分析】根据给定条件,利用中位数的定义求解即得.
【详解】依题意,新数据组有6个数,其中位数是,
显然原数据组有7个数,因此删除的数是中位数30.
故选:B
10.(安徽合肥一六八中学2024届最后一卷)某停车场在统计停车数量时数据不小心丢失一个,其余六个数据分别是10,8,8,11,16,8,若这组数据的平均数、中位数、众数成等差数列,则丢失数据的所有可能值的和为( )
A.21 B.24 C.27 D.32
【答案】D
【分析】根据已知条件,结合平均数公式,中位数,众数的定义,即可求解.
【详解】设丢失的数据为,则平均数为:,
众数是,
若,则中位数为,此时,解得:(舍去),
若,则中位数为,此时,解得:,
若,则中位数为,此时,解得:,
所有可能的值为,其和为.
故选:D.
11.(贵州贵阳一中2024届高三一模)为了树立和践行绿水青山就是金山银山的理念,市某高中全体教师于2023年3月12日开展植树活动,购买柳树、银杏、梧桐、樟树四种树苗共计1200棵,比例如图所示.青年教师、中年教师、老年教师报名参加植树活动的人数之比为,若每种树苗均按各年龄段报名人数的比例进行分配,则中年教师应分得梧桐的数量为( )
A.60棵 B.100棵 C.144棵 D.160棵
【答案】C
【分析】由己知比例求出中年教师应分得树苗的数量,再由饼图中梧桐占比求中年教师应分得梧桐的数量即可.
【详解】由题意,中年教师应分得树苗的数量为棵,
所以中年教师应分得梧桐的数量为棵,
故选:C
12.(河南郑州一中2024届考前全真模拟)对三组数据进行统计,获得以下散点图,关于其相关系数依次是,,,则它们的大小关系是( )
A. B. C. D.
【答案】A
【分析】根据散点图判断两变量的线性相关性,再根据线性相关性与相关系数的关系判断即可;
【详解】解:由散点图可知,图一两个变量成正相关,且线性相关性较强,故,
图二两个变量成负相关,且线性相关性较强,故,
图三两个变量线性相关性较弱,故,
所以;
故选:A
13.(湖南省长沙市长郡中学2024届考前模拟)恩格尔系数是由德国统计学家恩斯特•恩格尔提出的,计算公式是“恩格尔系数”.恩格尔系数是国际上通用的衡量居民生活水平高低的一项重要指标,一般随居民家庭收入和生活水平的提高而下降,恩格尔系数达60%以上为贫困,为温饱,为小康,为富裕,低于为最富裕.如图是近十年我国农村与城镇居民的恩格尔系数折线图,由图可知下列结论正确的是( )
A.城镇居民从2013年开始进入“最富裕”水平
B.农村居民恩格尔系数的平均数低于
C.城镇居民恩格尔系数的第45百分位数高于
D.全国居民恩格尔系数等于农村居民恩格尔系数和城镇居民恩格尔系数的平均数
【答案】C
【分析】对于A,直接观察折线统计图即可判断;对于B,结合平均数的定义以及图中数据判断即可;对于C,结合百分位数的定义即可判断;对于D,无法确定农村居民与城镇居民的比例,由此即可判断.
【详解】对于A:从折线统计图可知2015年开始城镇居民的恩格尔系数均低于,
即从2015年开始进入“最富裕”水平,故A错误;
对于B:农村居民恩格尔系数只有2017、2018、2019这三年在30%到32%之间,
其余年份均大于,且2012、2013这两年大于(等于),
故农村居民恩格尔系数的平均数高于,故B错误;
对于C:城镇居民恩格尔系数从小到大排列(所对应的年份)前5位分别为2019、2018、2017、2021、2020,因为,
所以第45百分位数为第5位,即2020年的恩格尔系数,由图可知2020年的恩格尔系数高于,故C正确;
对于D:由于无法确定农村居民与城镇居民的比例,
故不能用农村居民恩格尔系数和城镇居民恩格尔系数的平均数作为全国居民恩格尔系数,故D错误.
故选:C.
14.(辽宁沈阳东北育才2024高三六模)某班学生每天完成数学作业所需的时间的频率分布直方图如右图,为响应国家减负政策,若每天作业布置量在此基础上减少5分钟,则减负后完成作业的时间的说法中正确的是( )
A.减负后完成作业的时间的标准差减少25
B.减负后完成作业的时间的方差减少25
C.减负后完成作业的时间在60分钟以上的概率为
D.减负后完成作业的时间的中位数为25
【答案】D
【分析】根据给定的频率分布直方图求出,利用方差、标准差的意义判断AB;求出减负前完成作业的时间在60分钟以上的概率及中位数判断CD.
【详解】由频率分布直方图可得:,解得,
减负后每天作业布置量减少5分钟,则减负后完成作业的时间的平均数减少5分钟,
而完成作业的时间波动大小不变,因此减负后完成作业的时间的标准差、方差不变,AB错误;
减负前完成作业时间在60分钟以上的频率为,减负后完成作业时间在60分钟以上的频率小于,
由此估计减负后完成作业的时间在60分钟以上的概率小于,C错误;
减负前,第一组的频率为,第二组的频率为,
则完成作业的时间的中位数在第二组的中间,即中位数为(分钟),
所以减负后完成作业时间的中位数为(分钟),D正确.
故选:D
15.(江苏南京外国语2024年2月开学考试)如图所示是中国2012-2021年汽车进、出口量统计图,则下列结论错误的是( )
A.2012-2021年中国汽车进口量和出口量都是有增有减的
B.从2018年开始,中国汽车的出口量大于进口量
C.2012-2021年中国汽车出口量的第60百分位数是106万辆
D.2012-2021年中国汽车进口量的方差大于出口量的方差
【答案】D
【分析】根据条形图,结合百分位数、方差的性质逐一判断即可.
【详解】由条形图可知2012-2021年中国汽车进口量和出口量都是有增有减的,所以选项A正确;
由条形图可知从2018年开始,中国汽车的出口量大于进口量,所以选项B正确;
2012-2021年中国汽车出口量由小到大排列为:,因此第60百分位数是,所以选项C正确;
由条形图可知2012-2021年中国汽车进口量的波动小于出口量的波动,因此2012-2021年中国汽车进口量的方差小于出口量的方差,所以选项D不正确,
故选:D
16.(广西柳州高级中学2024届高三5月适应性考试)如图所示,已知一质点在外力的作用下,从原点出发,每次向左移动的概率为,向右移动的概率为.若该质点每次移动一个单位长度,设经过5次移动后,该质点位于的位置,则( )
A. B. C. D.
【答案】D
【分析】由题意当时,的可能取值为1,3,5,且,根据二项分布的概率公式计算即可求解.
【详解】依题意,当时,的可能取值为1,3,5,且,
所以
.
故选:D.
17.(广西柳州高级中学2024届高三5月适应性考试)甲乙两名同学参加系列知识问答节目,甲同学参加了5场,得分是3,4,5,5,8,乙同学参加了7场,得分是3,3,4,5,5,7,8,那么有关这两名同学得分数据下列说法正确的是( )
A.得分的中位数甲比乙要小 B.两人的平均数相同
C.两人得分的极差相同 D.得分的方差甲比乙小
【答案】BCD
【分析】由中位数,极差的概念即可判断AC,由平均数、方差计算公式可分别判断BD.
【详解】对于A,甲的得分中位数是5,乙的得分中位数是5,故A错误;
对于B,甲的得分平均数是,乙的得分平均数是,故B正确;
对于C,甲的得分极差是,乙的得极差是,故C正确;
对于D,甲的得分方差是,
乙的得方差是,故D正确.
故选:BCD.
18.(山东青岛二中二模)为了解某中学学生假期中每天自主学习的时间,采用样本量比例分配的分层随机抽样,现抽取高一学生40人,其每天学习时间均值为8小时,方差为0.5,抽取高二学生60人,其每天学习时间均值为9小时,方差为0.8,抽取高三学生100人,其每天学习时间均值为10小时,方差为1,则估计该校学生每天学习时间的方差为( )
A.1.4 B.1.45 C.1.5 D.1.55
【答案】B
【分析】利用分层随机抽样的均值与方差公式即可解决.
【详解】由题意可得,该校学生每天学习时间的均值为
,
该校学生每天学习时间的方差为
.
故选:B
19.(2024届福建厦门一中最后一卷)在一次数学模考中,从甲、乙两个班各自抽出10个人的成绩,甲班的十个人成绩分别为,乙班的十个人成绩分别为.假设这两组数据中位数相同、方差也相同,则把这20个数据合并后( )
A.中位数一定不变,方差可能变大
B.中位数可能改变,方差可能变大
C.中位数一定不变,方差可能变小
D.中位数可能改变,方差可能变小
【答案】A
【分析】不妨设,表达出两组数据的中位数,根据中位数相同得到或,则合并后的数据中位数是或者,中位数不变,再设第一组数据的方差为,平均数为,第二组数据的方差为,平均数为,根据公式得到合并后平均数为,方差为,,得到结论.
【详解】不妨设,
则的中位数为,的中位数为,
因为,所以或,
则合并后的数据中位数是或者,所以中位数不变.
设第一组数据的方差为,平均数为,第二组数据的方差为,平均数为,
合并后总数为20,平均数为,方差为,
如果均值相同则方差不变,如果均值不同则方差变大.
故选:A.
20.(辽宁省实验2024届高三考前模拟)有一组样本数据:,其平均数为.(辽宁省实验2024届高三考前模拟)由这组数据得到新的样本数据:,2024,那么这两组数据一定有相同的( )
A.极差 B.中位数 C.方差 D.众数
【答案】A
【分析】由题意不妨设,由极差、中位数、方差以及众数的概念并结合的平均数为2024,即可逐一判断各个选项.
【详解】对于A,不妨设已经按照从小到大的顺序排列好了,
由其平均数为2024可知,,
所以两组数据的极差都是,故A正确;
对于B,取为满足题设,
但是的中位数为2023,
的中位数为,故B错误;
对于C,结合B选项以及题设可知,
的平均数是2024, 的平均数也是2024,
的方差为,
的方差为,故C错误;
对于D,的众数是2029,
的众数是2024,2029,故D错误.
故选:A.
21.(湖北武汉华师一2024届高三五月适应性考试)一只口袋装有形状、大小完全相同的3只小球,其中红球、黄球、黑球各1只.现从口袋中先后有放回地取球次,且每次取1只球,表示次取球中取到红球的次数,,则的数学期望为_________________________(用表示).
【答案】
【分析】由题知,,利用,可求得.
【详解】由题知,
,
,
,
.
故答案为:.
多选
22.(河北衡水中学2023-2024学年高三下学期自我提升测试)下列命题为真命题的是( )
A.若样本数据的方差为2,则数据的方差为17
B.一组数据8,9,10,11,12的第80百分位数是11.5
C.用决定系数比较两个模型的拟合效果时,若越大,则相应模型的拟合效果越好
D.以模型 去拟合一组数据时,为了求出经验回归方程,设,求得线性回归方程为,则c,k的值分别是和2
【答案】BCD
【分析】根据方差的性质即可判断A;根据百分位数计算公式即可判断B;根据决定系数的概念即可判断C;根据非线性回归方程的求法并结合对数运算性质即可判断D.
【详解】对A:若样本数据的方差为2,则数据的方差为,故A错误;
对B:,则其第80百分位数是,故B正确;
对C,根据决定系数的含义知越大,则相应模型的拟合效果越好,故C正确;
对D,以模型去拟合一组数据时,为了求出经验回归方程,设,
则,由题线性回归方程为,则,故的值分别是和2,故D正确.
故选:BCD.
23.(湖南长沙雅礼中学2024届高三一模)已知一组数据:,若去掉12和45,则剩下的数据与原数据相比,下列结论正确的是( )
A.中位数不变 B.平均数不变
C.方差不变 D.第40百分位数不变
【答案】AD
【分析】依次分别算出这组数据去掉12和45前后的平均数,方差,第40百分位数和中位数,对比即可得解.
【详解】将原数据按从小到大的顺序排列为,
其中位数为25,平均数是,
方差是,
由,得原数据的第40百分位数是第4个数24.
将原数据去掉12和45,得,
其中位数为25,平均数是,
方差是,
由,得新数据的第40百分位数是第3个数24,
故中位数和第40百分位数不变,平均数与方差改变,故A,D正确,B,C错误.
故选:AD.
24.(浙江宁波镇海中学2024适应性测试)下列选项中正确的有( )
A.若两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于1
B.在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高
C.已知随机变量服从正态分布,则
D.若数据的方差为8,则数据的方差为2
【答案】BD
【分析】由线性相关系数的性质可得A错误;由残差图的意义可得B正确;由正态分布的对称性可得C错误;利用方差的性质可得D正确;
【详解】A:若两个具有线性相关关系的变量的相关性越强,则线性相关系数的值越接近于1,故A错误;
B:在残差图中,残差点分布的水平带状区域越窄,说明模型的拟合精度越高,故B正确;
C:由随机变量服从正态分布,
所以根据正态分布的对称性可得,故C错误;
D:设数据的方差为,
因为数据的方差为8,
所以,解得,故D正确;
故选:BD.
25.(2024吉林长春东北师大附中高三七模)下列说法中,正确的命题是( )
A.以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和.
B.在线性回归模型拟合中,若相关系数的绝对值越小,则样本的线性相关性越强.
C.在回归分析中,决定系数的值越大,说明残差平方和越大.
D.在具有线性相关关系的两个变量的统计数据所得的回归直线方程中,,则.
【答案】AD
【分析】对选项A,两边取对数,可得,即可判断A正确,对选项B,根据相关系数的性质即可判断B错误,对选项C,根据的性质即可判断C错误,对选项D,根据回归直线方程过点,即可判断D正确.
【详解】对于A,,两边取对数,可得,则,
,,,故A正确,
对于B,若越大,则样本的线性相关性越强,故B错误;
对于C,在回归分析中,相关指数越大,残差平方和越小,回归效果就越好,故C错误;
对于D,回归直线方程中,,故D正确;
故选:AD
26.(湖南师大附中2023-2024学年高三下一模)下列说法中,正确的是( )
A.设有一个经验回归方程为,变量增加1个单位时,平均增加2个单位
B.已知随机变量,若,则
C.两组样本数据和.若已知且,则
D.已知一系列样本点的经验回归方程为,若样本点与的残差相等,则
【答案】BC
【分析】根据回归方程可判定A,根据正态分布可判定B,根据数据的平均数可判定C,根据回归方程及残差的概念可判定D.
【详解】若有一个经验回归方程,随着的增大,会减小,A错误;
曲线关于对称,因为,所以,
所以,B正确;
因为,
所以,
故,C正确;
经验回归方程为,且样本点与的残差相等,
则,所以,D错误.
故选:BC.
27.(湖北武汉二中2024高三最后一卷)盒子中有编号一次为1,2,3,4,5,6的6个小球(大小相同),从中不放回地抽取4个小球并记下编号,根据以下统计数据,可以判断一定抽出编号为6的小球的是( )
A.极差为5 B.上四分位数为5 C.平均数为3.5 D.方差为4.25
【答案】ABD
【分析】根据极差、四分位数、平均数及方差公式逐一判断即可.
【详解】假设抽出四张卡牌从小到大排列为
A.,得,,故A正确;
B.上四分位数为,得,,故B正确;
C.,存在,,,使得不抽出卡牌6,故C错误;
D.若未抽出卡牌6,则方差最大为,,,时,此时,,故D正确.
故选:ABD.
28.(湖南师大附中2024二模)某次数学考试后,为分析学生的学习情况,某校从某年级中随机抽取了名学生的成绩,整理得到如图所示的频率分布直方图.为进一步分析高分学生的成绩分布情况,计算得到这名学生中,成绩位于内的学生成绩方差为,成绩位于内的同学成绩方差为.则( )
参考公式:样本划分为层,各层的容量、平均数和方差分别为:、、;、、.记样本平均数为,样本方差为,.
A.
B.估计该年级学生成绩的中位数约为
C.估计该年级成绩在分及以上的学生成绩的平均数为
D.估计该年级成绩在分及以上的学生成绩的方差为
【答案】BCD
【分析】利用频率分布直方图中,所有直方图的面积之和为,列等式求出实数的值,可判断A选项;利用中位数的定义可判断B选项;利用总体平均数公式可判断C选项;利用方差公式可判断D选项.
【详解】对于A选项,在频率分布直方图中,所有直方图的面积之和为,
则,解得,A错;
对于B选项,前两个矩形的面积之和为,
前三个矩形的面积之和为,
设计该年级学生成绩的中位数为,则,
根据中位数的定义可得,解得,
所以,估计该年级学生成绩的中位数约为,B对;
对于C选项,估计成绩在分以上的同学的成绩的平均数为
分,C对;
对于D选项,估计该年级成绩在分及以上的学生成绩的方差为
,D对.
故选:BCD.
29.(河南郑州外国语2024高三适应性考试)近年来,中国电影行业发展迅猛,消费者追求电影剧情的高质量,重视电影内容正面传达的积极情绪,并且愿意为其买单.某机构调查到观众在观看电影时除了关注电影的剧情、情节外,还会关注电影的幕后团队、精神内涵价值观、参演人员等方面.如图所示为该机构调查的2023年中国网民观看电影时关注方面占比的统计表,则下列结论正确的是( )
A.2023年中国网民观看电影时超过40%的网民会关注参演人员
B.这8个方面占比的极差是31.77%
C.这8个方面占比的中位数为37.69%
D.2023年中国网民观看电影时至少有10.73%的网民既关注剧情、情节,又关注精神内涵价值观
【答案】ABD
【分析】结合题图数据,可得A;根据极差、中位数可判断BC;由集合运算及关系可得D.
【详解】选项A:由题图可知,2023年中国网民观看电影时关注参演人员的网民占比为48.97%,超过40%,A正确;
选项B:这8个方面占比的极差是,B正确;
选项C:这8个方面占比的中位数为,C错误;
选项D:由2023年中国网民观看电影时关注剧情、情节与精神内涵价值观二者之一的占比至多,
故2023年中国网民观看电影时既关注剧情、情节,又关注精神内涵价值观的占比至少为
,D正确.
故选:ABD.
30.(广东广州华南师大附中2024年5月月考)使用统计手段科学预测传染病可以保障人民群众的生命健康.下表和散点图为某段时间内全球某传染病感染病例在第一次监测到之后数量随时间的变化,以时间为自变量(单位为天),以监测到的病例总数为因变量,选择以下两个回归模型拟合随的变化:回归模型一:;回归模型二:,通过计算得出,则下列说法正确的是( )
1
5
7
12
16
20
2
9
12
29
63
101
A.使用回归模型一拟合的决定系数大于使用回归模型二的决定系数
B.通过模型二得出的经验回归方程的预报效果好于通过模型一得出的经验回归方程
C.在首例病例出现后45天,该传染病感染人数很有可能在200人左右
D.在首例病例出现后45天,该传染病的感染人数很有可能超过10000人
【答案】BD
【分析】根据已知条件所给的散点图,先分析得模型二的拟合效果更好,由此即可判断A、B两个选项,再将代入模型二的经验回归方程,即可判断C、D选项.
【详解】根据散点图可知模型二的拟合效果更好,拟合效果越好决定系数越大,
所以使用回归模型一拟合的决定系数小于使用回归模型二的决定系数,
所以A错误,B正确;
因为模型二的的拟合效果好,预报更准确,根据已知:,
,所以,将代入经验回归方程,
有,所以C错误,D正确.
故选:BD
31.(浙江杭州二中2024高三下开学考试)有一组互不相等的样本数据,平均数为.若随机剔除其中一个数据,得到一组新数据,记为,平均数为,则( )
A.新数据的极差可能等于原数据的极差
B.新数据的中位数不可能等于原数据的中位数
C.若,则新数据的方差一定大于原数据方差
D.若,则新数据的40%分位数一定大于原数据的40%分位数
【答案】ABC
【分析】根据极差、中位数、方差、百分位数的性质逐一判断即可.
【详解】不妨设原数据,新数据,
A:例如原数据为,新数据为,此时极差均为,故A正确;
B:原数据中位数为,新数据中位数为,可知或,
若,可得;若,可得;
综上所述:新数据的中位数不可能等于原数据的中位数,故B正确;
C:若,可知去掉的数据为,则,可得,
所以新数据的方差一定大于原数据方差,故C正确;
D:若,可知去掉的数据为,
因为,可知原数据的分位数为第3位数,
,可知新数据的分位数为第2位数与第3位数的平均数,
例如原数据为,新数据为,
此时新数据的分位数、原数据的分位数均为3,故D错误;
故选:ABC.
32.(安徽合肥一中2024届最后一卷)下表是某人上班的年收入(单位:万元)与上班年份的一组数据:
年份
1
2
3
4
5
6
7
收入
2.9
3.3
3.6
4.4
4.8
5.2
5.9
则下列命题正确的有( )
A.年收入的均值为4.3
B.年收入的方差为1.2
C.年收入的上四分位数为5
D.若与可用回归直线方程来模拟,则
【答案】AD
【分析】对于A:根据平均数定义运算求解;对于B:根据方差公式分析求解;对于C:根据百分位数的定义分析求解;对于D:根据线性回归方程必过样本中心点分析求解.
【详解】对于选项A:由题意可得:年收入的均值,故A正确;
对于选项B:由题意可得:
年份
1
2
3
4
5
6
7
收入
2.9
3.3
3.6
4.4
4.8
5.2
5.9
1.96
1
0.49
0.01
0.25
0.81
2.56
所以年收入的方差,故В错误;
对于选项C:因为,
所以年收入的上四分位数为第6个数据,是,故C错误;
对于选项D:因为年份的平均数,即样本中心点为,
所以,故D正确;
故选:AD.
33.(山东省实验2024届高三一模)下列命题正确的是( )
A.若样本数据的方差为2,则数据的方差为8
B.已知互不相同的30个样本数据,若去掉其中最大和最小的数据,剩下28个数据的20%分位数不等于原样本数据的20%分位数
C.若A,B两组成对数据的样本相关系数分别为,,则A组数据比B组数据的线性相关程度更强
D.若决定系数的值越接近于1,则表示回归模型的拟合效果越好
【答案】ABD
【分析】对于A:根据方差的性质可得;对于B:根据百分数的定义可得;对于C:根据相关系数的性质可得;对于D:根据决定系数的性质可得.
【详解】对于A:若样本数据的方差为2,则数据的方差为,A正确;
对于B:设原本数据从小到大为,因为,所以原样本数据的20%分位数为,去掉最大值和最小值后剩余数据按从小到大排列为,因为,所以剩下28个数据的20%分位数为,故不一样,B正确;
对于C:,故B组数据比A组数据的线性相关程度更强,C错误;
对于D:若决定系数的值越接近于1,则表示回归模型的拟合效果越好,D正确;
故选:ABD.
34.(山东省实验2024届高三二模)某景点工作人员记录了国庆假期七天该景点接待的旅游团数量.已知这组数据均为整数,中位数为18,唯一众数为20,极差为5,则( )
A.该组数据的第80百分位数是20
B.该组数据的平均数大于18
C.该组数据中最大数字为20
D.将该组数据从小到大排列,第二个数字是17
【答案】AC
【分析】设这组数从小到大排列为,由题意可得,,结合百分位数定义计算可得A;设出举出符合题意但不符合选项的一组数据即可B、D;结合众数与极差定义,借助反证法可得C.
【详解】设这组数从小到大排列为,
由中位数为18,故,
由唯一众数为20,故或,即可确定,
对A:由,则该组数据的第80百分位数是,即为,故A正确;
对B:该组数据可能为,
此时,故B错误;
对C:由题可知,若,则,此时只有,
故,从而有,,,与矛盾,
故,故C正确;
对D:同B中假设,该组数据可能为,故D错误.
故选:AC.
35.(山西大学附中2024届高三下月考)某地教师招聘考试,有3200人参加笔试,满分为100分,笔试成绩前20%(含20%)的考生有资格参加面试,所有考生的笔试成绩和年龄分别如频率分布直方图和扇形统计图所示,则( )
A.90后考生比00后考生多150人 B.笔试成绩的60%分位数为80
C.参加面试的考生的成绩最低为86分 D.笔试成绩的平均分为76分
【答案】BD
【分析】根据题意,由统计图表中的数据,结合频率分布直方图的面积和百分位数,以及平均数的计算公式,逐项判定,即可求解.
【详解】对于A中,由年龄的扇形统计图,可得90后的考生有人,
00后的考生有人,可得人,所以A不正确;
对于B中,由频率分布直方图性质,可得,
解得,则前三个矩形的面积和,
所以试成绩的分位数为分,所以B正确;
对于C中,设面试成绩的最低分为,由前三个矩形的面积和为,第四个矩形的面积为,则分,所以C不正确;
对于D中,根据频率分布直方图的平均数的计算公式,可得考试的平均成绩为:
分,所以D正确.
故选:BD.
36.(重庆巴蜀中学2024届高考适应性考试)在跳水比赛中,裁判给分计算运动员成绩规则如下:有7位裁判,对某选手一次跳水的给分均不相同,去掉一个最高分和一个最低分后,下列说法正确的是( )
A.剩下5位裁判给分的平均值一定变大
B.剩下5位裁判给分的极差一定变小
C.剩下5位裁判给分的中位数一定变大
D.剩下5位裁判给分的方差一定变小
【答案】BD
【分析】设7位裁判对每位选手给分分别为,结合平均数、极差、中位数和方差的概念与表示意义依次判断选项即可.
【详解】设7位裁判对每位选手给分分别为,
A:若7位裁判分别给分为1~7分,则原来平均值和去掉后的平均值都是,不变,故A错误;
B:由,所以,故B正确;
C:去掉一个最高分和一个最低分前的中位数是,
去掉一个最高分和一个最低分后的中位数是,故C错误;
D:由题意,极差变小,数据更稳定,所以方差变小,故D正确.
故选:BD.
37.(福建福州一中2024届高三5月模拟)下列说法中,正确的是( )
A.数据的第50百分位数为32
B.已知随机变量服从正态分布,;则
C.已知两个变量具有线性相关关系,其回归直线方程为;若,,,则
D.若样本数据的方差为2,则数据的方差为4
【答案】BC
【分析】根据第50百分位数为中位数判断A,根据正态分布的性质判断B,根据回归直线方程的性质判断C,根据方差的性质判断D.
【详解】对数据排列:,因为第50百分位数为中位数,所以50百分位数为,故A错误;
因为随机变量服从正态分布,,所以,所以,所以,所以,故B正确;
因为,,,则,故C正确;
因为样本数据的方差为2,所以数据的方差为,故D错误.
故选:BC.
38.(广东东莞高级中学三模)某设备生产的10件产品中有6件一等品,4件二等品,现从中任取4件,记随机变量为取出一等品的件数,随机变量为取出二等品的件数,若取出一件一等品得2分,取出一件二等品得分,随机变量为取出4件产品的总得分,则下列结论中正确的是( )
A.
服从超几何分布 B.
C. D.
【答案】ABD
【分析】根据已知条件,随机变量X,Y服从超几何分布,利用超几何分布的期望公式和方差公式,即可求解.
【详解】由题可知,
所以服从超几何分布,A正确;
因为,
所以,所以B正确;
因为,故C错;
,所以D正确.
故选:ABD.
39.(江苏南京外国语2024年2月开学考试)已知离散型随机变量服从二项分布,其中,记为奇数的概率为,为偶数的概率为,则下列说法中正确的有( )
A. B.时,
C.时,随着的增大而增大 D.时,随着的增大而减小
【答案】ABC
【分析】选项A利用概率的基本性质即可,B选项由条件可知满足二项分布,利用二项分布进行分析,选项C,D根据题意把的表达式写出,然后利用单调性分析即可.
【详解】对于A选项,由概率的基本性质可知,,
故A正确,
对于B选项,由时,离散型随机变量服从二项分布,
则,
所以,
,
所以,故B正确,
对于C,D选项,,
当时,为正项且单调递增的数列,
故随着的增大而增大故选项C正确,
当时,为正负交替的摆动数列,
故选项D不正确.
故选:ABC.
40.(重庆南开中学2024届高三5月模拟)某动物园研究了大量的A、B两种相似物种.记录其身长为x(单位:m)与体重y(单位:kg),通过计算得A、B两物种的平均身长为,标准差分别为,令A、B两物种的平均体重分别为、若A、B两物种其体重y对身长x的回归直线分别为,相关系数分别为现有两种物种中一身长为5.6m,体重为8.6kg的个体P,下列说法中正确的有( )
参考公式:相关系数回归方程中斜率和截距的最小二乘法估计公式分别为:;
方差:
A.
B.点到直线的距离大于其到直线的距离
C.点与点的距离大于其与点(的距离
D.A物种的体重标准差小于B物种的体重标准差
【答案】BC
【分析】对A:利用所给数据,分别计算出与即可得;对B:利用所给数据,分别计算出与即可得;对C:利用所给数据,分别计算出与即可得;对D:由所给公式计算可得,从而可计算出与,即可得解.
【详解】A选项:,
,故A错;
B选项:,
故B对;
C选项:,
,故C对;
D选项:,
∴,
∴,
∴,故D错.
故选:BC.
1
学科网(北京)股份有限公司
$$