内容正文:
第十七章 数据的分析
知识点01 方差与标准差
1. 方差:各个数据与 差的平方的 .用表示,即.其中是数据,,,的 .
2. 标准差:方差的 .用字母s表示,即.
3. 方差和标准差的计算
(1)计算这组数据的平均数;
(2)计算各数据与平均数之差的平方,得到一组新数据;
(3)求这组数据的平均数,这个平均数就是原数据的方差;
(4)方差的算术平方根就是这组数据的标准差.
4. 方差和标准差的意义
方差和标准差都是用来描述一组数据波动情况的特征数,一般来说,一组数据的方差、标准差越小,说明这组数据波动越小,这组数据就越 .
5. 适当变形后新数据的平均数和方差
样本数据
平均数
方差
,,,,
,,,,
,,,,
,,,,
知识点02 离差平方和
1.离差平方和:各个数据与它们平均数之差的 ,用S表示,即.
2.组内离差平方和与组间离差平方和: 一般地,设有n个数据,,,,它们的平均数为,离差平方和为.如果把这些数据分为两组,第1组有个数据,平均数为,离差平方和为;第2组有个数据,平均数为,离差平方和为,其中.通过计算可以得到以下等式:
.
通常称为组内离差平方和,它表达了两个组组内数据的离散程度;称为组间离差平方和,它表达了两个组之间的差异.一个合理的分组原则是使最小,同时使最大.由于总离差平方和不变,所以只需考虑达到最小即可.
知识点03 频数和频率
1、 :在统计数据时,各个对象出现的次数有多有少,或者说出现的频繁程度不同,某个对象出现的次数称为该对象的 .频数与总次数的比值称为 .
2、 :频数与总次数的比值称为 ,即 = .
知识点04 频数分布表
1、 :在统计数据时,经常把数据按照不同的范围分成几个组,分成的组的个数称为 ,每一组两个端点的差称为 ,称这样画出的统计图表为 .
2、列频数分布表的步骤:
(1)计算极差,即计算最大值与最小值的差.
(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).
(3)将数据分组.
(4)列频数分布表.
知识点05 频数分布直方图
1、 :根据频数分布表,用横轴表示各分组数轴,纵轴表示各组数据的频数,绘制统计图直观地呈现频数的分布特征和变化规律,像这样的统计图称为 .
2、列频数分布直方图的步骤:
(1)计算极差,即计算最大值与最小值的差.
(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).
(3)确定分点,将数据分组.
(4)列频数分布表.
(5)绘制频数分布直方图.
3、条形统计图与频数分布直方图的区别和联系:
(1)联系——用途都是可以直观地表示出具体数量; 频数分布直方图是特殊的条形统计图.
(2)区别——条形统计图是直观地显示出具体数据;频数分布直方图是表现频数的分布情况.
(3)绘制的形式不同——条形统计图各条形分开;频数分布直方图的条形连在一起.
知识点06 四分位数与箱线图
在百分位数中,25%分位数、50%分位数、75%分位数是三个常用的百分位数。实际上,把一组数据从小到大排列,m50把这组数据分成前、后两部分,m25是前半部分数据的中位数,m75是后半部分数据的中位数。这样,m25,m50,m75就把这组数据分成个数相等的四部分,因此分别称为下四分位数、中位数和上四分位数,统称 。
箱线图
知识点07 箱线图绘制步骤
1、排序:数据从小到大排列
2、算五数:求最小值、Q1、中位数、Q3、最大值
3、找异常值:计算 IQR=Q3-Q1,标记超出Q1-1.5IQR或Q3+1.5IQR的点
4、画箱体:以 Q1、Q3 为边界画矩形,中间画中位数线
5、画须:从箱体两端连到非异常值的最值
6、标异常点:单独标出所有异常值
一、数据的波动
1.方差
错误:计算时漏除样本容量、用总体公式算样本方差、离差计算时均值符号出错。
注意:计算先求均值再算离差,区分总体 / 样本方差,单位与原数据不同。
1.(25-26九年级上·湖南株洲·期末)求一组数据方差的算式为: .由算式提供的信息,下列说法错误的是( )
A.该组数据的众数是6
B.该组数据的平均数是7
C.n的值是5
D.若该组数据加入两个数7,7,则这组新数据的方差变小
2.离差平方和
错误:误将离差直接求和,均值计算错误,漏算部分数据或平方项。
注意:先排序再求均值,逐项计算离差平方,确保数据无遗漏。
2.(25-26八年级上·贵州贵阳·期末)“强省会·劳动美”2025贵阳贵安职工篮球赛于7月19日晚正式落下帷幕,贵阳教育工会夺得机关组冠军.若比赛中六位队员得分(单位:分)分别为:7,7,8,8,9,9,则这六位队员得分的离差平方和为( )
A.1 B.2 C.4 D.8
二、数据的分布
1.频数分布表
错误:分组边界重复或遗漏,频数统计漏数 / 重复,组距不一致,未标注组限。
3.(25-26七年级下·陕西安康·期末)某校为了了解学生在校午餐所需的时间,抽取了20名学生在校午餐所需时间,获得如下的数据(单位:分):12、12、15、11、16、18、19、18、20、18、18、20、28、22、30、20、15、16、21、16.若将这些数据以4分为组距进行分组,则组数是( )
A.4组 B.5组 C.6组 D.7组
2.频数分布图
注意:组距统一,边界无重叠遗漏,纵轴标频数,直方图用连续矩形。
4.(24-25八年级上·北京·期末)小明同学统计了他所在小区居民每天早晨跑步的时间,并绘制了频数分布直方图.如图所示:①小明同学一共统计了74人;②每天早晨跑步不足30分钟的有14人;③每天早晨跑步分钟的人数最多;④每天早晨跑步分钟的人数最少.根据图中信息,上述说法中正确的是( )
A.③④ B.①②③ C.①③④ D.①②③④
3.由样本所占百分比估计总体的数量
错误:样本不具代表性、用错百分比、总体基数错误,导致估计结果偏差较大。
注意:确保样本随机有代表性,百分比计算准确,基数对应正确再估算。
5.(2024·贵州·中考真题)为了解学生的阅读情况,某校在4月23日世界读书日,随机抽取100名学生进行阅读情况调查,每月阅读两本以上经典作品的有20名学生,估计该校800名学生中每月阅读经典作品两本以上的人数为( )
A.100人 B.120人 C.150人 D.160人
4.求四分位数
错误:未先排序直接计算、位置索引公式误用、奇数偶数数据处理混淆。
注意:数据先升序排列,按规则定位分位数,注意不同算法的细微差异。
6.(25-26八年级上·全国·期末)一组数据(都是整数):5、5、7、8、9、7、11、13、10、6、a、b.这组数据的箱线图如图所示.若数据中,则a 和b的值分别为( )
A.5 和8 B.6和9 C.7和10 D.8和11
5.画箱线图
错误:未先排序直接绘图,须画到原始最值,漏标异常值,箱体边界对应错误。
注意:先算五数与异常值,须连非异常最值,箱体标清中位数,区分离群点。
7.(25-26八年级上·广东茂名·期末)为了提升学生体质健康水平,促进学生全面发展,学校开展了丰富多彩的课外体育活动.在八年级组织的篮球联赛中,甲、乙两名队员表现优异,记分员记录了他们在近六场比赛中关于得分、篮板的情况.
信息1:
甲的得分情况:20,14,28,30,32,32;
乙的得分情况:26,28,25,28,28,27.
信息2:
信息3:技术统计表
队员
平均得分
得分众数
得分中位数
平均每场篮板
篮板方差
甲
26
32
m
9
乙
27
n
27.5
8
根据以上信息,回答下列问题:
(1)表格中的__________,__________,__________(填“”“”或“”);
(2)本次队员综合得分按平均得分的,平均每场篮板的计算,综合得分越高表现越好,则甲、乙哪名队员的表现更好?
(3)从箱线图角度分析,甲、乙两名队员谁的抢篮板技术更稳定?
1.(25-26八年级上·贵州贵阳·期末)数据8,9,6,7,6,6,7,10的下四分位数是( )
A.6 B.6.5 C.7 D.7.5
2.(25-26八年级上·河南驻马店·期末)在“大家跳起来”的学校跳操比赛中,八年级参赛的10名学生成绩如图所示,对于这10名学生的参赛成绩,下列说法错误的是( )
A.众数是90分 B.中位数是85分
C.平均数是89分 D.分位数是90分
3.(25-26九年级下·湖北十堰·自主招生)有一组样本数据,,,,,,,其中是最小值,是最大值.下列结论正确的是()
A.,,,,的众数等于,,,,,,的众数
B.,,,,的中位数等于,,,,,,的中位数
C.,,,,的方差小于,,,,,,的方差
D.,,,,的极差不小于,,,,,,的极差
4.(25-26八年级上·山东·期末)箱线图是用来表示一组或多组数据分布情况的统计图,因形似箱子而得名.在箱线图中(如图①),箱体中部的粗实线表示中位数;中间箱体的上、下底,分别是数据的上四分位数(分位数)和下四分位数(分位数);整个箱体的高度为四分位距;位于最下面和最上面的实横线分别表示最小值和最大值(有时候箱子外部会有一些点,它们是数据中的异常值).图②为某地区年月和月的空气质量指数()箱线图.值越小,空气质量越好;值超过,说明污染严重.则下面说法错误的是( ).
A.该地区年月有严重污染天气
B.该地区年月的值比月的值集中
C.该地区年月的值比月的值集中
D.从整体上看,该地区年月的空气质量略好于月
5.(25-26八年级上·广东深圳·期末)如图是甲,乙两地某月日平均气温(单位:)箱线图,下列分析正确的是( )
A.甲地日平均气温的最小值是
B.乙地日平均气温的上四分位数是
C.甲地的“箱子”比乙地的长,说明这个月甲地的日平均气温比乙地波动小
D.乙地的“箱子”比甲地的靠上,说明这个月乙地日平均气温整体高于甲地
6.(25-26九年级上·河北石家庄·期末)由甲、乙、丙、丁和小强共五位同学组成的小组,在国学知识竞赛中的成绩如图所示,赛后发现图中小强的成绩少加了10分,在小强的成绩加上这10分后,与加分前相比,关于这五位同学的成绩所组成的一组数据,下列说法正确的是( )
A.小强的成绩一直位于组内中等水平
B.小强的成绩一直是这组数据的中位数
C.方差变小,小组成绩的稳定性增加
D.方差变大,小组成绩的稳定性降低
7.(2026·北京密云·二模)2025年12月4日是我国第十二个国家宪法日.某中学团委在学校党支部的支持下,对九年级500名学生进行了“法治知识”测试,并随机抽取了10名学生的测试成绩(满分100分),得到如下数据:
65
78
84
86
87
95
88
82
90
85
当测试成绩在85分及以上时可评为优秀,估计九年级500名学生中这次测试成绩可评为优秀的人数是_________.
8.(2026·北京石景山·一模)某地区九年级共有1800名女生,为了解这些女生一分钟仰卧起坐次数的分布情况,从中随机抽取了60名女生,测得她们的仰卧起坐数据(单位:次),并根据九年级女生体质健康标准整理如下:
等级
不及格
及格
良好
优秀
数据
学生人数
3
12
24
21
根据以上数据,估计这1800名女生中仰卧起坐等级为优秀的学生有______名.
9.(2026·北京朝阳·一模)某集团校有20000名学生.为了解这些学生单次使用电子屏幕时长的分布情况,从中随机抽取了1000名学生,获得他们单次使用电子屏幕时长的数据(单位:),数据整理如下:
分组
人数
650
157
101
63
29
根据以上信息,估计该集团校20000名学生单次使用电子屏幕时长不超过的人数为________.
10.(25-26八年级下·北京·课后作业)已知一组数据7,x,3,3,5,1的众数是3和5,则这组数据的方差是______.
11.(25-26八年级上·四川成都·期末)某市近几天气温(单位:)如下:5,3,2,3,1,,则这组数据的下四分位数是______.
12.(25-26八年级上·广东佛山·期末)学习了箱线图分析数据后,小明对两地在7、8月每天最高气温这组数据进行分析,绘制了如下图的箱线图.则下列结论正确的是___________(填写序号).
①在7至8月,B地每天最高气温的上四分位数为;
②在7至8月,B地每天最高气温的中位数小于A地每天最高气温的中位数;
③在7至8月,A地每天最高气温都高于B地每天最高气温;
④在7至8月,A地有超过一半的天数最高气温是不低于.
13.(25-26八年级上·陕西渭南·期末)为了增强学生的体质,体育老师组织本班学生进行投篮比赛,每人投5次,现从班级45人中随机抽取5名同学的投中次数,得到数据如下:5,5,4,3,3,则这组数据的离差平方和为_____.
14.(2026·北京门头沟·二模)为促进学生全面发展,充分培养学生兴趣,学校运动会新增了射击比赛,经过初赛,有甲、乙、丙、丁四位选手进入了决赛,在决赛中,每位选手要进行五轮比赛,记录员对这四位选手五轮比赛成绩(单位:环)的数据进行整理、描述和分析.下面给出了部分信息.
a.甲、乙两名选手这五轮成绩的条形统计图:
b.丙选手这五轮成绩依次为,,,,;
c.甲、乙、丙三位选手五轮比赛成绩的平均数、中位数、方差如下表:
统计量
选手
甲
乙
丙
平均数
中位数
方差
(1)表中的值为_____,的值为_____;
(2)丙选手的五轮成绩中,低于中位数的成绩有_____轮;
(3)根据这五轮比赛成绩,排名规则按照平均数大的排名靠前,若平均数相同,方差小的排名靠前,现已知丁选手其中三轮的成绩分别为环、环、环,经过最后的核算,丁选手获得第二名,则丁选手其余两轮的成绩分别为_____环、_____环、(成绩均为整数)
15.(2026·北京海淀·一模)某校新增了甲、乙、丙三门选修课程,为了解学生对这三门课程的满意度,学校在每门课程的选课学生中分别随机抽取了10名学生,记录他们对所选课程的满意度评分(满分10分,分值为整数),并对数据进行了整理、描述和分析.下面给出了部分信息.
a.学生对课程甲、乙的满意度评分的折线统计图:
b.学生对课程丙的满意度评分:7,8,6,4,5,9,x,6,10,9
c.三门课程的满意度评分的平均数、中位数如下:
课程名称
平均数
中位数
甲
7
乙
m
丙
根据以上信息,回答下列问题:
(1)课程甲的满意度评分的众数为______;
(2)表中m的值为______,信息b中x的值为______;
(3)考虑到极端数据对结果的影响,学校先将每门课程的满意度评分中与平均数的差的绝对值最大的一个数据去掉,再计算剩余数据的平均数、方差和中位数,并按照如下方法评估这三门课程:首先比较平均数,平均数较大者学生更加满意;若平均数相等,则比较方差,方差较小者学生更加满意;若平均数、方差分别相等,则中位数较大者学生更加满意.按照这种评估方法,这三门课程中满意度最高的是______,最低的是______(填“甲”“乙”或“丙”).
16.(2026·北京石景山·一模)某企业对员工进行综合素质测试,该测试包括理论知识和实践操作两部分.理论知识测试满分分,实践操作测试由10位评委打分,每位评委最高打10分,实践操作测试成绩为各位评委打分之和.按理论知识测试成绩占,实践操作测试成绩占计算综合成绩.甲、乙、丙三名员工理论知识测试的成绩分别为83分,85分,86分.对评委给三名员工的打分进行整理、描述和分析.下面给出了部分信息.
a.评委给甲、乙的打分的折线图:
b.评委给丙的打分:5,6,8,8,8,8,9,10,10,10;
c.评委给三名员工的打分的中位数、众数、方差及实践操作测试成绩:
中位数
众数
方差
实践操作测试成绩
甲
10
1.84
84
乙
8.5
87
(1)表中的值为______,的值为______;
(2)表中______1.84(填“>”“=”或“<”);
(3)企业按如下方式评估员工的综合素质:首先比较综合成绩,综合成绩更大者综合素质更高;若综合成绩相等,则比较评委给员工打分的平均数,平均数较大者综合素质更高.评估结果:这三名员工按综合素质由高到低依次为______.
17.(25-26七年级下·北京·期中)为了解某长跑俱乐部成员的跑步成绩情况,某学校的长跑社团收集了该俱乐部2023年和2024年半程马拉松“大师赛”的比赛成绩,分为两个研究小组进行调查研究.
(1)第一个研究小组随机抽取了该俱乐部2023年一些成员的比赛成绩,部分统计结果如下:
成绩x(分钟)
频数(人)
频率
2
0.04
0.08
8
17
0.34
10
0.20
3
0.06
5
0.10
1
0.02
合计
1
①请把上面的频数分布直方图补充完整;
②在2023年,该俱乐部共有300名成员,根据上面的统计结果估计该年俱乐部中成绩x满足的人数为______(结果精确到个位);
(2)第二个研究小组从该俱乐部2023年和2024年均参加了半程马拉松“大师赛”的选手中抽取了30名选手的跑步成绩,绘制了统计图(如图所示).
请根据以上信息解答下面的问题:
①小赵2024年的比赛用时比2023年的比赛用时______(填“多”“少”);
②将这30名选手中2024年成绩优于2023年成绩的人数记为m,其余选手人数记为n,则m______n(填“”“”“”).
18.(2026·北京门头沟·一模)随着科学技术的发展,人工智能在生产、生活中发挥着越来越大的作用.某中学为了解学生对智能助手的使用体验,随机抽取了名学生对四款智能助手的满意度进行评分(十分制),收集数据并进行整理、描述和分析.下面给出了部分信息:
.对两款智能助手满意度的评分数据的折线图:
.对款智能助手满意度的评分数据:
.对四款智能助手满意度的评分数据的平均数、中位数、众数和方差:
智能助手
平均数
中位数
众数
方差
(1)表中的值为 ,的值为 ;
(2)表中的取值范围是 (填序号);
① ② ③
(3)如果按照以下规则:先比较平均数,平均数较大者满意度更高;若平均数相同,则比较方差,方差较小者满意度更高;若平均数,方差均相同,则比较中位数,中位数较大者满意度更高;若平均数,方差,中位数均相同,则比较众数,众数较大者满意度更高,请对四款智能助手的满意度按照由高到低排序 .
19.(2026·北京顺义·一模)某学校举办歌唱比赛,5位评委对每位同学进行现场打分,对参加比赛的甲、乙、丙、丁每位同学得分的数据进行整理、描述和分析,下面给出了部分信息:
a.甲、乙两名同学得分的折线图:
b.丙同学的得分:,,,,;
c.四位同学得分的平均数、中位数、方差:
甲
乙
丙
丁
平均数
中位数
方差
根据以上信息,回答下列问题:
(1)表中n的值为_____;
(2)对每位同学,计算5个得分的平均数和方差,平均数较大的同学排序靠前;若平均数相同,则方差较小的同学排序靠前.已知丙在四位同学中排序第三,则这四位同学中排序最靠前的是____,m(m为整数)的值为_____.
20.(2026·北京大兴·一模)为了研究影响小麦叶绿素含量的相关因素,某校社团小组随机选取试验田内种植的15株小麦健康样本,测定其孕穗期功能叶片叶绿素含量(单位:),并对所得实验数据进行整理、描述和分析,下面给出了部分信息:
a.株小麦样本的叶绿素含量,按从小到大的顺序排列,如下:,,,,,,,,,,,,,,;
b.株小麦样本的叶绿素含量的平均数、中位数、众数如表:
平均数
中位数
众数
根据以上信息,回答下列问题:
(1)写出表中,的值:_______,_____;
(2)社团小组成员认为极端数据会影响整体的评估,因此去掉本次测定数据中的一个最大值和一个最小值,计算其余13个数据的平均数为,则______(填“”“”或“”);
(3)相关研究表明,施肥会影响植物叶绿素含量.为了评估新型有机肥的效果,随机选取10株生长状况相近的小麦样本,并随机平均分成甲、乙两组.对甲组施加新型有机肥,对乙组施加常规肥料,其他条件一致,经过一段时间再测量施肥后的叶绿素含量得到数据如下表:
甲组叶绿素含量
乙组叶绿素含量
若每组小麦叶绿素含量数据的方差越小,则认为叶绿素含量越稳定.结合两组数据的方差进行分析,_______组(填“甲”或“乙”)在施肥后对提升叶绿素含量的稳定性表现更好.
1 / 6
学科网(北京)股份有限公司
$
第十七章 数据的分析
知识点01 方差与标准差
1. 方差:各个数据与平均数差的平方的平均数.用表示,即.其中是数据,,,的平均数.
2. 标准差:方差的算术平方根.用字母s表示,即.
3. 方差和标准差的计算
(1)计算这组数据的平均数;
(2)计算各数据与平均数之差的平方,得到一组新数据;
(3)求这组数据的平均数,这个平均数就是原数据的方差;
(4)方差的算术平方根就是这组数据的标准差.
4. 方差和标准差的意义
方差和标准差都是用来描述一组数据波动情况的特征数,一般来说,一组数据的方差、标准差越小,说明这组数据波动越小,这组数据就越稳定.
5. 适当变形后新数据的平均数和方差
样本数据
平均数
方差
,,,,
,,,,
,,,,
,,,,
知识点02 离差平方和
1.离差平方和:各个数据与它们平均数之差的平方和,用S表示,即.
2.组内离差平方和与组间离差平方和: 一般地,设有n个数据,,,,它们的平均数为,离差平方和为.如果把这些数据分为两组,第1组有个数据,平均数为,离差平方和为;第2组有个数据,平均数为,离差平方和为,其中.通过计算可以得到以下等式:
.
通常称为组内离差平方和,它表达了两个组组内数据的离散程度;称为组间离差平方和,它表达了两个组之间的差异.一个合理的分组原则是使最小,同时使最大.由于总离差平方和不变,所以只需考虑达到最小即可.
知识点03 频数和频率
1、频数:在统计数据时,各个对象出现的次数有多有少,或者说出现的频繁程度不同,某个对象出现的次数称为该对象的频数.频数与总次数的比值称为频率.
2、频率:频数与总次数的比值称为频率,即频率= .
知识点04 频数分布表
1、频数分布表:在统计数据时,经常把数据按照不同的范围分成几个组,分成的组的个数称为组数,每一组两个端点的差称为组距,称这样画出的统计图表为频数分布表.
2、列频数分布表的步骤:
(1)计算极差,即计算最大值与最小值的差.
(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).
(3)将数据分组.
(4)列频数分布表.
知识点05 频数分布直方图
1、频数分布直方图:根据频数分布表,用横轴表示各分组数轴,纵轴表示各组数据的频数,绘制统计图直观地呈现频数的分布特征和变化规律,像这样的统计图称为频数分布直方图.
2、列频数分布直方图的步骤:
(1)计算极差,即计算最大值与最小值的差.
(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).
(3)确定分点,将数据分组.
(4)列频数分布表.
(5)绘制频数分布直方图.
3、条形统计图与频数分布直方图的区别和联系:
(1)联系——用途都是可以直观地表示出具体数量; 频数分布直方图是特殊的条形统计图.
(2)区别——条形统计图是直观地显示出具体数据;频数分布直方图是表现频数的分布情况.
(3)绘制的形式不同——条形统计图各条形分开;频数分布直方图的条形连在一起.
知识点06 四分位数与箱线图
在百分位数中,25%分位数、50%分位数、75%分位数是三个常用的百分位数。实际上,把一组数据从小到大排列,m50把这组数据分成前、后两部分,m25是前半部分数据的中位数,m75是后半部分数据的中位数。这样,m25,m50,m75就把这组数据分成个数相等的四部分,因此分别称为下四分位数、中位数和上四分位数,统称四分位数。
箱线图
知识点07 箱线图绘制步骤
1、排序:数据从小到大排列
2、算五数:求最小值、Q1、中位数、Q3、最大值
3、找异常值:计算 IQR=Q3-Q1,标记超出Q1-1.5IQR或Q3+1.5IQR的点
4、画箱体:以 Q1、Q3 为边界画矩形,中间画中位数线
5、画须:从箱体两端连到非异常值的最值
6、标异常点:单独标出所有异常值
一、数据的波动
1.方差
错误:计算时漏除样本容量、用总体公式算样本方差、离差计算时均值符号出错。
注意:计算先求均值再算离差,区分总体 / 样本方差,单位与原数据不同。
1.(25-26九年级上·湖南株洲·期末)求一组数据方差的算式为: .由算式提供的信息,下列说法错误的是( )
A.该组数据的众数是6
B.该组数据的平均数是7
C.n的值是5
D.若该组数据加入两个数7,7,则这组新数据的方差变小
【答案】A
【分析】根据方差算式,数据为6,8,8,6,7,计算平均数、众数、n值,并验证加入数据后的方差变化.
本题考查的是方差的计算,众数的含义,平均数的含义,掌握基本概念是解题关键.
【详解】∵ 算式中有五个平方项,对应数据点6,8,8,6,7,
A、∵ 数据中6和8均出现2次,7出现1次,
∴ 众数为6和8,并非仅6,故选项A错误.
B、∵ 数据总和为,,
∴ 平均数,选项B正确.
C、,选项C正确.
D、∵ 原始方差,
加入两个7后,数据为6,8,8,6,7,7,7,平均数仍为7,
新方差,,
∴ 方差变小,选项D正确.
故选:A.
2.离差平方和
错误:误将离差直接求和,均值计算错误,漏算部分数据或平方项。
注意:先排序再求均值,逐项计算离差平方,确保数据无遗漏。
2.(25-26八年级上·贵州贵阳·期末)“强省会·劳动美”2025贵阳贵安职工篮球赛于7月19日晚正式落下帷幕,贵阳教育工会夺得机关组冠军.若比赛中六位队员得分(单位:分)分别为:7,7,8,8,9,9,则这六位队员得分的离差平方和为( )
A.1 B.2 C.4 D.8
【答案】C
【分析】本题考查求离差平方和,先计算数据的平均值,再求每个数据与平均值之差的平方和即可.
【详解】解:∵平均数为,
∴ 离差平方和.
故选C.
二、数据的分布
1.频数分布表
错误:分组边界重复或遗漏,频数统计漏数 / 重复,组距不一致,未标注组限。
3.(25-26七年级下·陕西安康·期末)某校为了了解学生在校午餐所需的时间,抽取了20名学生在校午餐所需时间,获得如下的数据(单位:分):12、12、15、11、16、18、19、18、20、18、18、20、28、22、30、20、15、16、21、16.若将这些数据以4分为组距进行分组,则组数是( )
A.4组 B.5组 C.6组 D.7组
【答案】B
【分析】本题考查的是频数(率)分布表中的组数的计算,
根据组数=(最大值-最小值)÷组距(小数部分要进位)即可求解.
【详解】解:因为,
所以组数为5.
故选:B.
2.频数分布图
注意:组距统一,边界无重叠遗漏,纵轴标频数,直方图用连续矩形。
4.(24-25八年级上·北京·期末)小明同学统计了他所在小区居民每天早晨跑步的时间,并绘制了频数分布直方图.如图所示:①小明同学一共统计了74人;②每天早晨跑步不足30分钟的有14人;③每天早晨跑步分钟的人数最多;④每天早晨跑步分钟的人数最少.根据图中信息,上述说法中正确的是( )
A.③④ B.①②③ C.①③④ D.①②③④
【答案】C
【分析】本题考查直方图,从直方图中有效地获取信息是解题的关键.从直方图中有效地获取信息,逐一进行判断即可.
【详解】解:由图可知:小明同学一共统计了(人);故①正确;
每天早晨跑步不足30分钟的有(人);故②错误;
每天早晨跑步30~40分钟的人数最多;故③正确;
每天早晨跑步0~10分钟的人数最少;故④正确;
故选C.
3.由样本所占百分比估计总体的数量
错误:样本不具代表性、用错百分比、总体基数错误,导致估计结果偏差较大。
注意:确保样本随机有代表性,百分比计算准确,基数对应正确再估算。
5.(2024·贵州·中考真题)为了解学生的阅读情况,某校在4月23日世界读书日,随机抽取100名学生进行阅读情况调查,每月阅读两本以上经典作品的有20名学生,估计该校800名学生中每月阅读经典作品两本以上的人数为( )
A.100人 B.120人 C.150人 D.160人
【答案】D
【分析】本题考查用样本反映总体,利用样本百分比乘以总人数计算即可解题.
【详解】解:(人),
故选D.
4.求四分位数
错误:未先排序直接计算、位置索引公式误用、奇数偶数数据处理混淆。
注意:数据先升序排列,按规则定位分位数,注意不同算法的细微差异。
6.(25-26八年级上·全国·期末)一组数据(都是整数):5、5、7、8、9、7、11、13、10、6、a、b.这组数据的箱线图如图所示.若数据中,则a 和b的值分别为( )
A.5 和8 B.6和9 C.7和10 D.8和11
【答案】C
【分析】本题主要考查了箱线图,上四分位数,中位数.由箱线图可知:最小值是5,最大值是13,中位数是,下四分位数是,上四分位数是10,一共是12个数,即可求解.
【详解】解:由箱线图可知:最小值是5,最大值是13,中位数是,下四分位数是,上四分位数是10,一共是12个数,
所以第6和第7个数分别是7和8,第3和第4个数分别是6和7,第9和第10个数都是10,
所以a的值为7,上四分位数是10,
所以b的值为10.
故选C.
5.画箱线图
错误:未先排序直接绘图,须画到原始最值,漏标异常值,箱体边界对应错误。
注意:先算五数与异常值,须连非异常最值,箱体标清中位数,区分离群点。
7.(25-26八年级上·广东茂名·期末)为了提升学生体质健康水平,促进学生全面发展,学校开展了丰富多彩的课外体育活动.在八年级组织的篮球联赛中,甲、乙两名队员表现优异,记分员记录了他们在近六场比赛中关于得分、篮板的情况.
信息1:
甲的得分情况:20,14,28,30,32,32;
乙的得分情况:26,28,25,28,28,27.
信息2:
信息3:技术统计表
队员
平均得分
得分众数
得分中位数
平均每场篮板
篮板方差
甲
26
32
m
9
乙
27
n
27.5
8
根据以上信息,回答下列问题:
(1)表格中的__________,__________,__________(填“”“”或“”);
(2)本次队员综合得分按平均得分的,平均每场篮板的计算,综合得分越高表现越好,则甲、乙哪名队员的表现更好?
(3)从箱线图角度分析,甲、乙两名队员谁的抢篮板技术更稳定?
【答案】(1)29,28,
(2)乙队员表现更好
(3)乙更稳定
【分析】本题考查了方差,统计表,中位数,加权平均数,箱线图等知识.
(1)根据众数、中位数、方差的定义求解即可;
(2)分别求出甲、乙的综合得分,然后判断即可;
(3)根据箱线图的特点分析,合理即可.
【详解】(1)解:甲的得分从小到大排列:14,20,28,30,32,32,
∴中位数;
乙的得分情况:25,26,27,28,28,28,其中得分28的最多,
∴众数;
篮板箱线图(即箱线图)中,箱体的长度越大,通常表示数据的方差越大,可得,
故答案为:29,28,;
(2)解:甲的综合得分为,
乙的综合得分为,
∵,
∴乙队员表现更好.
(3)解:从箱线图可以看出,反映乙抢篮板情况的“箱子”比甲的“箱子”更矮,说明数据更集中,数据波动小,说明乙更稳定.(分析合理即可)
1.(25-26八年级上·贵州贵阳·期末)数据8,9,6,7,6,6,7,10的下四分位数是( )
A.6 B.6.5 C.7 D.7.5
【答案】A
【分析】本题考查了下四分位数.根据下四分位数是数据排序后下半部分的中位数,先排序数据,即可求解
【详解】解:数据序列:8,9,6,7,6,6,7,10.
排序后:6,6,6,7,7,8,9,10.
该组数据的下半部分为6,6,6,7
则下四分位数为这4个数的中位数:.
故选:A.
2.(25-26八年级上·河南驻马店·期末)在“大家跳起来”的学校跳操比赛中,八年级参赛的10名学生成绩如图所示,对于这10名学生的参赛成绩,下列说法错误的是( )
A.众数是90分 B.中位数是85分
C.平均数是89分 D.分位数是90分
【答案】B
【分析】本题考查了众数、中位数、平均数的定义、四分位数和折线统计图的知识,注重数形结合是解答本题的关键.根据众数、中位数、平均数、四分位数的定义和统计图中提供的数据分别列出算式,求出答案.
【详解】解:∵90出现了5次,出现的次数最多,
∴众数是90分,故A正确;
∵共有10个数,
∴中位数是第5、6个数的平均数,
∴中位数是分,故B错误;
∵平均数是分,故C正确;
∵从小到大排序,后5个数,90,90,90,95,95,
∴分位数是90分,故D正确.
综上所述,B选项符合题意,
故选:B.
3.(25-26九年级下·湖北十堰·自主招生)有一组样本数据,,,,,,,其中是最小值,是最大值.下列结论正确的是()
A.,,,,的众数等于,,,,,,的众数
B.,,,,的中位数等于,,,,,,的中位数
C.,,,,的方差小于,,,,,,的方差
D.,,,,的极差不小于,,,,,,的极差
【答案】B
【分析】本题考查了众数、中位数、方差、极差.根据众数、中位数、方差、极差的定义和性质,通过反例和直接推导判断各选项的正确性.
【详解】解:对于A:设数据为,,,,,,,则到的众数为,到的众数为和,两者不相等,∴A错误.
对于B:假设将到按从小到大排列,中位数为;到也从小到大排列,中位数也为,两者相等,∴B正确.
对于C:若所有数据相等(如均为),则两组数据的方差均为,相等而非小于,∴C错误.
对于D:设,,,,,,,是按从小到大排列的数据,
到的极差为,到的极差为,∵,,∴,∴D错误.
故选:B.
4.(25-26八年级上·山东·期末)箱线图是用来表示一组或多组数据分布情况的统计图,因形似箱子而得名.在箱线图中(如图①),箱体中部的粗实线表示中位数;中间箱体的上、下底,分别是数据的上四分位数(分位数)和下四分位数(分位数);整个箱体的高度为四分位距;位于最下面和最上面的实横线分别表示最小值和最大值(有时候箱子外部会有一些点,它们是数据中的异常值).图②为某地区年月和月的空气质量指数()箱线图.值越小,空气质量越好;值超过,说明污染严重.则下面说法错误的是( ).
A.该地区年月有严重污染天气
B.该地区年月的值比月的值集中
C.该地区年月的值比月的值集中
D.从整体上看,该地区年月的空气质量略好于月
【答案】B
【分析】本题考查箱线图,理解值箱线图与空气质量的关系是正确解答的关键.
从年月和月的空气质量指数()箱线图以及值与空气质量的关系进行解答即可.
【详解】解:A.从年月的空气质量指数()箱线图外部有点,所以该地区年月有严重污染天气,因此选项A不符合题意;
B.从年月和月的空气质量指数()箱线图可知,该地区年月的值比月的值波动较大,所以该地区年月的值比月的值集中,因此选项B符合题意;
C.从年月和月的空气质量指数()箱线图可知,该地区年月的值比月的值集中,因此选项C不符合题意;
D.从整体上看,该地区年月的空气质量略好于月,因此选项D不符合题意.
故选:B.
5.(25-26八年级上·广东深圳·期末)如图是甲,乙两地某月日平均气温(单位:)箱线图,下列分析正确的是( )
A.甲地日平均气温的最小值是
B.乙地日平均气温的上四分位数是
C.甲地的“箱子”比乙地的长,说明这个月甲地的日平均气温比乙地波动小
D.乙地的“箱子”比甲地的靠上,说明这个月乙地日平均气温整体高于甲地
【答案】D
【分析】本题考查了箱线图的认识,根据箱线图对每个选项逐一分析判断即可.
【详解】解:甲地日平均气温的最小值是,故A错误;
乙地日平均气温的上四分位数是在之间,故B错误;
甲地的“箱子”比乙地的长,说明这个月甲地的日平均气温比乙地波动大,故C错误;
乙地的“箱子”比甲地的靠上,说明这个月乙地日平均气温整体高于甲地,故D正确;
故选:D.
6.(25-26九年级上·河北石家庄·期末)由甲、乙、丙、丁和小强共五位同学组成的小组,在国学知识竞赛中的成绩如图所示,赛后发现图中小强的成绩少加了10分,在小强的成绩加上这10分后,与加分前相比,关于这五位同学的成绩所组成的一组数据,下列说法正确的是( )
A.小强的成绩一直位于组内中等水平
B.小强的成绩一直是这组数据的中位数
C.方差变小,小组成绩的稳定性增加
D.方差变大,小组成绩的稳定性降低
【答案】C
【分析】本题考查了中位数、方差的概念及性质,解题的关键是分别分析每个选项中涉及的统计量在小强成绩加分前后的变化情况.
根据中位数、方差,逐一分析选项,即可.
【详解】解:从图表可以看出由图可知,除小强外其他4名同学成绩最低高于80分,
小强的成绩加10分后成绩低于80分,此时小强成绩最低,不位于组内中等水平,故A,B选项错误,不符合题意;
小强的成绩加10分后,这5位同学成绩的波动性变小,
∴方差变小,小组成绩的稳定性增加,故C选项正确,符合题意;D选项错误,不符合题意;
故选:C.
7.(2026·北京密云·二模)2025年12月4日是我国第十二个国家宪法日.某中学团委在学校党支部的支持下,对九年级500名学生进行了“法治知识”测试,并随机抽取了10名学生的测试成绩(满分100分),得到如下数据:
65
78
84
86
87
95
88
82
90
85
当测试成绩在85分及以上时可评为优秀,估计九年级500名学生中这次测试成绩可评为优秀的人数是_________.
【答案】300
【详解】解:∵从九年级随机抽取的10名学生的测试成绩中,在85分及以上的有6个,
估计九年级500人中,这次成绩可评为优秀的人数是.
8.(2026·北京石景山·一模)某地区九年级共有1800名女生,为了解这些女生一分钟仰卧起坐次数的分布情况,从中随机抽取了60名女生,测得她们的仰卧起坐数据(单位:次),并根据九年级女生体质健康标准整理如下:
等级
不及格
及格
良好
优秀
数据
学生人数
3
12
24
21
根据以上数据,估计这1800名女生中仰卧起坐等级为优秀的学生有______名.
【答案】
630
【分析】先求出样本中仰卧起坐等级为优秀的频率,再用总人数乘该频率,即可得到估计结果.
【详解】解:由题意可知,抽取的样本中,优秀等级的学生人数为,样本容量为,
样本中优秀学生的频率为:.
估计名女生中优秀等级的学生人数为:.
9.(2026·北京朝阳·一模)某集团校有20000名学生.为了解这些学生单次使用电子屏幕时长的分布情况,从中随机抽取了1000名学生,获得他们单次使用电子屏幕时长的数据(单位:),数据整理如下:
分组
人数
650
157
101
63
29
根据以上信息,估计该集团校20000名学生单次使用电子屏幕时长不超过的人数为________.
【答案】13000
【分析】先由表格得出抽取1000名学生样本中单次使用电子屏幕时长不超过15min的人数,再求出该组数据的频率,最后用该集团校学生总人数乘以该频率,即可得到估计结果.
【详解】解:由表格可得,随机抽取的1000名学生中,单次使用电子屏幕时长不超过15min的人数为650人,
∴该组数据的频率为,
∴估计该集团校20000名学生单次使用电子屏幕时长不超过15min的人数为:.
10.(25-26八年级下·北京·课后作业)已知一组数据7,x,3,3,5,1的众数是3和5,则这组数据的方差是______.
【答案】
【分析】根据数据的众数确定出x的值,进而求出方差即可.
【详解】解:∵数据7,x,3,3,5,1的众数是3和5,
∴,
∴这组数据的平均数为,
则这组数据的方差为.
11.(25-26八年级上·四川成都·期末)某市近几天气温(单位:)如下:5,3,2,3,1,,则这组数据的下四分位数是______.
【答案】1
【分析】本题考查下四分位数的计算,需要将数据由小到大排列,然后根据下四分位数的定义求解即可.
【详解】解:将数据按从小到大的顺序排列:,1,2,3,3,5,共6个数据,这组数据的下半部分为,1,2,其中位数为1,故该组数据的下四分位数为1。
故答案为:1.
12.(25-26八年级上·广东佛山·期末)学习了箱线图分析数据后,小明对两地在7、8月每天最高气温这组数据进行分析,绘制了如下图的箱线图.则下列结论正确的是___________(填写序号).
①在7至8月,B地每天最高气温的上四分位数为;
②在7至8月,B地每天最高气温的中位数小于A地每天最高气温的中位数;
③在7至8月,A地每天最高气温都高于B地每天最高气温;
④在7至8月,A地有超过一半的天数最高气温是不低于.
【答案】②④
【分析】本题考查箱线图的统计意义,掌握箱线图各部分对应的统计量含义是解决问题的关键.根据箱线图各部分含义,逐个判断结论对错即可.
【详解】解:结论①:箱线图中,上四分位数对应箱的右边界,B地的箱右边界为,则上四分位数是,故①错误;
结论②:中位数对应箱内的线,B地的中位数(箱内线)低于A地的中位数,故②正确;
结论③:A地的最高气温高于B地的最高气温,并非“每天都高于”,故③错误;
结论④:A地的箱线图中,数据的中位数(箱体中间线)是,且中间线左右两侧的箱体大小相同,因此有超过一半的天数最高气温是不低于,故结论④正确.
综上所述,正确的结论是②④.
故答案为:②④.
13.(25-26八年级上·陕西渭南·期末)为了增强学生的体质,体育老师组织本班学生进行投篮比赛,每人投5次,现从班级45人中随机抽取5名同学的投中次数,得到数据如下:5,5,4,3,3,则这组数据的离差平方和为_____.
【答案】4
【分析】本题考查了离差平方和,掌握离差平方和是每个数据与平均数的差的平方之和是解题关键.先求出平均数,再根据离差平方和的定义求解即可.
【详解】解:数据的平均数为 .
离差平方和为.
故答案为:4.
14.(2026·北京门头沟·二模)为促进学生全面发展,充分培养学生兴趣,学校运动会新增了射击比赛,经过初赛,有甲、乙、丙、丁四位选手进入了决赛,在决赛中,每位选手要进行五轮比赛,记录员对这四位选手五轮比赛成绩(单位:环)的数据进行整理、描述和分析.下面给出了部分信息.
a.甲、乙两名选手这五轮成绩的条形统计图:
b.丙选手这五轮成绩依次为,,,,;
c.甲、乙、丙三位选手五轮比赛成绩的平均数、中位数、方差如下表:
统计量
选手
甲
乙
丙
平均数
中位数
方差
(1)表中的值为_____,的值为_____;
(2)丙选手的五轮成绩中,低于中位数的成绩有_____轮;
(3)根据这五轮比赛成绩,排名规则按照平均数大的排名靠前,若平均数相同,方差小的排名靠前,现已知丁选手其中三轮的成绩分别为环、环、环,经过最后的核算,丁选手获得第二名,则丁选手其余两轮的成绩分别为_____环、_____环、(成绩均为整数)
【答案】(1),
(2)
(3),
【分析】(1)根据平均数和方差的定义计算出结果即可;
(2)先求出丙选手的中位数为,根据丙选手有两轮的成绩为,可知丙选手的五轮成绩中,低于中位数的成绩有轮;
(3)根据排名的方法和丙选手获得第二名,分情况讨论确定性丙选手其余两轮成绩.
【详解】(1)解:由统计图可得甲选手五轮成绩为,,,,,
平均成绩(环);
由统计图可得乙选手五轮成绩为,,,,,由统计表可知其平均成绩为环,
方差为;
(2)解:将丙选手这五轮成绩按从小到大的顺序排列为,,,,,
排在第个的数据为,
丙选手五轮成绩的中位数为,
,
丙选手的五轮成绩中,低于中位数的成绩有轮;
(3)解:根据排名规则,先比较甲、乙、丙选手成绩的平均数,可知甲、乙选手成绩的平均数均为环,且大于丙选手成绩的平均数环,
丙选手不可能是第一名和第二名;
再比较甲、乙选手成绩的方差,
,
甲排在乙前,故甲、乙、丙的排名为甲、乙、丙,
最终丁选手获得第二名,
丁选手排在甲和乙之间,根据排名规则可知丁选手的平均分为环,方差<2.24,
丁选手五轮成绩的总环数为(环),
丁选手其中三轮的成绩分别为环、环、环,
其余两轮的成绩总环数为16(环),
乙选手也有三轮成绩分别为环、环、环,
丁其余两轮成绩不可能是环和环;
当丁选手的成绩为环和环时,
方差为,不符合题意;
当丁选手的成绩为环和环时,
方差为,符合题意,
丁选手其余两轮的成绩分别为环和环.
15.(2026·北京海淀·一模)某校新增了甲、乙、丙三门选修课程,为了解学生对这三门课程的满意度,学校在每门课程的选课学生中分别随机抽取了10名学生,记录他们对所选课程的满意度评分(满分10分,分值为整数),并对数据进行了整理、描述和分析.下面给出了部分信息.
a.学生对课程甲、乙的满意度评分的折线统计图:
b.学生对课程丙的满意度评分:7,8,6,4,5,9,x,6,10,9
c.三门课程的满意度评分的平均数、中位数如下:
课程名称
平均数
中位数
甲
7
乙
m
丙
根据以上信息,回答下列问题:
(1)课程甲的满意度评分的众数为______;
(2)表中m的值为______,信息b中x的值为______;
(3)考虑到极端数据对结果的影响,学校先将每门课程的满意度评分中与平均数的差的绝对值最大的一个数据去掉,再计算剩余数据的平均数、方差和中位数,并按照如下方法评估这三门课程:首先比较平均数,平均数较大者学生更加满意;若平均数相等,则比较方差,方差较小者学生更加满意;若平均数、方差分别相等,则中位数较大者学生更加满意.按照这种评估方法,这三门课程中满意度最高的是______,最低的是______(填“甲”“乙”或“丙”).
【答案】(1)8
(2),9
(3)丙,乙
【分析】(1)根据出现次数最多的数据是众数即可得解;
(2)先把数据从小到大排序,中间两个数据的平均数即为中位数,根据平均数的定义列方程即可求出x;
(3)将每门课程的满意度评分中与平均数的差的绝对值最大的一个数据去掉,再计算剩余数据的平均数、方差和中位数,先比较平均数,丙的平均数最大,即可判断满意度最高的课程,再比较甲乙的平均数与方差,即可得解;
【详解】(1)解:由折线统计图可知:课程甲的满意度评分中8分出现次数最多,众数为8;
(2)解:学生对课程乙的满意度评分从小到大排序为:5,5,6,6,7,8,8,9,9,10,
中位数为,
学生对课程丙的满意度评分的平均数为,
,
解得:;
(3)解:对于甲课程:,,
甲课程的满意度评分中与平均数的差的绝对值最大的一个数据是3,
则甲课程剩余数据从小到大排序为4,6,6,6,8,8,8,8,9,
中位数为8,平均数为;
方差为;
对于乙课程:,,
乙课程的满意度评分中与平均数的差的绝对值最大的一个数据是10,
则乙课程剩余数据从小到大排序为5,5,6,6,7,8,8,9,9,
中位数为7,平均数为;
方差为;
对于丙课程:,,
丙课程的满意度评分中与平均数的差的绝对值最大的一个数据是4,
则丙课程剩余数据从小到大排序为5,6,6,7,8,9,9,9,10,
中位数为8,平均数为 ,
方差为,
因为丙的平均数大于甲,乙的平均数,所以这三门课程中满意度最高的是丙;
因为甲、乙的平均数都是7,方差都是,但甲的中位数8高于乙的中位数7,所以这三门课程中满意度最低的是乙.
16.(2026·北京石景山·一模)某企业对员工进行综合素质测试,该测试包括理论知识和实践操作两部分.理论知识测试满分分,实践操作测试由10位评委打分,每位评委最高打10分,实践操作测试成绩为各位评委打分之和.按理论知识测试成绩占,实践操作测试成绩占计算综合成绩.甲、乙、丙三名员工理论知识测试的成绩分别为83分,85分,86分.对评委给三名员工的打分进行整理、描述和分析.下面给出了部分信息.
a.评委给甲、乙的打分的折线图:
b.评委给丙的打分:5,6,8,8,8,8,9,10,10,10;
c.评委给三名员工的打分的中位数、众数、方差及实践操作测试成绩:
中位数
众数
方差
实践操作测试成绩
甲
10
1.84
84
乙
8.5
87
(1)表中的值为______,的值为______;
(2)表中______1.84(填“>”“=”或“<”);
(3)企业按如下方式评估员工的综合素质:首先比较综合成绩,综合成绩更大者综合素质更高;若综合成绩相等,则比较评委给员工打分的平均数,平均数较大者综合素质更高.评估结果:这三名员工按综合素质由高到低依次为______.
【答案】(1)
,
(2)
(3)
乙、甲、丙
【分析】(1)根据折线图读出甲、乙的得分数据,将甲的得分从小到大排列,找出中间两个数的平均数即为中位数;找出乙的得分中出现次数最多的数即为众数.
(2)计算乙的平均数,利用方差公式计算乙的方差,或者通过观察数据的波动程度判断方差大小,再与甲的方差进行比较.
(3)根据加权平均数公式分别计算甲、乙、丙的综合成绩,若综合成绩相同,则比较实践操作测试成绩的平均数,从而确定排名顺序.
【详解】(1)解:由折线图可知,甲的次得分为:,
将甲的得分从小到大排列为:,
处于中间位置的两个数分别是和则甲的中位数,
由折线图可知,乙的次得分为:,
其中出现了次,出现次数最多则乙的众数,
故答案为:,.
(2)解:乙的平均数为,
乙的方差
,
因为,
所以,
故答案为:.
(3)解:丙的实践操作测试成绩为,
甲的综合成绩为,
乙的综合成绩为,
丙的综合成绩为,
因为,
所以乙的综合成绩最高甲和丙的综合成绩相等,
比较实践操作测试成绩的平均数甲的实践操作测试成绩平均数为,
丙的实践操作测试成绩平均数为,
因为,
所以甲的综合素质高于丙,
综上所述,这三名员工按综合素质由高到低依次为乙、甲、丙,
故答案为:乙、甲、丙.
17.(25-26七年级下·北京·期中)为了解某长跑俱乐部成员的跑步成绩情况,某学校的长跑社团收集了该俱乐部2023年和2024年半程马拉松“大师赛”的比赛成绩,分为两个研究小组进行调查研究.
(1)第一个研究小组随机抽取了该俱乐部2023年一些成员的比赛成绩,部分统计结果如下:
成绩x(分钟)
频数(人)
频率
2
0.04
0.08
8
17
0.34
10
0.20
3
0.06
5
0.10
1
0.02
合计
1
①请把上面的频数分布直方图补充完整;
②在2023年,该俱乐部共有300名成员,根据上面的统计结果估计该年俱乐部中成绩x满足的人数为______(结果精确到个位);
(2)第二个研究小组从该俱乐部2023年和2024年均参加了半程马拉松“大师赛”的选手中抽取了30名选手的跑步成绩,绘制了统计图(如图所示).
请根据以上信息解答下面的问题:
①小赵2024年的比赛用时比2023年的比赛用时______(填“多”“少”);
②将这30名选手中2024年成绩优于2023年成绩的人数记为m,其余选手人数记为n,则m______n(填“”“”“”).
【答案】(1)①图见解析;②48
(2)①少;②
【分析】本题主要考查了频数分布直方图,频数分布表,频数分布折线图:
(1)①用成绩为的人数除以其人数占比求出参与调查的人数再乘以成绩在分钟的人数占比,求出成绩在分钟的人数,进而补全统计图即可;②用300乘以样本中成绩在的人数占比即可得到答案;
(2)①根据统计图即可得到答案;②根据统计图即可得到答案.
【详解】(1)解:,
,
∴成绩在分钟的人数为4人,
补全统计图如下:
②人,
∴估计该年俱乐部中成绩x满足的人数为人;
(2)解:①由统计图可知,小赵2024年的比赛用时为80分钟,小赵2023年的比赛用时大于90分钟,
∴小赵2024年的比赛用时比2023年的比赛用时少,
故答案为:少;
②如图所示,由统计图可知在左上方的点少于右下方的点,即2024年成绩比2023年成绩好的人数多于不好的人数,
∴.
18.(2026·北京门头沟·一模)随着科学技术的发展,人工智能在生产、生活中发挥着越来越大的作用.某中学为了解学生对智能助手的使用体验,随机抽取了名学生对四款智能助手的满意度进行评分(十分制),收集数据并进行整理、描述和分析.下面给出了部分信息:
.对两款智能助手满意度的评分数据的折线图:
.对款智能助手满意度的评分数据:
.对四款智能助手满意度的评分数据的平均数、中位数、众数和方差:
智能助手
平均数
中位数
众数
方差
(1)表中的值为 ,的值为 ;
(2)表中的取值范围是 (填序号);
① ② ③
(3)如果按照以下规则:先比较平均数,平均数较大者满意度更高;若平均数相同,则比较方差,方差较小者满意度更高;若平均数,方差均相同,则比较中位数,中位数较大者满意度更高;若平均数,方差,中位数均相同,则比较众数,众数较大者满意度更高,请对四款智能助手的满意度按照由高到低排序 .
【答案】(1),;
(2)②;
(3).
【分析】(1)由图求出对款智能助手满意度的评分数据,根据众数定义即可求解;
由对款智能助手满意度的评分数据,根据中位数定义即可求解;
(2)由图求出对款智能助手满意度的评分数据结合表格的平均数,即可求出的取值范围;
(3)根据数据结合题意比较即可求解.
【详解】(1)由的折线图可知,对款智能助手满意度的评分数据:,
排序后为,即众数为;
由对款智能助手满意度的评分数据:,
即中位数的值为;
(2)由的折线图可知对款智能助手满意度的评分数据:,
排序后为,
由表格可知的平均数为,
∴,
∴的取值范围是②,
(3)先比较平均数,的平均数的平均数的平均数的平均数,
若平均数相同,则比较方差,的方差的方差的方差,
若平均数,方差均相同,则比较中位数,的中位数的中位数,
若平均数,方差,中位数均相同,则比较众数,的众数的众数,
∴四款智能助手的满意度按照由高到低排序为.
19.(2026·北京顺义·一模)某学校举办歌唱比赛,5位评委对每位同学进行现场打分,对参加比赛的甲、乙、丙、丁每位同学得分的数据进行整理、描述和分析,下面给出了部分信息:
a.甲、乙两名同学得分的折线图:
b.丙同学的得分:,,,,;
c.四位同学得分的平均数、中位数、方差:
甲
乙
丙
丁
平均数
中位数
方差
根据以上信息,回答下列问题:
(1)表中n的值为_____;
(2)对每位同学,计算5个得分的平均数和方差,平均数较大的同学排序靠前;若平均数相同,则方差较小的同学排序靠前.已知丙在四位同学中排序第三,则这四位同学中排序最靠前的是____,m(m为整数)的值为_____.
【答案】(1)
(2)乙;
【分析】(1)根据中位数的定义分析即可求解;
(2)比较平均数和方差,即可求解.
【详解】(1)解:甲同学的得分从小到大排列为:,,,
则中位数;
(2)解:依题意,丙在四位同学中排序第三,
乙、丁的平均成绩较大,排前两位,乙、丁平均数相同,而乙的方差较小,则这四位同学中排序最靠前的是乙;
当丙在四位同学中排序第三,则,
∴
当时,则甲排第三,不合题意;
当时,则则丙排第三,符合题意
20.(2026·北京大兴·一模)为了研究影响小麦叶绿素含量的相关因素,某校社团小组随机选取试验田内种植的15株小麦健康样本,测定其孕穗期功能叶片叶绿素含量(单位:),并对所得实验数据进行整理、描述和分析,下面给出了部分信息:
a.株小麦样本的叶绿素含量,按从小到大的顺序排列,如下:,,,,,,,,,,,,,,;
b.株小麦样本的叶绿素含量的平均数、中位数、众数如表:
平均数
中位数
众数
根据以上信息,回答下列问题:
(1)写出表中,的值:_______,_____;
(2)社团小组成员认为极端数据会影响整体的评估,因此去掉本次测定数据中的一个最大值和一个最小值,计算其余13个数据的平均数为,则______(填“”“”或“”);
(3)相关研究表明,施肥会影响植物叶绿素含量.为了评估新型有机肥的效果,随机选取10株生长状况相近的小麦样本,并随机平均分成甲、乙两组.对甲组施加新型有机肥,对乙组施加常规肥料,其他条件一致,经过一段时间再测量施肥后的叶绿素含量得到数据如下表:
甲组叶绿素含量
乙组叶绿素含量
若每组小麦叶绿素含量数据的方差越小,则认为叶绿素含量越稳定.结合两组数据的方差进行分析,_______组(填“甲”或“乙”)在施肥后对提升叶绿素含量的稳定性表现更好.
【答案】(1),
(2)
(3)甲
【分析】(1)根据中位数和众数的定义即可求解;
(2)计算其余13个数据的平均数,与比较大小,即可求解;
(3)分别计算甲、乙两组数据的方差,再根据方差越小数据越稳定的原则进行判断.
【详解】(1)解:中位数是第8个数,;出现最多,众数.
(2)解:.
(3)解:甲组数据的方差,乙组数据的方差,
因为,
所以甲组在施肥后对提升叶绿素含量的稳定性表现更好.
1 / 6
学科网(北京)股份有限公司
$