专题19.1 数据的分析(举一反三讲义)数学新教材华东师大版八年级下册
2026-05-18
|
2份
|
41页
|
89人阅读
|
0人下载
精品
资源信息
| 学段 | 初中 |
| 学科 | 数学 |
| 教材版本 | 初中数学华东师大版八年级下册 |
| 年级 | 八年级 |
| 章节 | 19.1 数据的集中趋势,19.2 数据的离散程度,19.3 借助箱线图描述数据的分布 |
| 类型 | 教案-讲义 |
| 知识点 | 数据分析 |
| 使用场景 | 同步教学-新授课 |
| 学年 | 2026-2027 |
| 地区(省份) | 全国 |
| 地区(市) | - |
| 地区(区县) | - |
| 文件格式 | ZIP |
| 文件大小 | 767 KB |
| 发布时间 | 2026-05-18 |
| 更新时间 | 2026-05-18 |
| 作者 | 吴老师工作室 |
| 品牌系列 | 学科专项·举一反三 |
| 审核时间 | 2026-05-18 |
| 下载链接 | https://m.zxxk.com/soft/57911450.html |
| 价格 | 3.00储值(1储值=1元) |
| 来源 | 学科网 |
|---|
摘要:
本讲义聚焦初中数学“数据的分析”核心知识点,系统构建从集中趋势(算术平均数、加权平均数、中位数、众数)到离散程度(方差、离差平方和)及统计图表(四分位数与箱线图)的学习支架,层层递进培养数据处理能力。
资料以“题型+变式”设计为特色,结合生活实例(如课外书花费、招聘权重)引导学生用数学眼光观察数据,通过计算推理发展数学思维,借助图表分析强化数学语言表达。课中助力分层教学,课后便于学生查漏补缺,提升数据分析素养。
内容正文:
专题19.1 数据的分析(举一反三讲义)
【新教材华东师大版】
【题型1 算术平均数】 2
【题型2 加权平均数】 5
【题型3 中位数】 8
【题型4 众数】 10
【题型5 统计量的选择】 13
【题型6 方差】 15
【题型7 离差平方和】 18
【题型8 四分位数与箱线图】 21
【题型9 数据的分析】 24
知识点1 算术平均数
1. 一般地,对于n个数,,,,我们把叫作这n个数的算术平均数,简称平均数,记为,即.
2. 算术平均数的意义
反映一组数据的集中趋势,是度量一组数据波动大小的基准.
3. 算术平均数的特征
(1)一组数据的平均数是唯一的,与数据的排列顺序无关;
(2)平均数的大小与一组数据中的每个数据都有关系,其中任何数据的变动都会相应引起平均数的变动,且容易受极端值的影响.
4. 若,,,的平均数为,则有如下结论:
(1),,,的平均数为;
(2),,,的平均数为;
(3),,,的平均数为.
【题型1 算术平均数】
【例1】17位小学生的平均身高为,其中有一些低于,他们的平均身高是;另有一些高于,他们的平均身高是,最少有( )位学生的身高恰好是.
A.2 B.5 C.8 D.13
【答案】A
【分析】本题主要考查了平均数的应用以及通过设未知数、列方程求解整数解的知识,正确理解题意是解题的关键,先设身高低于为x人,高于为y人,恰好为为z人,根据总人数和身高总和不变列出方程,然后通过分析方程的整数解,即可找到身高恰好为的学生人数的最小值.
【详解】解:设身高低于为x人,高于为y人,恰好为为z人,
则,即,
17位小学生的身高总和为:,
低于的学生身高总和为:,
高于的学生身高总和为:,
恰好为的学生身高总和为:,
根据身高总和不变可得:,
将变形为,
代入中得:
即,
因为都是正整数,z是非负整数,则
当时,,
解得,
则,
当时,,
解得,
则,
当时,,
解得,
则,
要使z最小,即身高恰好为的学生最少,
由此当,,时,z最小为2,
所以最少有2为学生的身高恰好为.
故选:A.
【变式1-1】是的平均数,是的平均数,是平均数,则下列各式一定正确的是( )
A. B. C. D.
【答案】B
【分析】本题考查了算术平均数,掌握算术平均数的定义是解答本题关键;
根据算术平均数的定义解答即可.
【详解】解:∵是的平均数,是的平均数,是的平均数,
∴,,
∴.
故选:B.
【变式1-2】(24-25七年级上·四川成都·开学考试)(平均数的应用)六名裁判员给一名跳水运动员打分,若去掉一个最高分,则平均分为9.3分;若去掉一个最低分,则平均分为9.5分.最高分与最低分相差( )分.
A.0.2 B.1 C.1.2 D.1.8
【答案】B
【分析】本题主要考查了平均数的应用,先求出去掉一个最低分的总分数,再求出去掉一个最高分的总分数,然后作差即可得出答案.
【详解】解:(分),
所以最高分与最低分相差1分.
故选:B.
【变式1-3】(25-26九年级上·重庆长寿·开学考试)在整式,之间插入它们的平均数:,记作第一次操作,在与之间和与之间分别插入它们各自的平均数记作第二次操作,以此类推.
①第二次操作后,从左往右第四个整式为;
②第三次操作后,从左往右第2个整式为:;
③经过四次操作后,若,则所有整式的值之和为15;
④经过7次操作后,将得到128个整式.
以上四个结论正确的个数为( )
A.1个 B.2个 C.3个 D.4个
【答案】B
【分析】本题主要考查了平均数、整式的加减、数字规律等知识点,根据操作方式找出变化规律是解题的关键.
①根据第一次操作后所得整式,求出第二次操作后,从左往右的第四个整式即可判断;②求出第二次操作后的第二整式,即可判断②;③代入,求出经过4次操作后所得数据,并求和判断即可;④根据操作方式得出操作后所得整式个数的规律,然后求出经过7次操作后所得整式个数即可判断.
【详解】解:①第一次操作后:,
∵,
∴第二次操作后:,即第二次操作后,从左往右第四个整式为,故①正确,符合题意;
∵,
∴第三次操作后:,即第三次操作后,从左往右第2个整式为,故②正确,符合题意;
若,初始和为2,
第一次操作后:和3;
第二次操作后:和为;
第三次操作后数为:,
则第三次操作后和为,
第四次操作后数为:,
则第四次操作后:,即和为17,故③不符合题意;
第1次操作后有3个整式,第2次操作后有5个整式,第3次操作后有9个整式,第4次操作后有17个整式,由此发现第n次操作后有个整式,
∴第7次操作后得到个整式,故④不符合题意.
综上,①②正确,即正确的有2个.
故选:B.
知识点2 加权平均数
1. 实际问题中,一组数据里的各个数据的“重要程度”未必相同.因而,在计算这组数据的平均数时,往往给每个数据一个“权”.“权”是一组数据中各数据所占的比重,反映了某个数据的重要程度.
2. 若n个数中,出现次,出现次,,出现次(其中),则由平均数的定义可得其平均数为,该平均数称为该组数据的加权平均数.其中的权为,的权为,,的权为.
3. 算术平均数与加权平均数的区别与联系
用法的区别
①在实际问题中,当各数据的权相等时,计算平均数要采用算术平均数;②在实际问题中,当各数据的权不相等时,计算平均数就要采用加权平均数
影响因素的区别
①算术平均数易受极端值的影响;②加权平均数受总体中各数据所占权重的大小和各数据出现的次数(频数)的影响
联系
算术平均数是各数据的权相等时的加权平均数,即算术平均数是加权平均数的特殊情况,但加权平均数不一定是算术平均数
【题型2 加权平均数】
【例2】小明调查了班内20名同学本学期购买课外书的花费情况,并将结果绘制成统计图,那么这20名同学购买课外书的平均花费是 元.
【答案】69
【分析】利用加权平均数的定义即可得.
【详解】解:这20名同学购买课外书的平均花费是元,
故答案为:69.
【点睛】本题主要考查加权平均数,从扇形统计图中得出解题所需数据并熟练掌握加权平均数的定义是解题的关键.
【变式2-1】(25-26九年级上·安徽宣城·开学考试)某校评选先进班集体,从“学习”“卫生”“纪律”“活动参与”四个方面综合考核打分,各项满分均为分,所占比例如表:
项目
学习
卫生
纪律
活动参与
所占比例
若某班这四项得分(单位:分)依次为,,,,则该班四项综合得分为 分.
【答案】
【分析】本题主要考查加权平均数,解题的关键是掌握加权平均数的计算方法.根据加权平均数的计算方法列式计算即可.
【详解】解:该班四项综合得分为:(分),
故答案为:.
【变式2-2】(24-25九年级上·北京·开学考试)一位求职者参加某公司的招聘,面试和笔试的成绩分别是和,公司给出他这两项测试的平均成绩为,可知此次招聘中 (填“面试”或“笔试”)的权重较大.
【答案】面试
【分析】本题主要考查加权平均数,解题的关键是设出面试和笔试的权重,根据加权平均数的定义列出方程.设面试成绩所占百分比为,则笔试成绩所占百分比为,根据加权平均数的定义列出方程求解即可得出答案.
【详解】解:设面试成绩所占百分比为,则笔试成绩所占百分比为,
根据题意,得:,
解得:,
则,
∴此次招聘中面试的权重较大,
故答案为:面试.
【变式2-3】(24-25九年级下·福建漳州·期中)近期,中国在科研领域的人工智能项目取得了重大突破,在自然语言处理、图像识别等多个关键领域展现出卓越的性能,其创新的算法和广泛的应用前景引发了全球科研界和社会的关注.某初中学校为了解学生对这一前沿科技成果的关注情况以及学生上网习惯,开展了一次关于学生对人工智能项目关注情况及上网时间的问卷调查,结果如下表所示:基于上述数据,回答以下问题:
调查对象
参与调查人数(人)
对的关注度
日人均上网时间(分)
七年级学生
八年级学生
九年级学生
(1)全校学生对研发成果这个热点话题的关注度大约是多少?
(2)全校学生的日人均上网时间大约是多少分钟?
(3)从各年级对的关注度和上网时间,你能发现什么趋势?并分析可能的原因.
【答案】(1)71.5%
(2)68.5分钟
(3)见解析
【分析】(1)先分别计算出七、八、九年级中关注的学生人数,将这三个年级的关注人数相加,再除以全校参与调查的总人数,从而得到全校学生对该热点话题的关注度.
(2)先分别算出七、八、九年级学生的日上网总时间,把这三个年级的日上网总时间相加,再除以全校参与调查的总人数,以此求出全校学生的日人均上网时间.
(3)观察各年级对的关注度以及日人均上网时间的数据,总结出相应趋势,再结合初中各年级学生的学业等实际情况分析可能的原因.
本题主要考查了加权平均数的应用,熟练掌握加权平均数的计算方法是解题的关键.
【详解】(1)解:
答:全校学生对这一热点话题关注度为71.5%.
(2)解: (分)
答:全校学生日人均上网时间为68.5分钟.
(3)解:关注度呈下降趋势,原因可能是学业负担加重;上网时间先上升后下降,原因
可能与对网络依赖程度和升学压力有关.
知识点3 中位数
1. 一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
2. 一组数据的中位数有且只有一个,代表这组数据的“中等水平”.其单位与数据的单位相同.
3. 中位数的求法
(1)把数据按从小到大(或从大到小)的顺序排列;
(2)确定这组数据的个数;
(3)当数据的个数是奇数时,取最中间的一个数作为中位数;当数据的个数是偶数时,取最中间两个数的平均数作为中位数.
【题型3 中位数】
【例3】(25-26九年级上·浙江温州·开学考试)一组数据从小到大排列为,且这组数据的中位数为9,则的值为( )
A.7 B.9 C.11 D.15
【答案】C
【分析】本题主要考查了已知中位数求参数,根据中位数的定义求解即可.
【详解】解:一组数据从小到大排列为,且这组数据的中位数为9,
则,
解得,
故选:C
【变式3-1】(24-25八年级下·福建福州·期末)有一组不重复的数据2,5,7,8,a,其中a为中位数,且为整数,则a的值是 .
【答案】6
【分析】本题考查了中位数:将一组数据按照从小到大(或从大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数.如果这组数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.
利用中位数的定义得到,即可作答.
【详解】解:∵有一组不重复的数据2,5,7,8,a,其中a为中位数,
∴将一组数据按照从小到大为2,5,a,7,8,
∵a为整数,
∴,
故答案为:6.
【变式3-2】(24-25九年级下·福建厦门·期中)某公司拟推出由7个盲盒组成的套装产品,现有10个盲盒可供选择,统计这10个盲盒的质量如图4所示.序号为1到5号的盲盒已选定,这5个盲盒质量的中位数恰好为100,6号盲盒从甲、乙、丙中选择1个,7号盲盒从丁、戊中选择1个,使选定7个盲盒质量的中位数仍为100,不可以选择( )
A.甲、丁 B.甲、戊 C.乙、丁 D.丙、丁
【答案】A
【分析】本题主要考查了用中位数做决策,由图像可知,要使选定7个盲盒质量的中位数仍为100,则需要选择100克以上的一个盲盒和100克以下的盲盒一个,根据选项即可得出正确的答案.
【详解】解:由图像可知,要使选定7个盲盒质量的中位数仍为100,
则需要从第6号盲盒和第7号盲盒里选择100克以上的一个盲盒和100克以下的盲盒一个,
因此可排除甲、丁;
故选:A.
【变式3-3】(2025·四川内江·模拟预测)某班四个小组的人数如下:10,10,x,8,已知这组数据的中位数与平均数相等,则x的值可能为( )
A.6 B.7 C.8 D.9
【答案】C
【分析】题目主要考查中位数及平均数的计算方法,理解题意,进行分类讨论是解题关键.
分三种情况进行分析:当时,当时,当时,然后根据中位数及平均数的计算方法求解即可.
【详解】解:当时,这组数据按从小到大顺序排列为x,8,10,10
由题意得,
则;
当时,这组数据按从小到大顺序排列为8,x,10,10
由题意得,
则(不合题意,舍);
当时,这组数据按从小到大顺序排列为8,10,10,x
由题意得,
则;
综上所述:或12,符合的只有选项C.
故选:C.
知识点4 众数
1. 一组数据中出现次数最多的那个数据叫做这组数据的众数.
2. 众数是描述一组数据集中趋势的量,一组数据可以不止一个众数,也可以没有众数,但如果一组数据存在众数,那么众数必然是这组数据中的数.
(1)若一组数据中有两个或两个以上数据出现的次数并列最多,那么这两个或两个以上的数据都为众数;
(2)若一组数据中所有数据出现的次数都相同,我们就说这组数据没有众数.
【题型4 众数】
【例4】(2025·河北石家庄·一模)五名学生投篮球,每人投10次,统计他们每人投中的次数,得到五个数据.若这五个数据的中位数是5,唯一众数是6,则他们投中次数的总和可能是( )
A.16 B.17 C.24 D.25
【答案】C
【分析】本题考查了确定一组数据的中位数和众数,根据题意,可得最大的三个数的和是:,两个较小的数一定是小于5的非负整数,且不相等,则可求得五个数的和的范围,进而判断.
【详解】解:∵5个数据组中位数是5,唯一众数是6,
∴最大的三个数的和是:,
则两个较小的数一定是小于5的非负整数,且不相等,即两个较小的数最大为3和4,最小为0和1,
故总和一定大于等于18而小于等于24,
所以他们投中次数的总和可能是24.
故选:C.
【变式4-1】(24-25八年级下·黑龙江绥化·期末)一组数据,,,,,,有唯一的众数,则为( )
A. B. C. D.
【答案】C
【分析】本题考查了众数的概念,根据众数的概念:一组数据中出现次数最多的数值即为众数,即可得到答案,熟练掌握众数的概念为解题的关键.
【详解】解:∵这组数据中,出现两次,又有唯一的众数,
∴,
故选:.
【变式4-2】如图为遵义市某年连续7天的天气情况,这7天最高气温的中位数与众数分别为( )
A.25.5,27 B.26,28 C.26.5,27 D.27,28
【答案】B
【分析】本题考查众数和中位数,明确题意、掌握众数和中位数是解题的关键.
根据这7天的最高气温,先按照从低到高排列,然后即可得到这组数据的中位数和众数,据此即可解答.
【详解】解:这7天最高气温从低到高排列是:23,24,25,26,27,28,28,
故这组数据的中位数是第4个26,28出现两次,次数最多,则众数是28.
故选:B.
【变式4-3】(24-25八年级下·广东汕头·阶段练习)如表是某班35位同学在实验操作中的得分情况:
得分(分)
5
6
7
8
9
10
人数(人)
2
3
5
♥
★
7
已知这35位同学实验操作得分的中位数和众数都是9分,成绩得8分的超过6人,则成绩得9分的人数是( )
A.9 B.10 C.11 D.12
【答案】C
【分析】本题考查了众数和中位数,设得8分的人数为x,9分的人数为y,则,且,再根据中位数和众数的定义逐一分析即可.
【详解】解:设得8分的人数为x,9分的人数为y,
则,且,
∴当时,,此时中位数为9分,众数为9分,符合题意;
当时,,此时中位数为8分,不符合题意;
当时,,此时中位数为8分,众数为8分和9分,不符合题意;
当时,,此时众数为8分,不符合题意;
∴成绩得9分的人数是11人,
故选:C.
知识点5 合理选用平均数、中位数和众数分析问题
1. 平均数、中位数和众数各自的特征
(1)平均数:计算时所有数据都参加运算,它能充分地利用数据所提供的信息,因此在现实中较为常用,但它易受极端值的影响.
(2)中位数:计算简单,受极端值影响较小,但不能充分利用所有数据的信息,而且当数据个数为偶数时,中位数不一定是数据中的数.
(3)众数:是一组数据中多次重复出现的那个数,往往是人们尤为关心的一个量,但各个数据的重复次数大致相等时,众数就没有特别的意义,但众数一定是数据中的数.
2. 数据分析时的选用依据
平均数
众数
中位数
当要解决的问题需要一组数据中的每个数据都参加运算时,应当选用平均数
当一组数据中
出现极端值时,
应选用中位数
当一组数据中有的数据重
复出现,以至于其他数据
的作用显得相对较小时,应选用众数
知识点6 从统计图分析数据的集中趋势
条形统计图
扇形统计图
众数
最高的直条所对的横轴的数
占比例最大的部分所对应的数
中位数
确定中间位置是第n个数,按从左到右的顺序依次计算纵轴对应的个数和,和为n时对应的横轴上的数就是中位数(若处于中间位置的数有两个,则求这两个数的平均数)
按从小到大的顺序计算所占百分比之和,处于最中间位置的数(或最中间位置两个数的平均数)就是中位数
平均数
按平均数的计算公式计算
【题型5 统计量的选择】
【例5】(24-25八年级下·河南信阳·期末)在一次“中华传统文化知识”演讲比赛中,有13名同学参加比赛,预赛成绩各不相同,取前6名参加决赛,其中一名同学已经知道自己的成绩,能否进入决赛,只需要再知道这13名同学成绩的( )
A.众数 B.中位数 C.方差 D.平均数
【答案】B
【分析】本题主要考查了中位数意义,要判断某同学是否进入前6名,需确定其成绩是否在前6位.由于共有13个各不相同的成绩,中位数是第7名的成绩.若该同学的成绩高于中位数,则其排名必在前6名.其他统计量(众数、方差、平均数)无法直接反映排名信息.
【详解】解:共有13名同学,成绩各不相同.中位数是将数据从小到大排列后的第7名成绩.若该同学的成绩高于中位数(即第7名成绩),则其排名必在前6名,
而中位数是唯一能直接反映中间位置、帮助判断是否可能进入前6名的指标.众数、方差、平均数均无法提供排名的直接信息,
故选B.
【变式5-1】(24-25八年级下·吉林长春·期末)某同学六次数学考试成绩分别为:86分、86分、78分、80分、85分、92分,老师想了解他数学成绩波动情况,则老师最应该关注他数学成绩的( )
A.平均数 B.中位数 C.众数 D.方差
【答案】D
【分析】本题考查了选择合适的统计量,根据题意要了解成绩的波动情况,需选择反映数据离散程度的统计量.
【详解】解:老师想了解他数学成绩波动情况,则老师最应该关注他数学成绩的方差.
故选:D.
【变式5-2】(24-25八年级下·吉林长春·期末)学校准备定制一款校服,对全校同学喜欢的颜色进行了问卷调查,统计结果如表所示.学校最终决定选择红色校服,其参考的统计量是( )
颜色
白色
红色
蓝色
学生人数
100
820
180
A.平均数 B.中位数 C.众数 D.方差
【答案】C
【分析】本题主要考查了众数的概念,众数是一组数据中出现次数最多的数据,学校选择人数最多的颜色作为校服颜色,对应的统计量是众数.
【详解】根据统计表,喜欢红色校服的学生人数为820,明显多于白色(100人)和蓝色(180人),因此,红色是这组数据中出现次数最多的颜色,即众数;
学校参考众数这一统计量,选择最受欢迎的红色作为校服颜色,其他统计量(平均数、中位数、方差)均不适用于类别数据的比较;
故选:C.
【变式5-3】下列表格是某公司员工情况表,你在了解这家公司的员工的平均工资时,你最应该关注的数据是( )
职位
普工
文员
经理
董事长
人数
3
10
2
1
工资(元)
1200
1500
1600
8000
A.平均数 B.众数与中位数
C.方差 D.最小数
【答案】B
【分析】此题主要考查统计量的选择,掌握平均数、中位数、众数、方差的意义是银题的关键.
根据题意,结合员工情况表,从统计量的角度分析可得答案.
【详解】解:根据题意,了解这家公司的员工的平均工资时,
结合员工情况表,即要全面的了解大多数员工的工资水平,
故最应该关注的数据众数与中位数,
故选:B.
知识点7 方差
1. 方差:各个数据与平均数差的平方的平均数.用表示,即.其中是数据,,,的平均数.
2. 适当变形后新数据的平均数和方差
样本数据
平均数
方差
,,,,
,,,,
,,,,
,,,,
【题型6 方差】
【例6】已知a,b,c,d,e五个数的平均数为m,方差为g,求的平均数和方差.
【答案】平均数为;方差为
【分析】本题主要考查方差和平均数的知识,熟练掌握方差和平均数的计算方法是解答此题的关键.
用m表示出第一组数据的和,用g表示出第一组数据的方差,再根据数据平均数和方差的计算公式解答即可.
【详解】解:∵a,b,c,d,e五个数的平均数为m,
∴,
∵a,b,c,d,e五个数的方差为g,
∴,
∴新数的平均数为:
,
∴方差为
.
【变式6-1】甲、乙、丙、丁四人参加滑雪比赛,经过三轮初赛,他们的平均成绩相同,方差分别是.你认为成绩更稳定的是 .
【答案】乙
【分析】本题考查了方差的意义.方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定.根据方差的定义,方差越小数据越稳定即可求解.
【详解】解:∵,
∴方差最小的为乙,
∴成绩更稳定的是乙.
故答案为:乙.
【变式6-2】如果已知一组数据的方差,那么的值为 .
【答案】
【分析】本题考查了求一组数据的平均数,利用方差求未知数据的值,解题关键是理解方差的公式.
先根据方差公式得出平均数,再利用平均数求出.
【详解】解:∵一组数据的方差,
∴,
解得:,
故答案为:.
【变式6-3】(多选题)已知一组正数的方差,则关于数据的说法,其中不正确的说法是( )
A.方差为 B.平均数为2 C.平均数为4 D.方差为
【答案】BD
【分析】此题考查了方差和平均数的求法,根据已知条件计算方差和平均数即可得到答案.
【详解】解:由方差的计算公式可得:
=[++…+ ]
=[++…+ ]
= ++…+-,
由,可得平均数
对于数据,平均数,
其方差为:.
故选:BD.
知识点8 离差平方和
1.离差平方和:各个数据与它们平均数之差的平方和,用S表示,即.
2.组内离差平方和与组间离差平方和: 一般地,设有n个数据,,,,它们的平均数为,离差平方和为.如果把这些数据分为两组,第1组有个数据,平均数为,离差平方和为;第2组有个数据,平均数为,离差平方和为,其中.通过计算可以得到以下等式:
.
通常称为组内离差平方和,它表达了两个组组内数据的离散程度;称为组间离差平方和,它表达了两个组之间的差异.一个合理的分组原则是使最小,同时使最大.由于总离差平方和不变,所以只需考虑达到最小即可.
【题型7 离差平方和】
【例7】在统计学里,分组的方法有很多,其中较常用的方法是使“组内离差平方和达到最小”.多组数据的组内离差平方和是指每组数据的离差平方和的和.现在有10个苹果的直径分别是65,75,76,69,80,70,76,81,78,80.按照“组内离差平方和达到最小”的方法,把这10个苹果按直径大小分成两组.
【答案】把10个苹果按直径大小分成两组是,.
【分析】先对数据排序,再尝试不同的连续分段划分方式,计算每种划分的总离差平方和,选出最小的那个划分.
【详解】解:将个数据由小到大排序为,,,,,,,,,.
计算不同分组的组内离差平方和,结果如下表:
分组情况
组内离差平方和
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
第一组个,第二组个
计算结果表明,第三种情况的组内离差平方和最小.
因此把个苹果按直径大小分成两组是,.
【点睛】本题考查了组内离差平方和的计算与最优分组,解题关键是先对数据排序,再通过计算不同连续分段划分的总离差平方和,找到最小值对应的分组.
【变式7-1】关于“组内离差平方和最小”原则,下列说法正确的是( )
A.只需让某一组的离差平方和最小即可 B.是所有组的组内离差平方和之和最小
C.分组后每组数据必须完全相同 D.与数据的集中程度无关
【答案】B
【分析】本题考查了组内离差平方和最小的原则,掌握其是指所有组的组内离差平方和之和最小是解题的关键.
先明确组内离差平方和最小的定义,再逐一判断每个选项是否符合该定义.
【详解】解:A、组内离差平方和最小是指所有组的离差平方和之和最小,并非某一组的离差平方和最小,A 错误,不符合题意;
B、组内离差平方和最小的定义就是所有组的组内离差平方和之和最小,B正确,符合题意;
C、分组无需每组数据完全相同,只需组内离差平方和之和最小即可,C错误,不符合题意;
D、离差平方和反映数据的集中程度,该原则与数据集中程度有关,D错误,不符合题意.
故选:B.
【变式7-2】现有两组数据:
A组:2,4,6.B组:8,10,12.
请计算这两组数据的组间离差平方和.
【答案】54
【分析】本题考查了组间离差平方和,熟练掌握组间离差平方和的计算方法是解题的关键;
先分别计算两组平均数,再计算两组的总平均数,然后计算两组数据的组间离差平方和.
【详解】解:组的平均数为,
组的平均数为,
两组的总平均数为.
故这两组数据的组间离差平方和为.
【变式7-3】(25-26八年级下·全国·周测)已知一组数据7,9,11,13,若将其分为两组,使得每组数据的离差平方和之和最小,则分组方式为 ,此时最小的离差平方和之和为 .
【答案】 和 4
【分析】本题考查了离差平方和的计算与分组优化知识点.解题关键在于明确离差平方和的计算公式;对有序数据,优先尝试相邻数据分组,以最小化组内波动;通过枚举所有可能的非空分组,计算并比较各组的离差平方和之和,从而找到最小值.
枚举所有可能的分组方式,计算每组数据的离差平方和,并求和,比较大小,找到最小值.
【详解】数据点有个,可能的分组方式包括一组个点另一组个点,或每组个点.计算每种分组的离差平方和之和:
当分组为和时,离差平方和之和为;
当分组为和时,离差平方和之和为;
当分组为和时,离差平方和之和为;
当分组为和时,离差平方和之和为;
当分组为和时,离差平方和之和为;
当分组为和时,离差平方和之和为;
当分组为和时,离差平方和之和为;
比较得,最小值为,对应分组为和.
故答案为:和;.
知识点9 四分位数与箱线图
在百分位数中,25%分位数、50%分位数、75%分位数是三个常用的百分位数。实际上,把一组数据从小到大排列,m50把这组数据分成前、后两部分,m25是前半部分数据的中位数,m75是后半部分数据的中位数。这样,m25,m50,m75就把这组数据分成个数相等的四部分,因此分别称为下四分位数、中位数和上四分位数,统称四分位数。
箱线图
【题型8 四分位数与箱线图】
【例8】(25-26八年级上·山东济南·期中)在综合与实践活动中,为比较西安和济南哪个城市夏天更热,小明选取了近两年7~8月每天的最高温度数据进行分析.下图反映了西安和济南在此时间段内每天的最高温度分布情况,则下列结论正确的个数是( )
①在此时间段内,济南每天的最高温度的下四分位数为;
②在此时间段内,济南每天的最高温度的中位数小于西安每天的最高温度的中位数;
③在此时间段内,西安每天的最高温度都高于济南每天的最高温度;
④在此时间段内,西安有超过一半的天数最高温度不低于;
A.1个 B.2个 C.3个 D.4个
【答案】B
【分析】本题考查了统计中的中位数,箱线图,四分位数,正确理解定义是解题的关键.
从箱线图中可获取数据的最大值、最小值和四分位数以及中位数,据此进行分析比较即可.
【详解】解:①由箱线图可得,在此时间段内,济南每天的最高温度的下四分位数为,正确;
②由箱线图可得,在此时间段内,济南每天的最高温度的中位数为,西安每天的最高温度的中位数为,故济南每天的最高温度的中位数小于西安每天的最高温度的中位数,故②正确;
③由箱线图可得西安的最高气温为,而济南存在高于的温度,故③错误;
④由箱线图可得西安每天的最高温度的中位数为,西安有超过一半的天数最高温度不低于,故④错误,
正确的有2个,
故选:B.
【变式8-1】(25-26八年级上·四川雅安·期中)一组数据1,1,3,4,5,5,6,7的分位数是 .
【答案】2
【分析】本题考查百分位数,掌握相关知识是解决问题的关键.根据分位数的定义,计算其位置,再求对应数值.
【详解】解:数据已排序:1,1,3,4,5,5,6,7,共8个数据.
25%分位数的位置计算公式为:,其中n为数据个数,
代入,得位置,
由于位置不是整数,取第2个和第3个数据的平均值,
即.
故答案为:2.
【变式8-2】(2025八年级上·全国·专题练习)已知甲、乙两班人数相同,在一次测试中两班的成绩箱线图如图所示.
(1)甲班成绩的中位数为___________,乙班成绩的上四分位数为___________.
(2)图中甲班对应的“箱子”被128分成两部分,其中“下半截箱子”较长,这说明了什么?
(3)由此图估计甲、乙两班平均分较高的班级是哪个?
【答案】(1)128;128
(2)甲班成绩处于中等偏下的同学的成绩差异要大于中等偏上的同学
(3)甲班平均分较高
【分析】本题考查箱线图的相关知识,涉及平均数,中位数,上四分位数,能够从箱线图中获取有用信息是解题的关键.四分位数应用于统计学的箱线图绘制,是统计学中分位数的一种,即把所有数值由小到大排列,并分成四等份,处于三个分割点的数值就是四分位数,箱线图中“箱体”的下底边对应数据为下四分位数,上底边对应数据为上四分位数,中间的线对应中位数.
(1)根据箱线图得到学生分数的大致分布情况,即可得出答案;
(2)根据箱线图的定义解答即可;
(3)根据箱线图得到学生分数在128分以上的大致情况,即可作出判断.
【详解】(1)解:由图可知,甲班成绩的中位数为128,乙班成绩的上四分位数为128,
故答案为:128;128;
(2)解:甲班成绩处于中等偏下的同学的成绩差异要大于中等偏上的同学;
(3)解:由两班成绩箱线图可以看出,甲班成绩的中位数为128,而乙班的上四分位数是128,同时,甲班的下四分位数明显高于乙班,由此估计甲班平均分较高.
【变式8-3】(25-26八年级上·全国·单元测试)甲、乙两组的测试成绩如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1)求甲组数据的四分位数;
(2)根据四分位数可绘制如下的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图;
(3)根据箱线图和对四分位数的理解,谈谈对两组成绩的看法.
【答案】(1),,
(2)见解析
(3)见解析
【分析】本题主要考查了四分位数的计算和箱线图的绘制与解读,通过这些工具可以直观地分析数据的分布特征.
(1)先将甲组数据从小到大排序,再计算出四分位数即可;
(2)根据甲组的四分位数绘制箱线图即可;
(3)根据箱线图和四分位数比较两组数据即可.
【详解】(1)解:将甲组的成绩从小到大排列为 60,70,70,80,89,91,92,96,98,100,所以,,;
(2)如答图所示:
(3)根据箱线图和四分位数可知甲组成绩的中位数和乙组相同,但甲组成绩明显比乙组的波动大.
【题型9 数据的分析】
【例9】(25-26九年级上·辽宁鞍山·开学考试)某校在4月12日“世界航天日.”期间举办了航天主题知识竞赛.为了了解学生的竞赛成绩,现从七年级和八年级中各随机抽取20名学生的成绩进行分析(满分为100分,得分用表示).共分为四组:.下面给出了部分信息.
七年级20名同学竞赛成绩数据:
64,70,75,76,78,78,85,85,85,85,86,89,90,90,94,95,98,98,99,100.
七、八年级竞赛成绩得分统计表
年级
平均数
中位数
众数
方差
七年级
86
85
96.6
八年级
86
86.5
88
69.8
八年级竞赛成绩扇形统计图
根据以上信息,解答下列问题:
(1)求七年级20名同学竞赛成绩的中位数;
(2)哪个年级的竞赛成绩更稳定?请说明理由;
(3)本次竞赛七年级有500名同学参加,八年级有480名同学参加,成绩为的同学获得一等奖.请估计本次竞赛七、八年级共有多少名同学获得一等奖.
【答案】(1)85.5
(2)八年级的竞赛成绩更稳定;理由见解析
(3)392名
【分析】本题考查了扇形统计图,求中位数,用方差判断数据的稳定性,用样本估计总体数量等知识,掌握这些知识是关键;
(1)七年级成绩按照从小到大排列,第10,11个数据的平均数即为中位数;
(2)根据方差的大小即可作出判断;
(3)先求得每个年级的学生总数与对应所获得一等奖所占比例的积,再求和即可求解.
【详解】(1)解:将七年级竞赛成绩按照从小到大排列,第10,11个数据分别为85,86,
七年级竞赛成绩的中位数为
答:七年级竞赛成绩的中位数为85.5;
(2)解:八年级的竞赛成绩更稳定,
八年级的方差为69.8,七年级的方差为96.6,,
八年级的竞赛成绩更稳定;
(3)解:(名),
答:估计本次竞赛七、八年级大约共有392名同学获得一等奖.
【变式9-1】某校七、八年级进行了数学期末检测,并从七、八年级中分别随机抽取了10名学生的检测成绩,整理如下:
七年级10名学生的成绩:96,86,96,86,99,96,90,100,89,92;
八年级10名学生的成绩:94,90,93,88,98,91,89,100,87,100;
年级
平均数
中位数
众数
方差
七年级
93
b
23.6
八年级
92
100
21.4
根据以上信息,解答下列问题:
(1)表格中____________;____________;____________;
(2)这次检测中,____________年级的成绩更稳定;
(3)我校八年级共有800人参加了此次数学检测,估计八年级学生参加此次检测成绩为优秀()的有多少人?
【答案】(1)93,94,96
(2)八
(3)560人
【分析】此题考查频数分布表、中位数、众数、平均数、用样本估计总体,解答本题的关键是明确题意.
(1)根据平均数、众数和中位数的定义进行求解即可;
(2)根据方差的意义即可得出答案;
(3)用总人数乘竞赛成绩优秀()的八年级学生所占的百分比即可.
【详解】(1)解:,
将七年级抽样成绩重新排列为:86,86,89,90,92,96,96,96,99,100,
中位数为,
七年级的成绩出现次数最多是96分,共出现3次,
∴众数(分),
故答案为:93,94,96;
(2)解:∵七年级的方差是23.6,八年级的方差是21.4,
∴八年级的成绩更稳定.
故答案为:八;
(3)解:由题意得:人
答:估计八年级学生参加此次检测成绩为优秀()的有560人.
【变式9-2】某校学生会发起了北京冬奥知识抢答比赛,共10道选择题,每题1分,满分为10分,答对8道以上(含8题)被评为“优秀”.学生会从七、八年级各随机抽取20人,对这20人的得分进行整理和分析.相关数据统计、整理如下:
抽取八年级20位学生的得分(单位:分):
6,6,7,7,7,7,8,8,8,9,9,9,9,9,9,9,9,9,10,10.
七八年级抽取的学生得分统计:
年级
七年级
八年级
平均数
8.25
8.25
中位数
8
a
众数
b
9
方差
1.85625
1.3875
根据以上信息,解答下列问题:
(1)填空: , ;
(2)已知七年级共15个班,每班有4人参赛,估计该校七年级学生知识抢答比赛成绩为“优秀”的人数;
(3)该校决定从七、八年级中选拔一个年级参加市级冬奥知识抢答比赛,根据以上数据分析,你认为应选择哪个年级?请说明理由
【答案】(1)9,8
(2)该校七年级学生知识抢答比赛成绩为“优秀”的人数大约有42人
(3)选择八年级学生,理由见解析
【分析】本题主要考查了众数、中位数、样本估计整体、扇形统计图等知识点,从图表中获取所需信息成为解题的关键.
(1)根据众数、中位数的定义即可解答;
(2)利用样本估计整体的方法求解即可;
(3)从平均数、中位数、方差角度综合分析即可.
【详解】(1)解:由扇形统计图可得:七年级得分8分的学生最多,即众数;
八年级得分人数从小到大排列,处于第10和11位的都是9,则中位数.
故答案为:9,8.
(2)解:估计该校七年级学生知识抢答比赛成绩为“优秀”的人数为:
(人).
答:该校七年级学生知识抢答比赛成绩为“优秀”的人数大约有42人.
(3)解:选择八年级学生,理由如下:
因为抽取的七年级学生比赛得分的平均数等于八年级学生比赛得分的平均数,八年级学生比赛得分的中位数与众数均大于七年级学生比赛得分的中位数与众数,且八年级学生比赛得分的方差小于七年级学生比赛得分的方差,说明八年级学生成绩更稳定,因此选择八年级.
【变式9-3】为弘扬泰山文化,某校举办了“泰山诗文大赛”活动,小学、初中部根据初赛成绩,各选出5名选手组成小学代表队和初中代表队参加学校决赛.两个队各选出的5名选手的决赛成绩如下图所示.
根据图中提供的信息,回答下列问题:
(1)将表格补充完整;
平均数(分)
中位数(分)
众数(分)
小学部
85
初中部
85
100
(2)已知初中部决赛成绩的方差为,请你计算出小学部决赛成绩的方差,并判断哪一个代表队选手成绩较为稳定.
【答案】(1)85,85,80
(2),小学代表队选手成绩较为稳定
【分析】本题考查了方差,平均数,众数,中位数.
(1)根据平均数,众数,中位数的定义解决问题即可.
(2)根据方差的定义求出方差,方差越小成绩越稳定.
【详解】(1)小学部平均数;85出现两次,次数最多,众数为85;
初中部成绩从小到大排列为70,75,80,100,100,中位数为80
补充表格如下:
平均数(分)
中位数(分)
众数(分)
小学部
85
85
85
初中部
85
80
100
故答案为:85,85,80
(2)∵,
∴,
∴小学代表队选手成绩较为稳定.
2 / 30
学科网(北京)股份有限公司
$
专题19.1 数据的分析(举一反三讲义)
【新教材华东师大版】
【题型1 算术平均数】 2
【题型2 加权平均数】 3
【题型3 中位数】 4
【题型4 众数】 5
【题型5 统计量的选择】 7
【题型6 方差】 8
【题型7 离差平方和】 9
【题型8 四分位数与箱线图】 9
【题型9 数据的分析】 11
知识点1 算术平均数
1. 一般地,对于n个数,,,,我们把叫作这n个数的算术平均数,简称平均数,记为,即.
2. 算术平均数的意义
反映一组数据的集中趋势,是度量一组数据波动大小的基准.
3. 算术平均数的特征
(1)一组数据的平均数是唯一的,与数据的排列顺序无关;
(2)平均数的大小与一组数据中的每个数据都有关系,其中任何数据的变动都会相应引起平均数的变动,且容易受极端值的影响.
4. 若,,,的平均数为,则有如下结论:
(1),,,的平均数为;
(2),,,的平均数为;
(3),,,的平均数为.
【题型1 算术平均数】
【例1】17位小学生的平均身高为,其中有一些低于,他们的平均身高是;另有一些高于,他们的平均身高是,最少有( )位学生的身高恰好是.
A.2 B.5 C.8 D.13
【变式1-1】是的平均数,是的平均数,是平均数,则下列各式一定正确的是( )
A. B. C. D.
【变式1-2】(24-25七年级上·四川成都·开学考试)(平均数的应用)六名裁判员给一名跳水运动员打分,若去掉一个最高分,则平均分为9.3分;若去掉一个最低分,则平均分为9.5分.最高分与最低分相差( )分.
A.0.2 B.1 C.1.2 D.1.8
【变式1-3】(25-26九年级上·重庆长寿·开学考试)在整式,之间插入它们的平均数:,记作第一次操作,在与之间和与之间分别插入它们各自的平均数记作第二次操作,以此类推.
①第二次操作后,从左往右第四个整式为;
②第三次操作后,从左往右第2个整式为:;
③经过四次操作后,若,则所有整式的值之和为15;
④经过7次操作后,将得到128个整式.
以上四个结论正确的个数为( )
A.1个 B.2个 C.3个 D.4个
知识点2 加权平均数
1. 实际问题中,一组数据里的各个数据的“重要程度”未必相同.因而,在计算这组数据的平均数时,往往给每个数据一个“权”.“权”是一组数据中各数据所占的比重,反映了某个数据的重要程度.
2. 若n个数中,出现次,出现次,,出现次(其中),则由平均数的定义可得其平均数为,该平均数称为该组数据的加权平均数.其中的权为,的权为,,的权为.
3. 算术平均数与加权平均数的区别与联系
用法的区别
①在实际问题中,当各数据的权相等时,计算平均数要采用算术平均数;②在实际问题中,当各数据的权不相等时,计算平均数就要采用加权平均数
影响因素的区别
①算术平均数易受极端值的影响;②加权平均数受总体中各数据所占权重的大小和各数据出现的次数(频数)的影响
联系
算术平均数是各数据的权相等时的加权平均数,即算术平均数是加权平均数的特殊情况,但加权平均数不一定是算术平均数
【题型2 加权平均数】
【例2】小明调查了班内20名同学本学期购买课外书的花费情况,并将结果绘制成统计图,那么这20名同学购买课外书的平均花费是 元.
【变式2-1】(25-26九年级上·安徽宣城·开学考试)某校评选先进班集体,从“学习”“卫生”“纪律”“活动参与”四个方面综合考核打分,各项满分均为分,所占比例如表:
项目
学习
卫生
纪律
活动参与
所占比例
若某班这四项得分(单位:分)依次为,,,,则该班四项综合得分为 分.
【变式2-2】(24-25九年级上·北京·开学考试)一位求职者参加某公司的招聘,面试和笔试的成绩分别是和,公司给出他这两项测试的平均成绩为,可知此次招聘中 (填“面试”或“笔试”)的权重较大.
【变式2-3】(24-25九年级下·福建漳州·期中)近期,中国在科研领域的人工智能项目取得了重大突破,在自然语言处理、图像识别等多个关键领域展现出卓越的性能,其创新的算法和广泛的应用前景引发了全球科研界和社会的关注.某初中学校为了解学生对这一前沿科技成果的关注情况以及学生上网习惯,开展了一次关于学生对人工智能项目关注情况及上网时间的问卷调查,结果如下表所示:基于上述数据,回答以下问题:
调查对象
参与调查人数(人)
对的关注度
日人均上网时间(分)
七年级学生
八年级学生
九年级学生
(1)全校学生对研发成果这个热点话题的关注度大约是多少?
(2)全校学生的日人均上网时间大约是多少分钟?
(3)从各年级对的关注度和上网时间,你能发现什么趋势?并分析可能的原因.
知识点3 中位数
1. 一般地,n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
2. 一组数据的中位数有且只有一个,代表这组数据的“中等水平”.其单位与数据的单位相同.
3. 中位数的求法
(1)把数据按从小到大(或从大到小)的顺序排列;
(2)确定这组数据的个数;
(3)当数据的个数是奇数时,取最中间的一个数作为中位数;当数据的个数是偶数时,取最中间两个数的平均数作为中位数.
【题型3 中位数】
【例3】(25-26九年级上·浙江温州·开学考试)一组数据从小到大排列为,且这组数据的中位数为9,则的值为( )
A.7 B.9 C.11 D.15
【变式3-1】(24-25八年级下·福建福州·期末)有一组不重复的数据2,5,7,8,a,其中a为中位数,且为整数,则a的值是 .
【变式3-2】(24-25九年级下·福建厦门·期中)某公司拟推出由7个盲盒组成的套装产品,现有10个盲盒可供选择,统计这10个盲盒的质量如图4所示.序号为1到5号的盲盒已选定,这5个盲盒质量的中位数恰好为100,6号盲盒从甲、乙、丙中选择1个,7号盲盒从丁、戊中选择1个,使选定7个盲盒质量的中位数仍为100,不可以选择( )
A.甲、丁 B.甲、戊 C.乙、丁 D.丙、丁
【变式3-3】(2025·四川内江·模拟预测)某班四个小组的人数如下:10,10,x,8,已知这组数据的中位数与平均数相等,则x的值可能为( )
A.6 B.7 C.8 D.9
知识点4 众数
1. 一组数据中出现次数最多的那个数据叫做这组数据的众数.
2. 众数是描述一组数据集中趋势的量,一组数据可以不止一个众数,也可以没有众数,但如果一组数据存在众数,那么众数必然是这组数据中的数.
(1)若一组数据中有两个或两个以上数据出现的次数并列最多,那么这两个或两个以上的数据都为众数;
(2)若一组数据中所有数据出现的次数都相同,我们就说这组数据没有众数.
【题型4 众数】
【例4】(2025·河北石家庄·一模)五名学生投篮球,每人投10次,统计他们每人投中的次数,得到五个数据.若这五个数据的中位数是5,唯一众数是6,则他们投中次数的总和可能是( )
A.16 B.17 C.24 D.25
【变式4-1】(24-25八年级下·黑龙江绥化·期末)一组数据,,,,,,有唯一的众数,则为( )
A. B. C. D.
【变式4-2】如图为遵义市某年连续7天的天气情况,这7天最高气温的中位数与众数分别为( )
A.25.5,27 B.26,28 C.26.5,27 D.27,28
【变式4-3】(24-25八年级下·广东汕头·阶段练习)如表是某班35位同学在实验操作中的得分情况:
得分(分)
5
6
7
8
9
10
人数(人)
2
3
5
♥
★
7
已知这35位同学实验操作得分的中位数和众数都是9分,成绩得8分的超过6人,则成绩得9分的人数是( )
A.9 B.10 C.11 D.12
知识点5 合理选用平均数、中位数和众数分析问题
1. 平均数、中位数和众数各自的特征
(1)平均数:计算时所有数据都参加运算,它能充分地利用数据所提供的信息,因此在现实中较为常用,但它易受极端值的影响.
(2)中位数:计算简单,受极端值影响较小,但不能充分利用所有数据的信息,而且当数据个数为偶数时,中位数不一定是数据中的数.
(3)众数:是一组数据中多次重复出现的那个数,往往是人们尤为关心的一个量,但各个数据的重复次数大致相等时,众数就没有特别的意义,但众数一定是数据中的数.
2. 数据分析时的选用依据
平均数
众数
中位数
当要解决的问题需要一组数据中的每个数据都参加运算时,应当选用平均数
当一组数据中
出现极端值时,
应选用中位数
当一组数据中有的数据重
复出现,以至于其他数据
的作用显得相对较小时,应选用众数
知识点6 从统计图分析数据的集中趋势
条形统计图
扇形统计图
众数
最高的直条所对的横轴的数
占比例最大的部分所对应的数
中位数
确定中间位置是第n个数,按从左到右的顺序依次计算纵轴对应的个数和,和为n时对应的横轴上的数就是中位数(若处于中间位置的数有两个,则求这两个数的平均数)
按从小到大的顺序计算所占百分比之和,处于最中间位置的数(或最中间位置两个数的平均数)就是中位数
平均数
按平均数的计算公式计算
【题型5 统计量的选择】
【例5】(24-25八年级下·河南信阳·期末)在一次“中华传统文化知识”演讲比赛中,有13名同学参加比赛,预赛成绩各不相同,取前6名参加决赛,其中一名同学已经知道自己的成绩,能否进入决赛,只需要再知道这13名同学成绩的( )
A.众数 B.中位数 C.方差 D.平均数
【变式5-1】(24-25八年级下·吉林长春·期末)某同学六次数学考试成绩分别为:86分、86分、78分、80分、85分、92分,老师想了解他数学成绩波动情况,则老师最应该关注他数学成绩的( )
A.平均数 B.中位数 C.众数 D.方差
【变式5-2】(24-25八年级下·吉林长春·期末)学校准备定制一款校服,对全校同学喜欢的颜色进行了问卷调查,统计结果如表所示.学校最终决定选择红色校服,其参考的统计量是( )
颜色
白色
红色
蓝色
学生人数
100
820
180
A.平均数 B.中位数 C.众数 D.方差
【变式5-3】下列表格是某公司员工情况表,你在了解这家公司的员工的平均工资时,你最应该关注的数据是( )
职位
普工
文员
经理
董事长
人数
3
10
2
1
工资(元)
1200
1500
1600
8000
A.平均数 B.众数与中位数
C.方差 D.最小数
知识点7 方差
1. 方差:各个数据与平均数差的平方的平均数.用表示,即.其中是数据,,,的平均数.
2. 适当变形后新数据的平均数和方差
样本数据
平均数
方差
,,,,
,,,,
,,,,
,,,,
【题型6 方差】
【例6】已知a,b,c,d,e五个数的平均数为m,方差为g,求的平均数和方差.
【变式6-1】甲、乙、丙、丁四人参加滑雪比赛,经过三轮初赛,他们的平均成绩相同,方差分别是.你认为成绩更稳定的是 .
【变式6-2】如果已知一组数据的方差,那么的值为 .
【变式6-3】(多选题)已知一组正数的方差,则关于数据的说法,其中不正确的说法是( )
A.方差为 B.平均数为2 C.平均数为4 D.方差为
知识点8 离差平方和
1.离差平方和:各个数据与它们平均数之差的平方和,用S表示,即.
2.组内离差平方和与组间离差平方和: 一般地,设有n个数据,,,,它们的平均数为,离差平方和为.如果把这些数据分为两组,第1组有个数据,平均数为,离差平方和为;第2组有个数据,平均数为,离差平方和为,其中.通过计算可以得到以下等式:
.
通常称为组内离差平方和,它表达了两个组组内数据的离散程度;称为组间离差平方和,它表达了两个组之间的差异.一个合理的分组原则是使最小,同时使最大.由于总离差平方和不变,所以只需考虑达到最小即可.
【题型7 离差平方和】
【例7】在统计学里,分组的方法有很多,其中较常用的方法是使“组内离差平方和达到最小”.多组数据的组内离差平方和是指每组数据的离差平方和的和.现在有10个苹果的直径分别是65,75,76,69,80,70,76,81,78,80.按照“组内离差平方和达到最小”的方法,把这10个苹果按直径大小分成两组.
【变式7-1】关于“组内离差平方和最小”原则,下列说法正确的是( )
A.只需让某一组的离差平方和最小即可 B.是所有组的组内离差平方和之和最小
C.分组后每组数据必须完全相同 D.与数据的集中程度无关
【变式7-2】现有两组数据:
A组:2,4,6.B组:8,10,12.
请计算这两组数据的组间离差平方和.
【变式7-3】(25-26八年级下·全国·周测)已知一组数据7,9,11,13,若将其分为两组,使得每组数据的离差平方和之和最小,则分组方式为 ,此时最小的离差平方和之和为 .
知识点9 四分位数与箱线图
在百分位数中,25%分位数、50%分位数、75%分位数是三个常用的百分位数。实际上,把一组数据从小到大排列,m50把这组数据分成前、后两部分,m25是前半部分数据的中位数,m75是后半部分数据的中位数。这样,m25,m50,m75就把这组数据分成个数相等的四部分,因此分别称为下四分位数、中位数和上四分位数,统称四分位数。
箱线图
【题型8 四分位数与箱线图】
【例8】(25-26八年级上·山东济南·期中)在综合与实践活动中,为比较西安和济南哪个城市夏天更热,小明选取了近两年7~8月每天的最高温度数据进行分析.下图反映了西安和济南在此时间段内每天的最高温度分布情况,则下列结论正确的个数是( )
①在此时间段内,济南每天的最高温度的下四分位数为;
②在此时间段内,济南每天的最高温度的中位数小于西安每天的最高温度的中位数;
③在此时间段内,西安每天的最高温度都高于济南每天的最高温度;
④在此时间段内,西安有超过一半的天数最高温度不低于;
A.1个 B.2个 C.3个 D.4个
【变式8-1】(25-26八年级上·四川雅安·期中)一组数据1,1,3,4,5,5,6,7的分位数是 .
【变式8-2】(2025八年级上·全国·专题练习)已知甲、乙两班人数相同,在一次测试中两班的成绩箱线图如图所示.
(1)甲班成绩的中位数为___________,乙班成绩的上四分位数为___________.
(2)图中甲班对应的“箱子”被128分成两部分,其中“下半截箱子”较长,这说明了什么?
(3)由此图估计甲、乙两班平均分较高的班级是哪个?
【变式8-3】(25-26八年级上·全国·单元测试)甲、乙两组的测试成绩如下:
甲:91,96,70,89,60,70,100,80,92,98;
乙:92,93,70,88,82,75,96,80,92,95.
(1)求甲组数据的四分位数;
(2)根据四分位数可绘制如下的箱线图,观察图中乙组的箱线图,绘制甲组的箱线图;
(3)根据箱线图和对四分位数的理解,谈谈对两组成绩的看法.
【题型9 数据的分析】
【例9】(25-26九年级上·辽宁鞍山·开学考试)某校在4月12日“世界航天日.”期间举办了航天主题知识竞赛.为了了解学生的竞赛成绩,现从七年级和八年级中各随机抽取20名学生的成绩进行分析(满分为100分,得分用表示).共分为四组:.下面给出了部分信息.
七年级20名同学竞赛成绩数据:
64,70,75,76,78,78,85,85,85,85,86,89,90,90,94,95,98,98,99,100.
七、八年级竞赛成绩得分统计表
年级
平均数
中位数
众数
方差
七年级
86
85
96.6
八年级
86
86.5
88
69.8
八年级竞赛成绩扇形统计图
根据以上信息,解答下列问题:
(1)求七年级20名同学竞赛成绩的中位数;
(2)哪个年级的竞赛成绩更稳定?请说明理由;
(3)本次竞赛七年级有500名同学参加,八年级有480名同学参加,成绩为的同学获得一等奖.请估计本次竞赛七、八年级共有多少名同学获得一等奖.
【变式9-1】某校七、八年级进行了数学期末检测,并从七、八年级中分别随机抽取了10名学生的检测成绩,整理如下:
七年级10名学生的成绩:96,86,96,86,99,96,90,100,89,92;
八年级10名学生的成绩:94,90,93,88,98,91,89,100,87,100;
年级
平均数
中位数
众数
方差
七年级
93
b
23.6
八年级
92
100
21.4
根据以上信息,解答下列问题:
(1)表格中____________;____________;____________;
(2)这次检测中,____________年级的成绩更稳定;
(3)我校八年级共有800人参加了此次数学检测,估计八年级学生参加此次检测成绩为优秀()的有多少人?
【变式9-2】某校学生会发起了北京冬奥知识抢答比赛,共10道选择题,每题1分,满分为10分,答对8道以上(含8题)被评为“优秀”.学生会从七、八年级各随机抽取20人,对这20人的得分进行整理和分析.相关数据统计、整理如下:
抽取八年级20位学生的得分(单位:分):
6,6,7,7,7,7,8,8,8,9,9,9,9,9,9,9,9,9,10,10.
七八年级抽取的学生得分统计:
年级
七年级
八年级
平均数
8.25
8.25
中位数
8
a
众数
b
9
方差
1.85625
1.3875
根据以上信息,解答下列问题:
(1)填空: , ;
(2)已知七年级共15个班,每班有4人参赛,估计该校七年级学生知识抢答比赛成绩为“优秀”的人数;
(3)该校决定从七、八年级中选拔一个年级参加市级冬奥知识抢答比赛,根据以上数据分析,你认为应选择哪个年级?请说明理由
【变式9-3】为弘扬泰山文化,某校举办了“泰山诗文大赛”活动,小学、初中部根据初赛成绩,各选出5名选手组成小学代表队和初中代表队参加学校决赛.两个队各选出的5名选手的决赛成绩如下图所示.
根据图中提供的信息,回答下列问题:
(1)将表格补充完整;
平均数(分)
中位数(分)
众数(分)
小学部
85
初中部
85
100
(2)已知初中部决赛成绩的方差为,请你计算出小学部决赛成绩的方差,并判断哪一个代表队选手成绩较为稳定.
2 / 30
学科网(北京)股份有限公司
$
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。