内容正文:
第二十三章 数据分析
知识点一、算术平均数
一般地,如果有n个数,那么叫做这n个数的算术平均数,简称平均数,“”读作“拔”.
1.求算术平均数时,只需将所有数据加起来求出总和,再除以数据的总个数即可;
2.通常,平均数可以用来表示一组数据的“集中趋势”;
3.在实际问题中,算数平均数要带单位,与原数据单位一致;
4.算术平均数的大小与一组数据里的每个数据均有关系;
5.算术平均数的缺点是 受个别值的影响,有时并不能代表一组数据的平均水平;
6.一组数据的平均值只有一个,每个数据的变化都会引起平均值的变化(若添上或去掉的这个数据刚好与平均数相同,就不会引起平均值的变化).
知识点二、平均数的简化公式
一般地,一组数据中的各个数值较大时,可以将各个数据减去一个适当的常数a(常数a通常取接近于这组数据的平均数较“整”的数),得到一组新数据:那么这组数据的平均数.
知识点三、加权平均数
1.权的概念
一组数据的平均数,不仅与这组数据中各个数据的数值有关,而且与各个数据的“重要程度”有关,我们把衡量各个数据“重要程度”的数值叫做权.
2.加权平均数的计算公式
(1)一般地,设为k个数据,依次为k个数据的权数,则称为这组数据的加权平均数.
(2)数据按的比计算平均数,则
(3)设数据所占的百分比分别为,且,则.
知识点四、中位数
一般地,将一组数据按大小顺序排列(从小到大或从大到小都可以),如果数据的个数是奇数,那么处于中间位置的数叫做这组数据的中位数;如果数据的个数是偶数,那么处于中间位置的两个数的平均数叫做这组数据的中位数.
1.一组数据的中位数不一定出现在这组数据中;
2.一组数据的中位数是唯一的;
3.由一组数据的中位数可以知道中位数以上和以下的数据各占一半;
4.中位数仅与数据按大小的排列后的位置有关,当一组数据中个别据与其他数据的大小差异很大时,通常用中位数来描述这组数据的集中趋势.
知识点五、众数
一组数据中出现次数最多的数据叫做这组数据的众数.
1.当一组数据中有较多的重复数据时,常用众数来描述这组数据的集中趋势;
2.一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个,也有可能没有众数;
3.众数是一组数据中出现次数最多的数据而不是数据出现的次数;
4.众数考查的是各个数据出现的频数,其大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映出这组数据的集中趋势.
知识点六、选择合适的统计量描述数据的集中趋势
平均数、众数、中位数都能反映出一组数据的集中趋势,其中平均数的应用最为广泛,三个统计量各有特点:
1.用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,对这组数据所包含的信息的反映最为充分,所以平均数应用最为广泛,特别是在进行统计推断时有着重要的作用,但平均数计算时比较繁琐,并且容易受到极端数据的影响.
2用众数作为一组数据的代表,主要是对各数据出现频数的考查,其大小只与这组数据的部分数据有关,可靠性比较差,但众数不受极端数据的影响,当一组数据中有不少数据多次重复出现时,常用众数来描述这组数据的集中趋势.
3.用中位数作为一组数据的代表,可靠性比较差,但中位数不受极端数据的影响,当一组数据中的个别数据变动较大时,可以用中位数来描述其集中趋势.
知识点七、极差的定义及计算公式
1.一组数据中的最大值与最小值的差叫做极差;
2.极差计算公式:极差=最大值-最小值.
极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大,一组数据的极差越小,这组数据的波动幅度也越小,也就越稳定.
极差反映一组数据两个极端值之间差异情况,仅由两个数据评判一组数据是不全面的.
知识点八、方差及标准差
1.方差的概念
在一组数据中,各个数据与它们的平均数的差的平均数,叫做这组数据的方差,通常用来表示,即(方差的基本公式).
若原数据是有单位的,则方差的单位就是原数据单位的平方.
2.方差的其他公式:
(1)或者,方差等于原数据平方的平均数减去平均数的平方;
(2),当一组数据较大时,可以仿照简化平均数的计算方法,将每个数据同时减去一个与它们的平均数接近的常数a,得到一组新数据那么方差公式也可以写成,方差等于新数据平方的平均数减去新数据平均数的平方.
①方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小;
②一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变;
③一组数据的每一个数据都变为原来的倍,则所得的一组新数据的方差变为原来的倍.
3.标准差
有时,也会用方差的算术平方根(标准差),即来描述一组数据的离散程度.
知识点九、极差、方差及标准差的区别与联系
1.联系:极差与方差、标准差都是表示一组数据离散程度的特征数;
2.区别:极差表示一组数据波动范围的大小,它受极端数据的影响较大;方差反映了一组数据与其平均值的离散程度的大小.方差越大,稳定性越小;反之,则稳定性越好.所以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差.
3.对于两组数据来说,极差大的那一组,不一定方差大;反过来,方差大的,极差也不一定大.
一、平均数
1.平均数计算出错
错误:平均数计算时出现遗漏
注意:在计算平均数时,所有的数据都参与运算,所以它易受极端值的影响.
例.已知一组数据,,的平均数是,那么另一组数据,,的平均数为 .
【答案】
【分析】本题考查了平均数,根据平均数的定义可得,则数据,,的平均数为,根据有理数的运算法则计算即可.
【详解】解:数据,,的平均数是,
,
,
则数据,,的平均数为
.
故答案为:.
2.加权平均数不会计算
错误:加权平均数不知道该如何计算
注意:若个数,,…,的权分别是,,…,,则,叫做这个数的加
权平均数.
若各数据权重相同,则算术平均数等于加权平均数.
例.老师在计算学生每学期的总评成绩时,按照“平时成绩占,考试成绩占”的比例计算.若小明的平时成绩为95分,考试成绩为90分,则他的总评成绩为 分.
【答案】
【分析】本题考查了加权平均数,根据总评成绩平时成绩考试成绩即可求解,解题的关键是掌握加权平均数的定义.
【详解】解:总评成绩为:,
故答案为:.
二、中位数和众数
1.中位数决策
错误:遇到中位数决策问题不会
注意:掌握中位数的概念,学会运用中位数的概念进行决策
例.已知一组数据,,,,,,的众数为,则这组数据的中位数为 .
【答案】4
【分析】本题考查了众数和中位数.
先根据众数定义求出x,再把这组数据从小到大排列,找出正中间的那个数就是中位数.
【详解】解:∵数据3,3,4,x,5,5,6的众数为3,
∴3出现的次数是3次,
∴,
数据重新排列是:,,,,,,
∴中位数是4.
故答案为:4.
2.众数
错误:众数的理解错误
注意:当各数据重复出现的次数大致相等时,它往往就没有什么特别意义.
例.下表为某班学生成绩的次数分配表.已知全班共有人,且众数为分,中位数为分,则之值为 .
成绩(分)
次数(人)
【答案】
【分析】本题结合代数式求值考查了众数与中位数的意义.众数是一组数据中出现次数最多的数据,注意众数可以不止一个;中位数是将一组数据从小到大或从大到小重新排列后,最中间的那个数最中间两个数的平均数,叫做这组数据的中位数.本题的关键是确定、之值.
由于全班共有人,则,结合众数为分,中位数为分,分情况讨论即可确定、之值,从而求出之值.
【详解】解:全班共有人,
,
又众数为分,
,,
,
当时,,中位数是第、两个数的平均数,都为分,则中位数为分,符合题意;
当时,,中位数是第、两个数的平均数,则中位数为分,不符合题意;
同理当,,,,,时,中位数都不等于分,不符合题意.
,.
.
故答案为.
三、方差
1.方差
错误:不会求方差
注意:在一组数据,,…,中,各个数据与平均数的差的平方的平均数叫做这组数据的方差,记作.计算公式是:.
例.某学习小组6个成员某次数学测验的分数如下:80,79,76,x,78,81,若该组数据平均数为79,则该组数据的方差是 .
【答案】
【分析】此题考查了平均数和方差的定义.平均数是所有数据的和除以所有数据的个数.方差的公式.
根据平均数确定出后,再根据方差的公式计算方差即可.
【详解】解:由平均数的公式得:,
解得,
则方差为.
故答案为:.
2.运用方差做决策
错误:不会利用方差进行做决策
注意:方差是用来衡量数据在平均数附近波动大小的量,方差越大,数据的波动性越大,方差越小,数据的波动性越小.
例.为了弘扬和传承中华优秀传统文化,某校举办了一场名为“经典文化传承大赛”的初赛,比赛设定满分为10分,参赛学生的得分均为整数.以下是甲、乙两组(每组10人)学生在初赛中的成绩记录(单位:分):甲组:6,7,9,10,6,5,6,6,9,6.乙组:10,7,6,9,6,7,7,6,7,5.
根据甲、乙两组学生的成绩,得到以下的统计表:
组别
平均数
中位数
众数
方差
甲组
7
6
乙组
7
7
2
(1)在以上成绩统计表中,___________,___________;
(2)__________组队员在初赛中发挥的更稳定(填“甲”或“乙”);
(3)小瑜认为甲、乙两组学生成绩的平均数一样,推荐哪组队员参赛都可以.你认为他说得对吗?请说明理由(写出一条合理的理由即可).
【答案】(1)6,7.
(2)乙.
(3)小瑜的说法错误,理由如下:两个组的平均数相同,但乙组的方差比甲组小,则乙组的成绩比较稳定,故选乙组参加决赛.
【分析】本题考查了平均数,中位数,众数,方差的意义.掌握平均数表示一组数据的平均程度,中位数是将一组数据从小到大(或从大到小)重新排列后,最中间的那个数(或最中间两个数的平均数),一组数据中出现次数最多的数据叫做众数,方差是用来衡量一组数据波动大小的量是解题的关键.
(1)根据中位数和众数的定义分别进行解答即可得出答案;
(2)根据方差的意义即可得出答案;
(3)根据平均数与中位数、众数和方差的意义解答即可.
【详解】(1)解:甲组重新排列为:5,6,6,6,6,6,7,9,9,10,
∴中间两个数的平均数,
根据中位数定义可知:;
∵乙组学生成绩中,数据7出现了四次,次数最多,
∴众数;
故答案为:6,7;
(2)解:∵乙组的方差比甲组小,
∴乙组队员在初赛中发挥的更稳定,
故答案为:乙;
(3)解:小瑜的说法错误,理由如下:两个组的平均数相同,但乙组的方差比甲组小,则乙组的成绩比较稳定,故选乙组参加决赛.
1.(24-25八年级下·河北石家庄·期末)题目:“已知5个数据a,b,c,d,e的平均数为6,求这5个数据的方差.”在计算时小方的式子为:,小程的式子为:则小方,小程所列的式子( )
A.小方正确,小程错误 B.小方错误,小程正确
C.都正确 D.都错误
【答案】B
【分析】本题主要考查方差,解题的关键是掌握方差的定义和计算公式.根据方差的定义和计算公式计算即可.
【详解】解:小方的式子中缺少的项,错误;
,
,
小程的式子为:,
小程的式子正确;
故选:B.
2.(24-25八年级下·河北唐山·期末)如图是老师随机抽查本班10名学生读课外书册数的情况绘制成的条形统计图,则这10名学生读书册数的平均数是( )
A.7 B.7.2 C.7.5 D.7.8
【答案】A
【分析】本题考查条形统计图,平均数等知识,解题的关键是熟练掌握从统计图获取相关信息.
【详解】解:,
∴则这10名学生读书册数的平均数是7.
故选:A.
3.(24-25八年级下·河北保定·期末)现有一组数据:3,5,5,5,6,8,10.若加入一个整数,一定不会发生变化的统计量是( )
A.众数 B.平均数 C.中位数 D.方差
【答案】A
【分析】本题考查了众数、平均数、中位数、方差.
根据众数、平均数、中位数、方差的定义逐一进行判断即可.
【详解】解:A.原众数是5,有三个,其他数均只有一个,加入一个整数此,众数不会发生变化,故此选项符合题意;
B.加入一个整数,平均数可能发生变化,故此选项不符合题意;
C.加入一个整数,中位数可能发生变化,故此选项不符合题意;
D.加入一个整数,方差可能发生变化,故此选项不符合题意;
故选:A.
4.(24-25八年级下·河北保定·期末)学校篮球场上初三(1)班5名同学正在比赛,将场上五名队员的身高绘制成如图所示的统计图,中途将1号、5号队员换人,换人后队员的身高分别为与换人前相比,换人后场上队员的身高( )
A.平均数不变,方差变小
B.平均数不变,方差变大
C.平均数变大,方差变小
D.平均数变大,方差变大
【答案】B
【分析】本题主要考查了方差和平均数的计算,解题的关键是熟练掌握方差的计算公式,一般地设n个数据,,,…的平均数为,则方差.分别求出换人前后的平均数和方差进行比较即可.
【详解】解:换人前平均身高为:,
换人后平均身高为:,
换人前的方差为:
,
换人前的方差为:
,
∵,,
∴平均数不变,方差变大,故B正确.
故选:B.
5.(2025·河北沧州·模拟预测)某中学对学生的数学素养进行评价,随机抽取了其中20位学生的成绩(满分100分),整理成如图所示的扇形统计图,C级的成绩如下:70,70,72,73,74,75,75,78,79.现在再随机抽取一位学生,成绩为75分,关于这21人的成绩,嘉嘉和淇淇的说法如下,下列判断正确的是( )
嘉嘉:成绩的众数不变,一定在C级;
淇淇:成绩的中位数变小,一定在C级.
A.只有嘉嘉正确 B.只有淇淇正确 C.两人均正确 D.两人均不正确
【答案】B
【分析】题目主要考查中位数和众数的判断,熟练掌握中位数和众数的求解方法是解题关键.
根据题意分别求出各个级的人数,然后根据中位数和众数的求解方法判断即可.
【详解】解:A级人数的成绩有:人,
B级人数的成绩有:人,
C级人数的成绩有:人,
D级人数的成绩有:人,
∵A、B级学生的成绩不知道,
∴无法确定众数;
故嘉嘉说法错误;
∵20位学生的成绩,
∴中位数为第10、11位成绩的平均数,
从小到大将数据排序,
第10位成绩为79,第11位成绩在B级,且大于79,
∵再随机抽取一位学生,成绩为75分,
∴中位数为79,比原来的中位数小,且在C级,
故淇淇的说法正确,
故选:B.
6.(24-25八年级下·河北邢台·期末)某男装专卖店老板专营某品牌夹克,店主统计了一周中不同尺码的夹克销售量如下表:
尺码
平均每天销售量/件
如果每件夹克的利润相同,你认为下一周应进尺码为 的夹克最多.
【答案】
【分析】本题考查了众数,由统计表中的数据可知这组数据的众数是,即码的夹克销量最大,所以下一周应进尺码为的夹克最多.
【详解】解:由统计表可知,码的夹克销量最大,平均每天销售,
这组数据的众数是,
下一周应进尺码为的夹克最多.
故答案为:.
7.(24-25八年级下·河北承德·期末)一组数据的方差计算如下:,则这组数据的总和等于 .
【答案】16
【分析】本题主要考查方差,解题的关键是掌握方差的计算公式及平均数的定义.
由方差的计算算式知,这组数据共有8个,且这组数据的平均数为2,再根据平均数的概念可得答案.
【详解】解:由方差的计算算式知,这组数据共有8个,且这组数据的平均数为2,
∴这组数据的和为,
故答案为:16.
8.(2025·河北沧州·模拟预测)已知甲、乙两名运动员10次标枪的平均成绩相同,标枪落点如图所示,则方差 (填“”“”或“”).
【答案】
【分析】本题主要考查了方差与数据集中性的关系,正确记忆相关知识点是解题关键.
方差越小,数据越集中,据此可得答案.
【详解】解:由图可知,乙的成绩比甲的成绩更加的集中,
故答案为:.
9.(23-24八年级上·山东烟台·期末)已知:,,,,的平均数是,,,,,的平均数是,则,,,,的平均数是 .
【答案】
【分析】本题主要考查了平均数的求法,先求前个数的和,再求后个数的和,然后利用平均数的定义求出个数的平均数,正确理解算术平均数的概念是解题的关键.
【详解】解:∵,,,,的平均数是,,,,,的平均数是,
∴,,,,的平均数是,
故答案为:.
10.(21-22八年级下·河北石家庄·期中)为了解晋州市文苑社区20~60岁居民最常用的支付方式,嘉嘉和淇淇对该社区相应年龄段的部分居民展开了随机问卷调查(每人只能选择其中一项),并将调查数据整理后绘成两幅不完整的统计图.请根据图中信息回答问题:
(1)在参与调查的居民中.处于41-60岁且最常用微信支付的人数为 人,
(2)若该社区中20~60岁的居民为12800人,则其中20-40岁的居民中最常用现金支付方式的人数约为 人.
【答案】 80 320
【分析】(1)先求出20~60岁居民最常用微信支付的人数,再减去20~40岁常用微信支付的人数即可;
(2)先求出调查中20~40岁常用现金支付的人数所占百分数,用样本估计总体即可得出.
【详解】解:(1)由题,本次调查的总人数为:(人),
则20~60岁居民最常用微信支付的人数为:(人),
所以41-60岁且最常用微信支付的人数为(人);
(2)由题调查中20-40岁的居民中最常用现金的人数所占百分数为:,
则该社区中20-40岁的居民中最常用现金的人数为(人);
故答案为:80人;320人.
【点睛】本题考查利用统计图分析数据,熟练掌握如何用样本估计总体是本题解题关键.
11.(2022·黑龙江齐齐哈尔·三模)小聪同学在计算一组数据1、3、4、5、x的方差时,写出的计算过程是:,如果他的计算是正确的,你认为这组数据中的x为 .
【答案】7
【分析】先求出这组数据的平均数,进而利用平均数计算公式即可计算x
【详解】解:,如果他的计算是正确的,
,
,
解得x=7,
故答案为:7.
【点睛】本题主要考查了平均数及方差,熟练掌握各知识点是解题的关键.
12.(24-25八年级下·河北廊坊·期末)某商场家电部为了调动营业员的积极性,决定实行目标管理,根据目标完成的情况对营业员进行适当的奖励.为了确定一个适当的年销售额目标,商场家电部统计了15名营业员每人去年的销售额单位:万元,数据如表:
年销售额/万元
14
15
18
19
20
25
30
34
35
人数
5
1
2
1
1
1
1
1
2
根据以上信息,回答下列问题:
(1)年销售额在___________万元的人数最多.
(2)计算平均年销售额结果保留两位小数
(3)如果想让一半左右的营业员都能达到销售目标,你认为年销售额目标定为多少合适?并说明理由.
【答案】(1)14
(2)万元
(3)18万元,理由见解析
【分析】(1)根据众数的定义解答即可.
(2)根据加权平均数的定义解答即可.
(3)根据中位数做决策解答即可.
本题考查了众数,平均数,中位数的计算,熟练掌握公式,正确理解统计量的意义是解题的关键.
【详解】(1)解:年销售额在14万元的人数最多,
故答案为:14;
(2)解:年平均销售额为:
(万元).
(3)解:这组数据的中位数为18万元,有8人能达到此目标,
故年销售额目标定为18万元较为合适.
13.(24-25八年级下·河北唐山·期末)可以为初中生提供高效的学习工具和资源,帮助其更好地理解和掌握知识,还能激发学生的自主学习兴趣,培养信息检索和分析能力,为未来的学习和成长奠定坚实基础.某学校开展了“”使用技巧培训活动,为了解学生的使用技巧及水平,教务处从全校学生中随机抽取部分学生进行测试(成绩为百分制,用表示),成绩80分以上(含80分)的为优秀等级,将数据整理为如下不完整的统计图表:根据以上信息解决下列问题:
使用技巧测试成绩频数分布表
使用技巧测试成绩扇形统计图
组别
分数段
频数
A
5
B
m
C
D
20
C组学生的成绩:86,81,88,82,87,81,88,88,89,89
(1)本次调查属于 调查,样本容量为 ;
(2)表格中的为 ;
(3)一同学整理数据后,想用扇形图表示数据,请计算组对应的圆心角度数为 .
(4)请估计全校1800名受训学生中成绩达到优秀等级的人数.
【答案】(1)抽样,50
(2)15
(3)
(4)1080人
【分析】本题考查频数分布直方图、频数分布表,扇形统计图,熟练掌握各统计量的定义是解题的关键.
(1)根据教务处从全校学生中随机抽取部分学生进行测试,结合全面调查和抽样调查的定义即可获得答案;根据A组的频数和所占的百分比,可以求得本次抽取的人数;
(2)先根据C组学生的成绩得出C组学生的频数为10,再根据样本容量可得m的值;
(3)用乘以组所占比例即可;
(4)根据样本估计总体求解即可.
【详解】(1)解:因为教务处从全校学生中随机抽取部分学生进行测试,
所以本次调查属于抽样调查;
样本容量为:,
故答案为:抽样,50;
(2)解:由C组学生的成绩可知C组学生的频数为10,
∴,
故答案为:15;
(3)解:组对应的圆心角度数为,
故答案为:;
(4)解:(人).
答:估计全校1800名受训学生中成绩达到优秀等级的人数为1080人.
14.(24-25八年级下·河北廊坊·期末)2025年4月17日,国家航天局举行2025中国航天日新闻发布会,神舟二十号、二十一号载人飞船任务将成为今年中国航天工程重点任务之一.某中学为了解本校学生对航天科技的关注程度,在八、九年级各抽取50名学生开展航天知识竞赛,为便于统计成绩,制定了取“整十”的计分方式,满分100分.竞赛成绩如图所示:
众数
中位数
方差
八年级竞赛成绩
70
188
九年级竞赛成绩
80
156
(1)你能用成绩的平均数判断哪个年级的成绩比较好吗?通过计算说明理由;
(2)请根据图表中的信息,回答下列问题:
①表中__________,__________.
②现要给成绩突出的年级颁奖,如果分别从众数和方差两个角度来分析,你认为应该给哪个年级颁奖?
【答案】(1)用平均数无法判定哪个年级的成绩比较好,理由见解析
(2)①,;②应该给九年级颁奖,理由见解析
【分析】本题考查了折线统计图,求平均数,众数,方差,根据方差判断稳定性,从统计图表中获取信息是解题的关键.
(1)根据已知数据求得八年级与就九年级的平均数即可求解;
(2)①根据众数、中位数的定义,进行计算即可求解;②分别从众数和方差两方面分析即可求解.
【详解】(1)由题意得:
八年级成绩的平均数是:(分),
九年级成绩的平均数是:(分),
故用平均数无法判定哪个年级的成绩比较好;
(2)①九年级竞赛成绩中分出现的次数最多,故众数;
八年级竞赛成绩的中位数为:,则
故答案为:,;
②如果从众数角度看,八年级的众数为分,九年级的众数为分,所以应该给九年级颁奖;
如果从方差角度看,八年级的方差为,九年级的方差为,又因为两个年级的平均数相同,九年级的成绩的波动小,所以应该给九年级颁奖.
综上所述,应该给九年级颁奖.
15.(24-25八年级下·河北廊坊·期末)人工智能是模拟人类智能的计算机系统,某校为激发同学们对人工智能的兴趣,普及人工智能知识,组织了七、八年级学生参加了人工智能科普测试.现从七、八两个年级各抽取10人记录下他们的测试得分并进行整理和分析(积分用表示,共分为四组:,,,,下面给出了部分信息:
七年级10人的得分:42,57,68,71,83,83,85,89,91,99;
八年级10人的得分在组中的分数为:83,84,84,87.
两组数据的平均数、中位数、众数、方差
年级
平均数
中位数
众数
方差
七
76.8
83
300
八
76.8
84
260
根据以上信息,解答下列问题:
(1)填空: , , ;
(2)根据以上数据,你认为哪个年级在此次人工智能科普测试中表现更好,请说明理由(一条理由即可);
(3)若七年级有1200人参与测试,八年级有1000人参与测试,请估计七、八两个年级得分在组的共有多少人?
【答案】(1)83,,20
(2)八年级掌握人工智能知识比较好,理由见解析
(3)估计七、八两个年级得分在组的共有440人
【分析】本题考查了扇形统计图、众数、中位数、用样本估计及总体,熟练掌握相关知识是解题的关键.
(1)根据七年级10人的得分可求出a;根据扇形扇形统计图和组得分可得求出m和b;
(2)根据平均数,众数和中位数的意义;
(3)分别求出七、八两个年级得分在组的人数,然后相加即可.
【详解】(1)解: 83出现的次数最多,故众数.
八年级C组人数∶,
八年级D组人数∶,
八年级B组人数:4,故八年级A组人数∶,
即.
八年级成绩排在第5和第6位的是84和83,故中位数
故答案为∶;
(2)解:八年级掌握人工智能知识比较好,
理由:八年级的中位数高于七年级的中位数,说明八年级学生掌握的较好;
注意:答案不唯一,回答合理即可
(3)解:(人),
估计七、八两个年级得分在组的共有440人.
16.(24-25八年级下·河北承德·期末)某中学在八年级2000名学生中开展了“中国二十四节气”知识竞赛,在所获得的成绩x(分)中随机抽取了一部分进行收集、整理,并绘制成如下不完整的频数分布表和频数分布直方图.已知成绩在这一组的分数为80,80,83,83,83,85,85,87,87,88,88,89.
成绩x/分
频数
频率
1
9
a
12
b
10
根据以上信息,解答下列问题:
(1)本次抽取的人数为________,表中________,________;
(2)请补全频数分布直方图;
(3)若成绩为89分及以上为优秀,估计本次竞赛中八年级有多少名同学的成绩是优秀.
【答案】(1)50;18;
(2)见解析
(3)估计本次测试八年级有440名同学的成绩是优秀
【分析】本题考查频数分布直方图,频数分布表,样本估计总体,能从统计图中获取有用消息是解题的关键.
(1)用的频数除以频率即可得到本次抽样调查的样本容量;用样本容量乘以,即可求出a的值,用12除以样本容量,再化成百分数即可求出b的值.
(2)关键频数分布表补全频数分布直方图即可.
(3)将89分及以上的人数求出即可.
【详解】(1)解:(人),
,
,
则本次抽取的人数为50人,表中,,
故答案为:,,.
(2)解:补全的频数分布直方图如图所示:
(3)解:(人),
答:估计本次测试八年级有440名同学的成绩是优秀.
17.(2025·河北·中考真题)某工厂生产,,,四种产品.为提升产品的竞争力,该工厂计划对部分种类的产品优化生产流程,降低成本;对其他种类的产品增加研发投入,提升品质.经研究,该工厂做出了甲、乙两种调整方案,这两种方案将对四种产品的成本产生不同的影响.下面是该工厂这四种产品的部分信息:a.调整前,各产品年产量的不完整的条形统计图(图1)和扇形统计图(图2).b.各产品单件成本的核算情况统计表及说明.说明:对于统计表中的数据,方案甲的平均数与调整前的相同,方案乙的中位数与调整前的相同.根据以上信息,解答下列问题:
产品数据 类别
调整前单价成本(元/件)
调整后单价成本(元/件)
方案甲
方案乙
(1)求调整前产品的年产量;
(2)直接写出,的值;
(3)若调整后这四种产品的年产量均与调整前的相同,请通过计算说明甲、乙两种方案哪种总成本较低.
【答案】(1)万件
(2),
(3)甲种方案总成本较低
【分析】本题考查了条形统计图与扇形统计图信息关联,求平均数与中位数,从统计图表中获取信息是解题的关键;
(1)先求得总产量,然后求得的年产量,最后求得产品的年产量;
(2)根据方案甲的平均数与调整前的相同,方案乙的中位数与调整前的相同,即可求解;
(3)分别计算甲、乙两种方案的成本,比较大小,即可求解.
【详解】(1)万件,
产品的年产量为:万件,
∴调整前产品的年产量为:万件
(2)∵方案甲的平均数与调整前的相同,
∴
解得:,
∵方案乙的中位数与调整前的相同,调整前,中位数为
调整后为,
∴
(3)解:方案甲的总成本为:(万元)
方案乙的总成本为:(万元)
∴甲种方案总成本较低
1 / 6
学科网(北京)股份有限公司
$$
第二十三章 数据分析
知识点一、算术平均数
一般地,如果有n个数,那么叫做这n个数的 ,简称 ,“”读作“拔”.
1.求算术平均数时,只需将所有数据加起来求出总和,再除以数据的总个数即可;
2.通常,平均数可以用来表示一组数据的“集中趋势”;
3.在实际问题中,算数平均数要带单位,与原数据单位一致;
4.算术平均数的大小与一组数据里的每个数据均有关系;
5.算术平均数的缺点是 受个别值的影响,有时并不能代表一组数据的平均水平;
6.一组数据的平均值只有一个,每个数据的变化都会引起平均值的变化(若添上或去掉的这个数据刚好与平均数相同,就不会引起平均值的变化).
知识点二、平均数的简化公式
一般地,一组数据中的各个数值较大时,可以将各个数据减去一个适当的常数a(常数a通常取接近于这组数据的平均数较“整”的数),得到一组新数据:那么这组数据的平均数.
知识点三、加权平均数
1.权的概念
一组数据的 ,不仅与这组数据中各个数据的数值有关,而且与各个数据的“重要程度”有关,我们把衡量各个数据“重要程度”的数值叫做 .
2. 的计算公式
(1)一般地,设为k个数据,依次为k个数据的权数,则称为这组数据的 .
(2)数据按的比计算平均数,则
(3)设数据所占的百分比分别为,且,则.
知识点四、中位数
一般地,将一组数据按大小顺序排列(从小到大或从大到小都可以),如果数据的个数 ,那么处于中间位置的数叫做这组数据的中位数;如果数据的个数是 ,那么处于中间位置的两个数的平均数叫做这组数据的 .
1.一组数据的中位数 出现在这组数据中;
2.一组数据的中位数是唯一的;
3.由一组数据的中位数可以知道中位数以上和以下的数据各占一半;
4.中位数仅与数据按大小的排列后的位置有关,当一组数据中个别据与其他数据的大小差异很大时,通常用中位数来描述这组数据的集中趋势.
知识点五、众数
一组数据中出现次数最多的数据叫做这组数据的 .
1.当一组数据中有较多的重复数据时,常用众数来描述这组数据的集中趋势;
2.一组数据的众数一定出现在这组数据中;一组数据的众数可能不止一个,也有可能没有众数;
3.众数是一组数据中出现次数最多的数据而不是数据出现的次数;
4.众数考查的是各个数据出现的频数,其大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,其众数往往更能反映出这组数据的集中趋势.
知识点六、选择合适的统计量描述数据的集中趋势
平均数、众数、中位数都能反映出一组数据的集中趋势,其中平均数的应用最为广泛,三个统计量各有特点:
1.用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,对这组数据所包含的信息的反映最为充分,所以平均数应用最为广泛,特别是在进行统计推断时有着重要的作用,但平均数计算时比较繁琐,并且容易受到极端数据的影响.
2用众数作为一组数据的代表,主要是对各数据出现频数的考查,其大小只与这组数据的部分数据有关,可靠性比较差,但众数不受极端数据的影响,当一组数据中有不少数据多次重复出现时,常用众数来描述这组数据的集中趋势.
3.用中位数作为一组数据的代表,可靠性比较差,但中位数不受极端数据的影响,当一组数据中的个别数据变动较大时,可以用中位数来描述其集中趋势.
知识点七、极差的定义及计算公式
1.一组数据中的最大值与最小值的差叫做 ;
2.极差计算公式:极差= .
极差是最简单的一种度量数据波动情况的量,它受极端值的影响较大,一组数据的极差 ,这组数据的波动幅度也越小,也就越稳定.
极差反映一组数据两个极端值之间差异情况,仅由两个数据评判一组数据是不全面的.
知识点八、方差及标准差
1.方差的概念
在一组数据中,各个数据与它们的平均数的差的平均数,叫做这组数据的 ,通常用来表示,即(方差的基本公式).
若原数据是有单位的,则方差的单位就是原数据单位的平方.
2.方差的其他公式:
(1)或者,方差等于原数据
的平均数减去平均数的平方;
(2),当一组数据较大时,可以仿照简化平均数的计算方法,将每个数据同时减去一个与它们的平均数接近的常数a,得到一组新数据那么方差公式也可以写成,方差等于新数据平方的平均数减去新数据平均数的平方.
①方差反映的是一组数据偏离平均值的情况.方差越大,数据的波动越大;方差越小,数据的波动越小;
②一组数据的每一个数都加上(或减去)同一个常数,所得的一组新数据的方差不变;
③一组数据的每一个数据都变为原来的倍,则所得的一组新数据的方差变为原来的倍.
3.标准差
有时,也会用 (标准差),即来描述一组数据的离散程度.
知识点九、极差、方差及标准差的区别与联系
1.联系:极差与方差、标准差都是表示一组数据离散程度的特征数;
2.区别:极差表示一组数据波动范围的大小,它受极端数据的影响较大;方差反映了一组数据与其平均值的离散程度的大小.方差越大,稳定性越小;反之,则稳定性越好.所以一般情况下只求一组数据的波动范围时用极差,在考虑到这组数据的稳定性时用方差.
3.对于两组数据来说,极差大的那一组,不一定方差大;反过来,方差大的,极差也不一定大.
一、平均数
1.平均数计算出错
错误:平均数计算时出现遗漏
注意:在计算平均数时,所有的数据都参与运算,所以它易受极端值的影响.
例.已知一组数据,,的平均数是,那么另一组数据,,的平均数为 .
2.加权平均数不会计算
错误:加权平均数不知道该如何计算
注意:若个数,,…,的权分别是,,…,,则,叫做这个数的加
权平均数.
若各数据权重相同,则算术平均数等于加权平均数.
例.老师在计算学生每学期的总评成绩时,按照“平时成绩占,考试成绩占”的比例计算.若小明的平时成绩为95分,考试成绩为90分,则他的总评成绩为 分.
二、中位数和众数
1.中位数决策
错误:遇到中位数决策问题不会
注意:掌握中位数的概念,学会运用中位数的概念进行决策
例.已知一组数据,,,,,,的众数为,则这组数据的中位数为 .
2.众数
错误:众数的理解错误
注意:当各数据重复出现的次数大致相等时,它往往就没有什么特别意义.
例.下表为某班学生成绩的次数分配表.已知全班共有人,且众数为分,中位数为分,则之值为 .
成绩(分)
次数(人)
三、方差
1.方差
错误:不会求方差
注意:在一组数据,,…,中,各个数据与平均数的差的平方的平均数叫做这组数据的方差,记作.计算公式是:.
例.某学习小组6个成员某次数学测验的分数如下:80,79,76,x,78,81,若该组数据平均数为79,则该组数据的方差是 .
2.运用方差做决策
错误:不会利用方差进行做决策
注意:方差是用来衡量数据在平均数附近波动大小的量,方差越大,数据的波动性越大,方差越小,数据的波动性越小.
例.为了弘扬和传承中华优秀传统文化,某校举办了一场名为“经典文化传承大赛”的初赛,比赛设定满分为10分,参赛学生的得分均为整数.以下是甲、乙两组(每组10人)学生在初赛中的成绩记录(单位:分):甲组:6,7,9,10,6,5,6,6,9,6.乙组:10,7,6,9,6,7,7,6,7,5.
根据甲、乙两组学生的成绩,得到以下的统计表:
组别
平均数
中位数
众数
方差
甲组
7
6
乙组
7
7
2
(1)在以上成绩统计表中,___________,___________;
(2)__________组队员在初赛中发挥的更稳定(填“甲”或“乙”);
(3)小瑜认为甲、乙两组学生成绩的平均数一样,推荐哪组队员参赛都可以.你认为他说得对吗?请说明理由(写出一条合理的理由即可).
1.(24-25八年级下·河北石家庄·期末)题目:“已知5个数据a,b,c,d,e的平均数为6,求这5个数据的方差.”在计算时小方的式子为:,小程的式子为:则小方,小程所列的式子( )
A.小方正确,小程错误 B.小方错误,小程正确
C.都正确 D.都错误
2.(24-25八年级下·河北唐山·期末)如图是老师随机抽查本班10名学生读课外书册数的情况绘制成的条形统计图,则这10名学生读书册数的平均数是( )
A.7 B.7.2 C.7.5 D.7.8
3.(24-25八年级下·河北保定·期末)现有一组数据:3,5,5,5,6,8,10.若加入一个整数,一定不会发生变化的统计量是( )
A.众数 B.平均数 C.中位数 D.方差
4.(24-25八年级下·河北保定·期末)学校篮球场上初三(1)班5名同学正在比赛,将场上五名队员的身高绘制成如图所示的统计图,中途将1号、5号队员换人,换人后队员的身高分别为与换人前相比,换人后场上队员的身高( )
A.平均数不变,方差变小
B.平均数不变,方差变大
C.平均数变大,方差变小
D.平均数变大,方差变大
5.(2025·河北沧州·模拟预测)某中学对学生的数学素养进行评价,随机抽取了其中20位学生的成绩(满分100分),整理成如图所示的扇形统计图,C级的成绩如下:70,70,72,73,74,75,75,78,79.现在再随机抽取一位学生,成绩为75分,关于这21人的成绩,嘉嘉和淇淇的说法如下,下列判断正确的是( )
嘉嘉:成绩的众数不变,一定在C级;
淇淇:成绩的中位数变小,一定在C级.
A.只有嘉嘉正确 B.只有淇淇正确 C.两人均正确 D.两人均不正确
6.(24-25八年级下·河北邢台·期末)某男装专卖店老板专营某品牌夹克,店主统计了一周中不同尺码的夹克销售量如下表:
尺码
平均每天销售量/件
如果每件夹克的利润相同,你认为下一周应进尺码为 的夹克最多.
7.(24-25八年级下·河北承德·期末)一组数据的方差计算如下:,则这组数据的总和等于 .
8.(2025·河北沧州·模拟预测)已知甲、乙两名运动员10次标枪的平均成绩相同,标枪落点如图所示,则方差 (填“”“”或“”).
9.(23-24八年级上·山东烟台·期末)已知:,,,,的平均数是,,,,,的平均数是,则,,,,的平均数是 .
10.(21-22八年级下·河北石家庄·期中)为了解晋州市文苑社区20~60岁居民最常用的支付方式,嘉嘉和淇淇对该社区相应年龄段的部分居民展开了随机问卷调查(每人只能选择其中一项),并将调查数据整理后绘成两幅不完整的统计图.请根据图中信息回答问题:
(1)在参与调查的居民中.处于41-60岁且最常用微信支付的人数为 人,
(2)若该社区中20~60岁的居民为12800人,则其中20-40岁的居民中最常用现金支付方式的人数约为 人.
11.(2022·黑龙江齐齐哈尔·三模)小聪同学在计算一组数据1、3、4、5、x的方差时,写出的计算过程是:,如果他的计算是正确的,你认为这组数据中的x为 .
12.(24-25八年级下·河北廊坊·期末)某商场家电部为了调动营业员的积极性,决定实行目标管理,根据目标完成的情况对营业员进行适当的奖励.为了确定一个适当的年销售额目标,商场家电部统计了15名营业员每人去年的销售额单位:万元,数据如表:
年销售额/万元
14
15
18
19
20
25
30
34
35
人数
5
1
2
1
1
1
1
1
2
根据以上信息,回答下列问题:
(1)年销售额在___________万元的人数最多.
(2)计算平均年销售额结果保留两位小数
(3)如果想让一半左右的营业员都能达到销售目标,你认为年销售额目标定为多少合适?并说明理由.
13.(24-25八年级下·河北唐山·期末)可以为初中生提供高效的学习工具和资源,帮助其更好地理解和掌握知识,还能激发学生的自主学习兴趣,培养信息检索和分析能力,为未来的学习和成长奠定坚实基础.某学校开展了“”使用技巧培训活动,为了解学生的使用技巧及水平,教务处从全校学生中随机抽取部分学生进行测试(成绩为百分制,用表示),成绩80分以上(含80分)的为优秀等级,将数据整理为如下不完整的统计图表:根据以上信息解决下列问题:
使用技巧测试成绩频数分布表
使用技巧测试成绩扇形统计图
组别
分数段
频数
A
5
B
m
C
D
20
C组学生的成绩:86,81,88,82,87,81,88,88,89,89
(1)本次调查属于 调查,样本容量为 ;
(2)表格中的为 ;
(3)一同学整理数据后,想用扇形图表示数据,请计算组对应的圆心角度数为 .
(4)请估计全校1800名受训学生中成绩达到优秀等级的人数.
14.(24-25八年级下·河北廊坊·期末)2025年4月17日,国家航天局举行2025中国航天日新闻发布会,神舟二十号、二十一号载人飞船任务将成为今年中国航天工程重点任务之一.某中学为了解本校学生对航天科技的关注程度,在八、九年级各抽取50名学生开展航天知识竞赛,为便于统计成绩,制定了取“整十”的计分方式,满分100分.竞赛成绩如图所示:
众数
中位数
方差
八年级竞赛成绩
70
188
九年级竞赛成绩
80
156
(1)你能用成绩的平均数判断哪个年级的成绩比较好吗?通过计算说明理由;
(2)请根据图表中的信息,回答下列问题:
①表中__________,__________.
②现要给成绩突出的年级颁奖,如果分别从众数和方差两个角度来分析,你认为应该给哪个年级颁奖?
15.(24-25八年级下·河北廊坊·期末)人工智能是模拟人类智能的计算机系统,某校为激发同学们对人工智能的兴趣,普及人工智能知识,组织了七、八年级学生参加了人工智能科普测试.现从七、八两个年级各抽取10人记录下他们的测试得分并进行整理和分析(积分用表示,共分为四组:,,,,下面给出了部分信息:
七年级10人的得分:42,57,68,71,83,83,85,89,91,99;
八年级10人的得分在组中的分数为:83,84,84,87.
两组数据的平均数、中位数、众数、方差
年级
平均数
中位数
众数
方差
七
76.8
83
300
八
76.8
84
260
根据以上信息,解答下列问题:
(1)填空: , , ;
(2)根据以上数据,你认为哪个年级在此次人工智能科普测试中表现更好,请说明理由(一条理由即可);
(3)若七年级有1200人参与测试,八年级有1000人参与测试,请估计七、八两个年级得分在组的共有多少人?
16.(24-25八年级下·河北承德·期末)某中学在八年级2000名学生中开展了“中国二十四节气”知识竞赛,在所获得的成绩x(分)中随机抽取了一部分进行收集、整理,并绘制成如下不完整的频数分布表和频数分布直方图.已知成绩在这一组的分数为80,80,83,83,83,85,85,87,87,88,88,89.
成绩x/分
频数
频率
1
9
a
12
b
10
根据以上信息,解答下列问题:
(1)本次抽取的人数为________,表中________,________;
(2)请补全频数分布直方图;
(3)若成绩为89分及以上为优秀,估计本次竞赛中八年级有多少名同学的成绩是优秀.
17.(2025·河北·中考真题)某工厂生产,,,四种产品.为提升产品的竞争力,该工厂计划对部分种类的产品优化生产流程,降低成本;对其他种类的产品增加研发投入,提升品质.经研究,该工厂做出了甲、乙两种调整方案,这两种方案将对四种产品的成本产生不同的影响.下面是该工厂这四种产品的部分信息:a.调整前,各产品年产量的不完整的条形统计图(图1)和扇形统计图(图2).b.各产品单件成本的核算情况统计表及说明.说明:对于统计表中的数据,方案甲的平均数与调整前的相同,方案乙的中位数与调整前的相同.根据以上信息,解答下列问题:
产品数据 类别
调整前单价成本(元/件)
调整后单价成本(元/件)
方案甲
方案乙
(1)求调整前产品的年产量;
(2)直接写出,的值;
(3)若调整后这四种产品的年产量均与调整前的相同,请通过计算说明甲、乙两种方案哪种总成本较低.
1 / 6
学科网(北京)股份有限公司
$$