内容正文:
第二十四章 数据的分析
数据的集中趋势
(1)平均数:
①算术平均数:=(x1+x2+…+xn).
②加权平均数:
当n个数x1,x2,…,xn的权分别是w1,w2,…,wn时,叫作这n个数的加权平均数,其中=.
(2)中位数:
指数据从小到大(或从大到小)排列,处于 位置的数.
注意:若有偶数个数据,则中位数是指中间两个数的 .
(3)众数:
指一组数据中出现次数 的数据.
(4)平均数、中位数、众数的优缺点:
中间
平均数
最多
类别 优点 缺点
平
均
数 平均数的计算要用到所有的数据,它能够充分利用数据提供的信息,因此在现实生活中较为常用 平均数受极端值的影响较大
(一组数据中与其余数据差异较大的数据)
中
位
数 中位数只需要很少的计算,它不易受极端值的影响 中位数不能充分地利用各数据的信息
众
数 众数的大小只与部分数据有关,当一组数据中某些数据多次重复出现时,众数往往是人们关心的一个量,众数不易受极端值的影响 当各数据重复出现的次数大致相等时,众数往往就没有什么特别意义
1.(2025广州模拟)睡眠管理作为“五项管理”中重要的内容之一,也是学校教育重点关注的内容.某老师了解到班上某位学生的5天睡眠时间(单位:小时)如下:10,9,10,8,8,则该学生这5天的平均睡眠时间是 小时.
9
第2题图
2.(2025河南一模)某校拟招聘一名数学教师,设置了笔试、面试、试讲三项水平测试,综合成绩按照笔试占30%,面试占30%,试讲占40%进行计算,小徐的三项测试成绩如图所示,则她的综合成绩为
分.
3.(2025眉山)某校以“阳光运动,健康成长”为主题开展体育训练.
已知某次训练中7名男生引体向上的成绩为7,8,5,8,9,10,6.
这组数据的中位数是 .
85.8
8
4.(2025盐城)在文创商店,小明向服务人员询问丹顶鹤、麋鹿、勺嘴鹬三种卡通饰品哪种最畅销.“最畅销”涉及的统计量是( )
A.平均数 B.中位数 C.方差 D.众数
5.一组数据中的一个数大小发生变化,一定会影响这组数据的平均数、众数、中位数中的 ( )
A.1个 B.2个 C.3个 D.0个
D
A
6.小明调查了班级里20位同学本学期购买课外书的花费情况,并将结果绘制成了如图的统计图.在这20位同学中,本学期购买课外书的花费的众数和中位数分别是( )
A.50,50 B.50,30
C.80,50 D.30,50
A
7. 某市在开展节约用水活动中,对某小区200户居民家庭用水情况进行统计分析,其中3月份比2月份节约用水情况如下表所示:
节水量(m3) 1 1.5 2
户数 20 120 60
(1) 抽取的200户家庭节水量的平均数是______,中位数是______,
众数是_______.
(2) 根据以上数据,估计某市100万户居民家庭3月份比2月份的
节水量是_________.
1.6
1.5
160万m3
1.5
数据的离散程度
(1)方差的定义
(2)方差的计算公式:
设有n个数据x1,x2,…,xn,通常用表示一组数据的平均数,用s2表示一组数据的方差,则s2=[(x1-)2+(x2-)2+…+(xn-)2].
(3)方差用来刻画一组数据的 大小(即每个数据与平均数的平均差异程度).
(4)方差越大,说明数据的离散程度 ,波动越大,越不稳定;方差越小,说明数据的离散程度 ,波动越小,越稳定.
波动
越大
越小
1.(2025江西模拟)数据-3,0,1,2的方差是 .
2.某射击运动队进行了五次射击测试,甲、乙两名选手的测试成绩如图
所示,甲、乙两选手成绩的方差分别记为,,则
(填“>”“<”或“=”).
3.5
>
3.小明和小亮报名参加了短跑训练小组.在近几次百米训练中,所测成绩
如图所示:
(1) 根据图中信息,补全下面的表格.
(2) 分别计算成绩的平均数和方差,填入表格. 若你是教练,将小明与小亮的成绩比较分析后, 将分别给予他们怎样的建议?
次数 1 2 3 4 5
小明 13.3 13.3 13.2 13.3
小亮 13.2 13.4 13.1 13.3
13.4
13.5
平均数 方差
小明
小亮
13.3
13.3
0.02
0.004
解:从平均数看,两人的水平相同;从方差看,小明比较稳定,小亮波动较大.
小明:加强锻炼,提高爆发力,提升短跑成绩;
小亮:总结经验,找出成绩忽高忽低的原因,在稳定中提高.
四分位数与箱线图
(1)第一四分位数(下四分位数)、第二四分位数(中位数)和第三四分位数(上四分位数)把一些数据分为个数相等的四部分,因此分别记为Q1,Q2,Q3,统称四分位数.
(2)由一组数据的最小值、第一四分位数(下四分位数)、第二四分位数(中位数)和第三四分位数(上四分位数)和最大值绘制的统计图(如图)叫作箱线图.
1.某考生参加某高中的综合评价招生并成功通过了初试,面试阶段中,
8位老师根据考生表现给出得分,分数由低到高依次为:
76,a,b,80,80,81,84,85
若这组数据的下四分位数为77,则该名考生的面试平均得分为( )
A.79 B.80 C.81 D.82
B
2.为了弘扬奥运会中我国射击队员顽强拼搏的奋斗精神,某校射击兴趣小组组织了校内射击比赛,8名同学的射击环数如下(单位:环):
9,8,6,10,9,7,6,9,则这组样本数据的( )
A.第二四分位数是8 B.平均数是9
C.上四分位数是9 D.方差是16
C
组内离差平方和
设有n个数据x1,x2,…,xn,如果把这组数据分成两组,
前m个数据为一组,后个数据为一组,
它们的平均数分别记为和,离差平方和分别为
=(x1-)2+(x2-)2+…+(xm-)2,
=(xm+1-)2+(xm+2-)2+…+(xn-)2,
则+称为组内离差平方和.
1.把5个数据2,4,6,8,10分成{2,4}和{6,8,10}两组,则这种
分组情况的组内离差平方和为 ,
组间离差平方和为 ,
整组数据的方差为 .
10
30
8
1.(2025宜宾)一组数据:4,5,5,6,a的平均数为6,
则a的值是( )
A.7 B.8 C.9 D.10
2.(2025江苏一模)一组数据含有三个不同的数:3,8,7,它们的频数分别是3,5,2,则这组数据的平均数是 .
D
当堂练习
6.3
3.(2025扬州三模)在评选活动中,6位评委的打分为10,8,9,8,
6,7,这组数据的方差为;去掉一个最高分和一个最低分后,方差为,则 (填“>”“<”或“=”).
4.(2025巴中)有一组数据:1,2,3,3,4,5.在这组数据中加入一个整数a,则下列一定不变的是( )
A.平均数 B.中位数 C.众数 D.方差
>
当堂练习
B
5.(2025绥化)小新同学参加某次诗朗诵比赛,七位评委的打分是:
7.0,7.0,8.8,9.0,9.3,9.4,10.
工作人员根据评委所打的分数进行了统计.如果去掉一个最高分和一个
最低分,那么下列统计量中一定不发生变化的是( )
A.平均数 B.方差
C.众数 D.中位数
D
当堂练习
6.(1)幸福指数是衡量人们对自身生存和发展状况的感受和体验,即人们的幸福感的一种指数,某机构从某社区随机调查了12人,得到他们的幸福指数(满分:10分)分别是7.6,8.5,7.8,9.2,8.1,9,7.9,9.5,8.3,8.8,6.9,9.4,则这组数据的下四分位数是 ;
(2)8位同学在某天参加体育锻炼的时间(单位:分钟)分别为65,
65,66,70,74,73,81,80,则它们的上四分位数是 分钟.
7.85
77
当堂练习
7.某老师绘制了一次数学小测验中甲、乙、丙三个班级学生得分的箱线图(如图),根据该图判断下列说法错误的是( )
A.三个班级中,甲班分数的方差最小
B.三个班级中,乙班分数的中位数最大
C.丙班得分低于80的学生人数少于得分
高于80的学生人数
D.若每班有42个学生,则三个班级的第11名中,
丙班的分数最高
B
当堂练习
8.为提升西瓜的质量,农科所采用A,B两种种植技术进行试验.若质量为(5±0.25)kg的为优等品,请分别从优等品数量、平均数与方差三方面对A,B两种技术做出评价;从市场销售的角度看,你认为推广哪种种植技术较好?
当堂练习
解:①优等品数量:因A种技术种植的西瓜优等品数量较多,所以A种技术较好;
②平均数:因A种技术种植的西瓜质量的平均数更接近5kg,所以A种技术较好;
③方差:因B种技术种植的西瓜质量的方差更小,所以B种技术种植的西瓜质量更为稳定;
④市场销售角度:因优等品更畅销,A种技术种植的西瓜优等品数量更多,且平均质量更接近5kg,
因而更适合推广A种技术.
$