内容正文:
5.1.2 数据的数字特征
第1课时 最值、平均数、中位数、百分位数、众数
学业标准
素养目标
1.结合实例,掌握最值、平均数、中位数、百分位数、众数的定义,理解集中趋势参数的统计含义.(难点)
2.会计算数据的这些数字特征,并能解决有关的实际问题.(重点)
1.通过计算数据的数字特征,主要提升数学运算核心素养.
2.通过数字特征统计含义的应用,重点培养学生数据分析核心素养.
[对应学生用书P52]
导学 最值、平均数、中位数、百分位数、众数
平均数、中位数、百分位数、众数中,哪个量与样本的每一个数据有关?它有何缺点?
[提示] 平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.
平均数、中位数、百分位数、众数中哪些是一定出现在已知数据中的?哪些不一定出现在已知数据中?
[提示] 众数一定会出现在已知数据中,但可能不是唯一的,而平均数、中位数、百分位数不一定出现在已知数据中.
◎结论形成
1.最值
一组数据的最值指的是其中最大值与最小值,最值反映的是这组数据最极端的情况,最大值用max表示,最小值用min表示.
2.平均数
(1)定义
如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=__(x1+x2+…+xn)__.
这一公式在数学中常简记为=__i__.
(2)求和符号∑的性质
①(xi+yi)=i+i__;
②(kxi)=ki__;
③=__nt__.
(3)平均数的性质
如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为__a+b__.
(4)统计含义
平均数对数据有“取齐”的作用,代表该组数据的__平均水平__.任何一个数据的改变都会引起平均数的变化,这是众数、百分位数和中位数都不具有的性质.所以与众数、百分位数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.
3.中位数、百分位数
(1)中位数定义
如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称__xn+1__为这组数据的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,x2n,则称____为这组数据的中位数.
(2)中位数的统计含义
一组数据中的中位数是唯一的,反映了该组数据的__集中趋势__.
(3)百分位数
①定义
一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有__p%__的数据不大于该值,且至少有__(100-p)%__的数据不小于该值.
②计算方法
设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取__xi0__为p%分位数;如果i是整数,取____为p%分位数.
③几个特殊的百分位数
0分位数是__最小值__,100%分位数是__最大值__,50%分位数是__中位数__,25%分位数简称为__第一四分位数__,75%分位数简称__第三四分位数__.
4.众数
(1)定义
一组数据中,某个数据出现的次数称为这个数据的__频数__,出现次数__最多__的数据称为这组数据的众数.
(2)统计含义
一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.
[对应学生用书P53]
1.判断正误(正确的打“√”,错误的打“×”)
(1)对于一组数据来说,众数是唯一的.( )
(2)中位数在一组数据中是唯一的,且一定是这组数据中的一个数据.( )
(3)x1,x2,x3的平均数为,则2x1-1,2x2-1,2x3-1的平均数为2-1.( )
(4)已知一组数据4,6,5,8,7,6,那么这组数据的25%分位数为6.( )
解析 (1)众数可能不唯一.
(2)中位数在一组数据中是唯一的,可能是这组数据中的一个数据,也可能不是这组数据中的数据.
(3)2x1-1,2x2-1,2x3-1的平均数为2-1,故正确.
(4)这组数据的25%分位数为5.故错误.
答案 (1)× (2)× (3)√ (4)×
2.下列选项中,能反映一组数据的离散程度的是( )
A.平均数 B.中位数
C.方差 D.众数
解析 由方差的定义,知方差反映了一组数据的离散程度.
答案 C
3.下列关于50%分位数的说法正确的是( )
A.50%分位数就是中位数
B.总体数据中的任意一个数小于它的可能性一定是50%
C.它是四分位数
D.它适用于总体是离散型的数据
解析 由百分位数的意义可知选项B,C,D错误.
答案 A
4.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________.
解析 =6.
答案 6
[对应学生用书P54]
题型一 众数、中位数、平均数的简单应用(一题多变)
在一次乒乓球单打比赛中,甲选手在1比3落后的情况下连扳三局,4比3击败乙选手成功卫冕,这七局的比分别是4∶11,8∶11,11∶5,4∶11,11∶9,11∶8,11∶6.试分别计算这两位运动员成绩的平均数、众数和中位数.
[自主解答] 甲选手各局的得分分别是:4,8,11,4,11,11,11;
按照从小到大的顺序排列是:4,4,8,11,11,11,11;
乙选手各局的得分分别是:11,11,5,11,9,8,6;
按照从小到大的顺序排列是:5,6,8,9,11,11,11.
(1)平均数甲=(4+8+11+4+11+11+11)=,乙=(11+11+5+11+9+8+6)=;
(2)两者的众数都是11;
(3)甲的中位数是11,乙的中位数是9.
[母题变式]
(变条件、变结论)例1中若最后一局的比分变为11∶a,其他6局的比分不变,且已知乙运动员成绩的平均数为9,求a的值.
解析 由(11+11+5+11+9+8+a)=9,
得a=8.
平均数、众数、中位数的求解策略
(1)求平均数时要注意数据的个数,不要重计或漏计.
(2)求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.
(3)若有两个或两个以上的数据出现得最多,且出现的次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众数.
[触类旁通]
1.数据:9.4,8.4,9.4,9.9,9.6,9.7的最大值为________,最小值为_______,众数为_______,中位数为________.
解析 把数据从小到大排列为8.4,9.4,9.4,9.6,9.7,9.9,则最大值为9.9,最小值为8.4,众数为9.4,中位数为=9.5.
答案 9.9 8.4 9.4 9.5
题型二 百分位数
从某公司生产的产品中,任意抽取12件,得到它们的质量(单位:kg)如下:
7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0,
分别求出这组数据的25%,75%,95%分位数.
[自主解答] 将所有数据从小到大排列,得
7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,
因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4,
则25%分位数是=8.15,
75%分位数是=8.75,
95%分位数是第12个数据为9.9.
计算一组数据p%分位数的方法步骤
(1)按照从小到大排列原始数据.
(2)计算i=np%.
(3)若i不是整数,大于i的最小整数j,则p%分位数为第j项数据;若i是整数,则p%分位数为第i项与第(i+1)项数据的平均数.
[触类旁通]
2.某省公布了该省6个县市的人均二氧化碳排放量.
县(市)
A1
A2
A3
A4
A5
A6
人均排放量/吨
2.0
7.5
3.9
5.3
6.4
5.7
则:①这6个县市人均二氧化碳排放量的中位数是________;
②人均二氧化碳排放量较少的前25%的县市为________.
解析 把这组数据由小到大排序得:2.0,3.9,5.3,5.7,6.4,7.5.
①人均二氧化碳排放量的中位数是5.5
②∵6×25%=1.5,∴25%分位数是3.9,即应填A1和A3.
答案 ①5.5 ②A1和A3
题型三 平均数、中位数、众数
据报道,某公司有33名职工,他们所在部门及相应每人所创年利润(单位:万元)如下表所示:
部门
A
B
C
D
E
F
G
人数
1
1
2
1
5
3
20
每人所创年利润
5.5
5
3.5
3
2.5
2
1.5
(1)求该公司职工每人所创年利润的平均数、中位数、众数.
(2)假设部门A每人所创年利润从5.5万元提高到30万元,部门B每人所创年利润由5万元提高到20万元,那么新的平均数、中位数、众数又是多少?
(3)在(2)的条件下,你认为哪个统计量更能反映这个公司职工每人所创年利润的平均水平?
[自主解答] (1)=≈2.1(万元),中位数为1.5(万元),众数为1.5(万元).
(2)′=≈3.3(万元),中位数为1.5(万元),众数为1.5(万元).
(3)中位数或众数均能反映该公司职工每人所创年利润的平均水平.这是因为公司中少数人每人所创年利润与大多数人每人所创年利润差别较大,这样导致平均数与中位数或众数偏差较大,所以平均数不能反映这个公司职工每人所创年利润的平均水平.
[素养聚焦] 通过数字特征的应用,重点提升数据分析核心素养.
平均数、中位数、众数均反映了样本数据的“集中趋势”,但各有侧重:
(1)平均数与每一个样本数据都有关,任何一个样本数据的改变都可能会引起平均数的改变.
(2)众数考查各数据出现的频率,大小只与这组数据中的部分数据有关,当一组数据中有不少数据多次重复出现时,众数往往更能反映这组数据的集中趋势.
(3)中位数仅与数据的排列位置有关,某些数据的变动对中位数没有影响.因此,若平均数受数据中的极端值影响较大时,估计的可靠性就较低,这时可用众数、中位数来表示这组数据的集中趋势.
[触类旁通]
3.某校甲班、乙班各有49名学生,两班在一次数学测验中的成绩(满分100分)统计如下表:
班级
平均分
众数
中位数
甲班
79
70
87
乙班
79
70
79
(1)请你对下面的一段话给予简要分析:
甲班的小刚回家对妈妈说:“昨天的数学测验,全班平均79分,得70分的人最多,我得了85分,在班里算是上游了!”
(2)请你根据表中数据,对这两个班的测验情况进行简要分析,并提出教学建议.
解析 (1)由中位数可知,85分排在第25名之后,从名次上讲,85分不算是上游,但也不能单以名次来判断学习成绩的好坏,小刚得了85分,说明他对这阶段的学习内容掌握较好.
(2)甲班学生成绩的中位数为87分,说明高于或等于87分的学生占一半以上,而平均分为79分,说明两极分化严重,建议对学习有困难的同学多给一些帮助;
乙班学生成绩的中位数为79分,说明学生成绩之间差别较小,成绩很差的学生少,但成绩优异的学生也很少,建议采取措施提高优秀率.
知识落实
技法强化
数据的数字特征:最值、平均数、中位数、百分位数、众数的意义和使用.
选择合适的数字特征体现数据的分布特点:
(1)最值:反映一组数据的极端情况.
(2)平均数:反映了数据的“平均水平”.
(3)中位数和百分位数:优点是不受少数几个极端数据(即排序靠前或靠后的数据)的影响,容易计算,便于利用中间数据的信息;缺点是对极端值不敏感.结合百分位数可更好地确定数据的分布特征.
(4)众数反映了一组数据的“多数水平”.
学科网(北京)股份有限公司
$$