内容正文:
5.1.2 数据的数字特征
第1课时 最值、平均数、中位数、百分位数、众数
[教学方式:基本概念课——逐点理清式教学]
[课时目标]
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
逐点清(一) 最值与平均数
[多维理解]
1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数最极端的情况.一般地,最大值用max表示,最小值用min表示.
2.平均数
(1)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).简记为=.
(2)求和符号∑具有以下性质:
nt.
(3)性质:一般地,如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
[微点练明]
1.已知1,2,3,4,a,b,c的平均数是8,则a+b+c的值为 ( )
A.43 B.44 C.45 D.46
解析:选D 据题意得×(1+2+3+4+a+b+c)=8,所以a+b+c=46.
2.某班级有50名同学,一次数学测试平均成绩是92,其中学号为前30名的同学平均成绩为90,则学号为后20名同学的平均成绩为 .
解析:设学号为后20名同学的平均成绩为x,因为平均成绩是92,其中学号为前30名的同学平均成绩为90,所以92×50=90×30+20x,解得x=95.
答案:95
3.某班进行一次考核,满分5分,3分(包括3分)以上为合格,得1分,2分,3分,4分,5分的人数占该班人数的比例分别为5%,10%,35%,40%和10%,则该班的平均得分为 .
解析:=1×0.05+2×0.10+3×0.35+4×0.40+5×0.10=3.4,故该班的平均分数为3.4分.
答案:3.4
4.某校女子篮球队7名运动员的身高(单位:cm)分别为180,181,171,172,x,174,175,已知记录的平均身高为175 cm,但其中有一名运动员的身高因记录不清,而用x代替,那么x的值为 .
解析:由条件可知×(180+181+171+172+x+174+175)=175,解得x=172.
答案:172
逐点清(二) 中位数、百分位数、众数
[多维理解]
1.中位数
如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,,则称xn+1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,,则称为这组数的中位数.
2.百分位数
(1)定义:一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于p%位置的数.
(2)确定p%分位数的方法
设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的最小整数,取为p%分位数;如果i是整数,取为p%分位数.
(3)规定:0分位数是x1(即最小值),100%分位数是xn(即最大值).
(4)一般地,一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有p%的数据不大于该值,且至少有(100-p)%的数据不小于该值.
3.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数最多的数据称为这组数据的众数.一组数据的众数可以是一个,也可以是多个.
|微|点|助|解|
(1)求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.中位数不一定是数据中的数.
(2)若有两个或两个以上的数据出现得最多,且出现的次数都一样,则这些数据都叫众数;若一组数据中每个数据出现的次数都一样多,则没有众数.
[微点练明]
1.判断正误(正确的画“√”,错误的画“×”)
(1)中位数是一组数据中间的数. ( )
(2)对于一组数据来说,众数是唯一的. ( )
(3)已知一组数据4,6,5,8,7,6,那么这组数据的25%分位数为6. ( )
答案:(1)× (2)× (3)×
2.某篮球兴趣小组7名学生参加投篮比赛,每人投10个,投中的个数分别为8,5,7,5,8,6,8,则这组数据的众数和中位数分别为 ( )
A.5,7 B.6,7
C.8,5 D.8,7
解析:选D 将数据由小到大进行排列为5,5,6,7,8,8,8,因此,这组数据的众数为8,中位数为7.
3.一组数据1,10,5,2,x,2,且2<x<5,若该组数据的众数是中位数的倍,则该组数据的平均数为 ( )
A.3 B.4
C.4.5 D.5
解析:选B 因为2<x<5,所以由小到大排列为1,2,2,x,5,10,则众数是2,中位数是(2+x),所以2=×(2+x),解得x=4,则平均数是(1+2+2+4+5+10)=4.
4.已知一组数据按从小到大排列为0,4,5,x,8,10,12,15,且这组数据的中位数是7,则这组数据的45%分位数、75%分位数分别是 ( )
A.5.5,10 B.5.5,12
C.6,11 D.6,10
解析:选C 因为中位数为7,所以=7⇒x=6.又数据共有8个,8×45%=3.6,则45%分位数为第4个数据,即6;8×75%=6,则75%分位数为第6个数据与第7个数据的平均数,即=11,故选C.
5.某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:
锻炼时间/h
7
8
9
10
11
人数
6
10
9
8
7
则该校学生一周进行课外锻炼的时间的40%分位数是 ( )
A.8.5 B.8
C.7 D.9
解析:选A 抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故40%分位数为所有数据从小到大排序的第16项与第17项数据的平均数,即=8.5.
逐点清(三) 中位数、众数、平均数的计算与应用
[典例] 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
解:(1)甲群市民年龄的平均数为
(13+13+14+15+15+15+15+16+17+17)=15(岁),
中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
(54+3+4+4+5+5+6+6+6+57)=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
|思|维|建|模|
1.平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
2.众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
[针对训练]
人工智能算力是驱动AI时代创新与进步的核心动力,是重塑经济、社会与国家竞争力的“新质生产力”.某人工智能实验室收集了30台服务器的单机均值算力数据(单位:TFLOPS),数据范围在100~300之间,排序后的数据如下:
115
119
120
133
150
160
161
170
180
190
210
220
220
220
220
225
230
230
239
240
240
241
244
245
247
247
249
250
285
300
(1)直接写出这组数据的众数和中位数;
(2)现该实验室准备组建一个服务器集群,为了使该服务器集群总算力最大(即算力总和最大)的同时又能满足能耗比的需求(要求该集群的服务器的平均算力不低于250),该实验室应该选取多少台服务器组成服务器集群?分别是哪几台?
(3)若该实验室增加2台服务器,算力数据分别是a和b(a<b),通过计算发现,增加这两台服务器前后,该实验室服务器的平均数和75%分位数都不变,求a,b的值.
解:(1)观察已知数据,众数为220,中位数为222.5.
(2)因为×(230+239+240+240+241+244+245+247+247+249+250+285+300)=≈250.54,×(230+230+239+240+240+241+244+245+247+247+249+250+285+300)=≈249.07,所以应该选13台,取所有算力大于等于239的服务器,取1台算力等于230的服务器.
(3)增加前,平均数为×(115+119+…+285+300)=210,a+b=420,a<210,b>210.由30×75%=22.5,得75%分位数为244;增加后,32×75%=24,75%分位数为第24与第25个数据的平均数,仍为244,所以b=244,故a=176.
学科网(北京)股份有限公司
$