内容正文:
5.1.2
数据的数字特征
第1课时
最值、平均数、中位数、百分位数、众数
(教学方式:基本概念课—逐点理清式教学)
课时目标
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.
2.结合实例,能用样本估计百分位数,理解百分位数的统计含义.
CONTENTS
目录
1
2
3
逐点清(一) 最值、平均数
逐点清(二) 中位数、百分位数、众数
逐点清(三) 中位数、众数、平均数的计算与应用
4
课时跟踪检测
逐点清(一) 最值、平均数
01
多维理解
1.最值
一组数据的最值指的是其中的最大值与最小值,最值反映的是这组数_________的情况.一般地,最大值用max表示,最小值用______表示.
2.平均数
(1)如果给定的一组数是x1,x2,…,xn,则这组数的平均数为=(x1+x2+…+xn).这一公式在数学中常简记为=___________.
最极端
min
(2)求和符号∑具有以下性质:
nt
(3)性质:一般地,如果x1,x2,…,xn的平均数为,且a,b为常数,则ax1+b,ax2+b,…,axn+b的平均数为a+b.
1.已知1,2,3,4,a,b,c的平均数是8,则a+b+c的值为 ( )
A.43 B.44
C.45 D.46
解析:据题意得×(1+2+3+4+a+b+c)=8,所以a+b+c=46.
微点练明
√
2.某班级有50名同学,一次数学测试平均成绩是92,其中学号为前30名的同学平均成绩为90,则学号为后20名同学的平均成绩为 .
解析:设学号为后20名同学的平均成绩为x,因为平均成绩是92,其中学号为前30名的同学平均成绩为90,所以92×50=90×30+20x,解得x=95.
95
3.某班进行一次考核,满分5分,3分(包括3分)以上为合格,得1分,2分,3分,4分,5分的人数占该班人数的比例分别为5%,10%,35%,40%和10%,则该班的平均得分为 .
解析:=1×0.05+2×0.10+3×0.35+4×0.40+5×0.10=3.4,故该班的平均分数为3.4分.
3.4
4.某校女子篮球队7名运动员的身高(单位:cm)分别为180,181,171,172,
x,174,175,已知记录的平均身高为175 cm,但其中有一名运动员的身高因记录不清,而用x代替,那么x的值为 .
解析:由条件可知×(180+181+171+172+x+174+175)=175,解得x=172.
172
逐点清(二) 中位数、百分位数、
众数
02
多维理解
1.中位数
如果一组数有奇数个数,且按照从小到大排列后为x1,x2,…,x2n+1,则称______为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x1,x2,…,,则称为这组数的中位数.
xn+1
2.百分位数
(1)定义:一组数的p%分位数指的是,将这组数按照从小到大的顺序排列后,处于______位置的数.
(2)确定p%分位数的方法
设一组数按照从小到大排列后为x1,x2,…,xn,计算i=np%的值,如果i不是整数,设i0为大于i的__________,取为p%分位数;如果i是整数,取为p%分位数.
p%
最小整数
(3)规定:0分位数是x1(即最小值),100%分位数是____ (即最大值).
(4)一般地,一组数的p%(p∈(0,100))分位数指的是满足下列条件的一个数值:至少有______的数据不大于该值,且至少有___________的数据不小于该值.
xn
p%
(100-p)%
3.众数
一组数据中,某个数据出现的次数称为这个数据的频数,出现次数______的数据称为这组数据的众数.一组数据的众数可以是______,也可以是______.
最多
一个
多个
|微|点|助|解|
(1)求中位数时一定要先对数据按大小排序,若最中间有两个数据,则中位数是这两个数据的平均数.中位数不一定是数据中的数.
(2)若有两个或两个以上的数据出现得最多,且出现的次数都一样,则这些数据都叫众数;若一组数据中每个数据出现的次数都一样多,则没有众数.
微点练明
1.判断正误(正确的画“√”,错误的画“×”)
(1)中位数是一组数据中间的数. ( )
(2)对于一组数据来说,众数是唯一的. ( )
(3)已知一组数据4,6,5,8,7,6,那么这组数据的25%分位数为6. ( )
×
×
×
2.某篮球兴趣小组7名学生参加投篮比赛,每人投10个,投中的个数分别为8,5,7,5,8,6,8,则这组数据的众数和中位数分别为 ( )
A.5,7 B.6,7
C.8,5 D.8,7
解析:将数据由小到大进行排列为5,5,6,7,8,8,8,因此,这组数据的众数为8,中位数为7.
√
√
3.一组数据1,10,5,2,x,2,且2<x<5,若该组数据的众数是中位数的倍,则该组数据的平均数为( )
A.3 B.4
C.4.5 D.5
解析:因为2<x<5,所以由小到大排列为1,2,2,x,5,10,则众数是2,中位数是(2+x),所以2=×(2+x),解得x=4,则平均数是(1+2+2+4+5+10)=4.
4.已知一组数据按从小到大排列为0,4,5,x,8,10,12,15,且这组数据的中位数是7,则这组数据的45%分位数、75%分位数分别是 ( )
A.5.5,10 B.5.5,12
C.6,11 D.6,10
解析:因为中位数为7,所以=7⇒x=6.又数据共有8个,8×45%=3.6,则45%分位数为第4个数据,即6;8×75%=6,则75%分位数为第6个数据与第7个数据的平均数,即=11,故选C.
√
5.某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:
√
锻炼时间/h 7 8 9 10 11
人数 6 10 9 8 7
则该校学生一周进行课外锻炼的时间的40%分位数是 ( )
A.8.5 B.8
C.7 D.9
解析:抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故40%分位数为所有数据从小到大排序的第16项与第17项数据的平均数,即=8.5.
逐点清(三) 中位数、众数、
平均数的计算与应用
03
[典例] 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):
甲群:13,13,14,15,15,15,15,16,17,17;
乙群:54,3,4,4,5,5,6,6,6,57.
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?
解:甲群市民年龄的平均数为
(13+13+14+15+15+15+15+16+17+17)=15(岁),
中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?
解:乙群市民年龄的平均数为
(54+3+4+4+5+5+6+6+6+57)=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
|思|维|建|模|
1.平均数、众数、中位数的计算方法
平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.
2.众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
针对训练
甲、乙、丙三家电子厂商在广告中都声称,他们的某型号电子产品在正常情况下的待机时间都是12 h,质量检测部门对这三家销售产品的待机时间进行了抽样调查,统计结果(单位:h)如下:
甲:8,9,9,9,9,11,13,16,17,19;
乙:10,10,12,12,12,13,14,16,18,19;
丙:8,8,8,10,11,13,17,19,20,20.
(1)分别求出以上三组数据的平均数、众数、中位数;
解:甲厂数据的平均数是
(8+9+9+9+9+11+13+16+17+19)=12;
乙厂数据的平均数是
(10+10+12+12+12+13+14+16+18+19)=13.6;
丙厂数据的平均数是
(8+8+8+10+11+13+17+19+20+20)=13.4.
甲厂、乙厂、丙厂的众数分别是9,12,8.
甲厂数据的中位数为=10,乙厂数据的中位数为=12.5,丙厂数据的中位数为=12.
(2)这三个厂商的推销广告分别利用了上述哪一种数据来表示待机时间?
解:甲厂用平均数作为该电子产品的待机时间,乙厂用众数作为该电子产品的待机时间,丙厂用中位数作为该电子产品的待机时间.
(3)如果你是顾客,宜选择哪个厂商的产品?为什么?
解:选乙厂的产品.因为乙厂产品的平均数最大,众数最大,中位数最大,所以待机时间更长些.
课时跟踪检测
04
1
3
4
5
6
7
8
9
10
11
12
13
2
1.2023年某高一学生下学期政治考试成绩为79 79 84 84 86 84 87 90 90 97
则该生政治考试成绩的平均数和众数依次为( )
A.85 84 B.84 85
C.86 84 D.84 86
解析:由题意可知,平均数=(79+79+84+84+86+84+87+90+90+97)=86,
众数为84.
√
1
5
6
7
8
9
10
11
12
13
2
3
4
√
2.(多选)下列说法中,正确的是 ( )
A.数据2,4,6,8的中位数是4,6
B.数据1,2,2,3,4,4的众数是2,4
C.一组数据的平均数、众数、中位数有可能是同一个数据
D.8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是
解析:数据2,4,6,8的中位数为=5,显然A是错误的,B、C、D都是正确的.
√
√
1
5
6
7
8
9
10
11
12
13
3
4
2
√
3.如果数据x1,x2,…,xn的平均数是,则3x1+2,3x2+2,…,3xn+2的平均数是( )
A. B.3
C.3+2 D.以上均不是
解析:由平均数的性质可知所求平均数为3+2.
1
5
6
7
8
9
10
11
12
13
3
4
2
4.已知100个数据的75%分位数是9.3,则下列说法正确的是 ( )
A.这100个数据中一定有75个数小于或等于9.3
B.把这100个数据按从小到大排列后,9.3是第75个数据
C.把这100个数据按从小到大排列后,9.3是第75个数据和第76个数据的平均数
D.把这100个数据按从小到大排列后,9.3是第74个数据和第75个数据的平均数
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3.
1
5
6
7
8
9
10
11
12
13
3
4
2
5.有13名同学参加百米竞赛,预赛成绩各不相同,要取前6名参加决赛,某同学已经知道了自己的成绩,为了判断自己是否能进入决赛,他还需要知道13名同学成绩的 ( )
A.平均数 B.众数
C.中位数 D.百分位数
解析:把13名同学成绩按由大到小排列,取成绩靠前的6个成绩进入决赛,即最中间一个数之前的6个成绩进入决赛,13个成绩按由大到小排列时,最中间一个数即是中位数.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
6.2022中国最具幸福感城市调查推选活动在100个地级及以上候选城市名单中,某市入选.“幸福感指数”是指某个人主观地评价他对自己目前生活状态的满意程度的指标,常用区间[0,10]内的一个数来表示,该数越接近10表示满意度越高.现随机抽取20位该市居民,他们的幸福感指数见下表:
3 3 4 5 5 6 6 6 7 7
7 7 8 8 8 8 9 9 10 10
则这组数据的80%分位数是 ( )
A.7.7 B.8 C.8.5 D.9
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:表格中的数据已按由小到大排列,而20×80%=16,第16个数和第17个数的平均数为=8.5,所以这组数据的80%分位数是8.5.
1
5
6
7
8
9
10
11
12
13
3
4
2
7.已知某旅游城市某年前10个月的游客人数(万人)按从小到大的顺序排列如下:3,5,6,9,x,y,15,17,18,21,若该组数据的中位数为13,则该组数据的平均数为 ( )
A.12 B.10.7 C.13 D.15
解析:因为偶数个数按从小到大排列的中位数是中间两个数的平均数,而x和y刚好排列在中间,所以=13,即x+y=26,所以这组数据的平均数为×(3+5+6+9+26+15+17+18+21)=12.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
8.已知样本x1,x2,…,xn的平均数为,样本y1,y2,…,ym的平均数为(≠).若样本x1,x2,…,xn,y1,y2,…,ym的平均数=α+(1-α),其中0<α<,则n,m的大小关系为( )
A.n<m B.n>m
C.n=m D.不能确定
√
1
5
6
7
8
9
10
11
12
13
3
4
2
解析:由题意得x1+x2+…+xn=n,y1+y2+…+ym=m,x1+x2+…+xn+y1+y2+
…+ym=(m+n)=(m+n)[α+(1-α)]=(m+n)α+(m+n)(1-α),所以n+m=
(m+n)α+(m+n)(1-α).所以
故n-m=(m+n)[α-(1-α)]=(m+n)(2α-1).
因为0<α<,所以2α-1<0.所以n-m<0,即n<m.
1
5
6
7
8
9
10
11
12
13
3
4
2
9.一个样本的数据在60左右波动,各个数据都减去60后得到一组新数据,算得其平均数是6,则这个样本的平均数是 ( )
A.6.6 B.6
C.66 D.60
解析:设原来的一组数据是x1,x2,…,xn,则每一个数据都减去60得到新数据且求得新数据的平均数是6,所以×[(x1-60)+(x2-60)+…+(xn-60)]=6,即-60=6,所以=66,故样本的平均数是66.
√
1
5
6
7
8
9
10
11
12
13
3
4
2
10.数据8,12,15,18,21,23,23,23,28,33,34,35的80%分位数是 .
解析:这组数据有12个数,因为12×80%=9.6,所以这组数据的80%分位数是33.
33
1
5
6
7
8
9
10
11
12
13
3
4
2
11.若某校高一年级8个班参加合唱比赛的得分分别为89,91,90,92,
87,93,96,94,则这组数据的中位数是 ;平均数是 ;
最大值是 ;25%分位数是 .
解析:把这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数是=91.5;平均数=×(87+89+90+91+92+93+94+96)=91.5;
最大值为96;因为数据个数为8,且8×25%=2,所以这组数据的25%分位数是=89.5.
91.5
91.5
96
89.5
1
5
6
7
8
9
10
11
12
13
3
4
2
12.(12分)16种食品所含的热量值如下:
111 123 123 164 430 190 175 236
430 320 250 280 160 150 210 123
(1)求数据的中位数与平均数;
解:将数据从小到大排列得
111,123,123,123,150,160,164,175,190,210,236,250,280,320,430,430.
所以中位数为=182.5,
平均数为×(111+123+123+123+150+160+164+175+190+210+236+250+
280+320+430+430)=217.187 5.
1
5
6
7
8
9
10
11
12
13
3
4
2
(2)用这两种数字特征中的哪一种来描述这个数据更合适?
解:用平均数描述这个数据更合适,理由如下:平均数反映的是总体的一个情况,中位数只是数据从小到大排列得到的最中间的一个数或两个数的平均值,所以平均数更能反映总体的一个整体情况.
1
5
6
7
8
9
10
11
12
13
3
4
2
13.(13分)高一三班有男同学27名、女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分.
(1)求这次测验全班的平均分(精确到0.01);
解:这次测验全班的平均分=(82×27+80×21)≈81.13(分).
(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?
解:因为男同学的中位数是75,所以至少有14人得分不超过75分.又因为女同学的中位数是80,所以至少有11人得分不超过80分.
所以全班至少有25人得分在80分以下(含80分).
1
5
6
7
8
9
10
11
12
13
3
4
2
(3)分析男同学的平均分与中位数相差较大的主要原因是什么?
解:男同学的平均分与中位数的差别较大,说明男同学的得分两极分化现象严重,得分高的和低的相差较大.
xi
①(xi+yi)=xi+yi;②(kxi)=kxi;③t=_____.
$$