内容正文:
§4 用样本估计总体的数字特征
4.1 样本的数字特征
课程标准
素养解读
1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义
通过对数据的分析发展学生数学运算和数学建模素养
[情境引入]
现从甲、乙、丙三个厂家生产的同一种家电产品中,各抽取8件产品,对其使用寿命进行跟踪调查,其结果如下:(单位:年)
甲:3,4,5,6,8,8,8,10;
乙:4,6,6,6,8,9,12,13;
丙:3,3,4,7,9,10,11,12,
三家广告中都称其产品的使用寿命为8年,利用初中所学的知识,你能说明为什么吗?
提示:三个厂家是从不同角度进行了说明,以宣传自己的产品.其中甲:众数为8年,乙:平均数为8年,丙:中位数为8年.
[知识梳理]
[知识点一] 众数、中位数、平均数
数字
特征
定义与求法
优点与缺点
众数
一组数据中重复出现次数最多的数
众数通常用于描述变量的中心位置,但显然它对其他数据信息的忽视使得其无法客观地反映总体特征
中位数
把一组数据按大小顺序排列,处在 中间 位置的一个数据(或两个数据的平均数)
中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数
如果有n个数x1,x2,x3,…,xn,那么这n个数的平均数=
平均数与每一个样本数据有关,可以反映样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低
1.一组数据的众数可以是一个或几个也可以没有,那么中位数是否也具有相同的结论?
提示:中位数在一组数据中一定存在且是唯一的.
2.如何通过频率分布直方图确定众数、中位数、平均数?
提示:(1)众数是最高矩形底边的中点.
(2)中位数左边和右边的直方图面积相等,由此来估计中位数的值.
(3)平均数是频率分布直方图的“重心”,它等于每个小矩形的面积乘以小矩形底边中点的横坐标之和.
[知识点二] 方差和标准差
概念或计算公式
特征或作用
极差
样本数据中最大值和最小值的差
能粗略地刻画样本数据的离散程度
方差
s2=[(x1-)2+(x2-)2+…+(xn-)2]
较好地刻画样本数据偏离平均数的离散程度,标准差、方差越 小 ,数据的离散程度越小
标准差
s=
3.如何通过样本的数字特征对总体数据作出恰当的估计?
提示:(1)用样本的数字特征估计总体的数字特征分两类:①用样本平均数估计总体平均数;②用样本标准差估计总体标准差.一般来说样本容量越大,这种估计就越精确.
(2)要从总体上去认识各部分内容之间的联系.例如,样本平均数与样本方差是反映样本的两个特征数(平均数反映了这组数据的平均水平,方差或标准差反映了这组数据的稳定与波动、集中与离散程度),频率分布反映的是样本数据(或一组数据)落在各个小范围内的比的大小,反映了样本在整体上的分布情况,将它们合在一起,就可使我们对样本的情况有一个清楚、全面的认识,从而对总体作出恰当的估计.
[预习自测]
1.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值为( )
A.4.55 B.4.5 C.12.5 D.1.64
解析:A [由条件得=(4×3+3×2+5×4+6×2)≈4.55.]
2.下列数据的中位数和众数分别是( )
79,84,84,86,84,87,93
A.84,84 B.84,86
C.85,84 D.86,84
解析:A [把数据由小到大排列得79,84,84,84,86,87,93,可知众数和中位数都是84.]
3.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15 C.16 D.32
解析:C [令yi=2xi-1(i=1,2,3,…,10),则所求的标准差为s=2×8=16.]
4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差为 ________ .
解析:∵平均数==7,
∴方差s2=×[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]==3.2.
答案:3.2
利用众数、中位数、平均数估计总体
[例1] 某产品售后服务中心随机选取了20个工作日,分别记录了每个工作日接到的客户服务电话的数量(单位:次):
63 38 25 42 56 48 53 39 28 47
45 52 59 48 51 62 48 50 52 38
(1)分别计算以上数据的平均数、中位数和众数;
(2)根据以上结果,你能为该产品的售后服务中心提供什么建议?
[思路点拨] 先根据众数、中位数、平均数的概念进行求解,然后根据众数、中位数、平均数反映的数字特征来进行讨论.
[解] (1)由题意,该组数据的平均数为(63+38+25+42+56+48+53+39+28+47+45+52+59+48+51+62+48+50+52+38)=47.2,这些数据从小到大排序为:25,28,38,38,39,42,45,47,48,48,48,50,51,52,52,53,56,59,62,63,所以数据的中位数为=48,其中众数为48.
(2)根据以上数据,该产品售后服务中心每天应准备接听48个客户的电话.
众数、中位数、平均数的意义
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算、不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均教的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
[变式训练]
1.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:
甲群 13,13,14,15,15,15,15,16,17,17
乙群 54,3,4,4,5,5,6,6,6,57
(1)甲群市民年龄的平均数、中位数和众数各是多少岁?
其中哪个统计量能较好地反映甲群市民的年龄特征?
(2)乙群市民年龄的平均数、中位数和众数各是多少岁?
其中哪个统计量能较好地反映乙群市民的年龄特征?
解:(1)甲群市民年龄的平均数为
=15(岁),
中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.
(2)乙群市民年龄的平均数为
=15(岁),
中位数为5.5岁,众数为6岁.
由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.
标准差、方差的计算与应用
[例2] 从甲、乙两种玉米苗中各抽10株,分别测它们的株高如下:(单位:cm)
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
[思路点拨] 这显然是要计算两组数据的与s2,然后加以比较并作出判断.
[解] (1)甲=(25+41+40+37+22+14+19+39+21+42)=×300=30(cm),
乙=(27+16+44+27+44+16+40+40+16+40)
=×310=31(cm).
所以甲 <乙,
即乙种玉米苗长得高.
(2)s=[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=(25+121+100+49+64+256+121+81+81+144)
=×1 042=104.2(cm2),
s=[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]=×1 288=128.8(cm2).
所以s <s,
即甲种玉米苗长得齐.
1.用样本的标准差、方差估计总体的方法
用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差以确定稳定性.
2.计算标准差的算法
[变式训练]
2.对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:
甲:27,38,30,37,35,31
乙:33,29,38,34,28,36
根据以上数据,试判断他们谁更优秀.
解:甲=(27+38+30+37+35+31)==33,
s=[(27-33)2+(38-33)2+…+(31-33)2]
=×94≈15.7,
乙=(33+29+38+34+28+36)==33,
s=[(33-33)2+(29-33)2+…+(36-33)2]
=×76≈12.7,
∴甲=乙,s>s.
说明甲、乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.
方差、标准差与统计图表的综合应用
[例3] 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
[思路点拨] 先通过图形统计出甲、乙两人的成绩,再利用公式求出平均数、方差,据此分析两人的成绩,作出评价.
[解] (1)由图可得甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16
乙:13,14,12,12,14
甲==13,
乙==13,
s=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
折线统计图中数字特征的求解技巧
根据折线统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关,但一般情况下,整体分布位置较高的平均数大,数据波动性小的方差小.
[变式训练]
3.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出折线图:
(1)分别计算甲、乙两厂提供10个轮胎宽度的平均值;
(2)轮胎的宽度在[194,196]内,则称这个轮胎是标准轮胎.试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差的大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好?
解:(1)记甲厂提供的10个轮胎宽度的平均值为1,乙厂提供的10个轮胎宽度的平均值为2,
1=
=195(mm),
2=
=194(mm).
(2)甲厂10个轮胎宽度在[194,196]内的数据为195,194,196,194,196,195,则平均数为
=195,所以方差
s=×[02+(-1)2+12+(-1)2+12+02]=;
乙厂10个轮胎宽度在[194,196]内的数据为195,196,195,194,195,195,则平均数为
=195,所以方差s=×[02+12+02+(-1)2+02+02]=;因为甲、乙两厂生产的标准轮胎宽度的平均值一样,但乙厂的方差更小,所以乙厂的轮胎相对更好.
1.一组样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x等于( )
A.21 B.22 C.20 D.23
解析:A [根据题意知,中位数22=,则x=21.]
2.某次民族运动会上,七位评委为某民族舞蹈节目打出分数分别为79,84,84,84,86,87,93,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
解析:C [由题意知平均分==85, s2=[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=×8=1.6.
3.已知一组数据为10,20,30,40,40,40,50,60,70,其中平均数、中位数、众数的大小关系为( )
A.平均数>中位数>众数
B.平均数<中位数<众数
C.中位数<众数<平均数
D.中位数=众数=平均数
解析:D [中位数、众数、平均数均为40.]
4.某学生几次数学测试成绩为53,60,63,71,74,75,80,则该学生这几次数学测试的平均成绩为 ________ .
解析:所求的平均成绩为×(53+60+63+71+74+75+80)=68.
答案:68
5.甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:
甲:82,81,79,78,95,88,93,84
乙:92,95,80,75,83,80,90,85
(1)指出乙学生成绩的中位数;
(2)现要从中选派一人参加数学竞赛,从平均数和方差的角度考虑,你认为派哪位学生参加合适?请说明理由.
解:(1)将乙学生的成绩按从低到高的顺序排到:75,80,80,83,85,90,92,95.中间两个数是83,85,故乙学生成绩的中位数为84.
(2)派甲参加比较合适.理由如下:
甲=×(82+81+79+78+95+88+93+84)=85,
乙=×(92+95+80+75+83+80+90+85)=85,
s=×[(82-85)2+(81-85)2+(79-85)2+(78-85)2+(95-85)2+(88-85)2+(93-85)2+(84-85)2]=35.5,
s=×[(92-85)2+(95-85)2+(80-85)2+(75-85)2+(83-85)2+(80-85)2+(90-85)2+(85-85)2]=41,
∵甲=乙,s<s,
∴甲的成绩比较稳定,派甲参加比较合适.
学科网(北京)股份有限公司
$$