内容正文:
第2课时 极差、方差与标准差
课程标准
素养解读
1.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差)
2.理解离散程度参数的统计含义
在学习和应用标准差、方差和极差的过程中,通过进行运算,对数据进行分析,发展学生的数学运算素养和数据分析素养
[情境引入]
甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:
甲:8,6,7,8,6,5,9,10,4,7;
乙:6,7,7,8,6,7,8,7,9,5.
经过计算可知甲、乙的命中环数的平均数都是7环.
问题 若从二人中选一人去和兄弟部队参加射击大赛,只用平均数能否作出选择?
提示 不能.平均数只能说明二人的平均水平相同,还要用方差来判断谁的射击水平更稳定.
[知识梳理]
1.一组数据x1,x2…,xn的方差和标准差
若数据x1,x2,…,xn的平均数为,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为m+a,方差为m2s2.
4.标准差的意义
标准差刻画了数据的 离散程度 或 波动幅度 ,标准差越大,数据的离散程度越 大 ;标准差越小,数据的离散程度越 小 .
5.分层随机抽样的方差
设样本容量为n,平均数为,其中两层的个体数量分别为n1,n2,两层的平均数分别为,,方差分别为s,s,则这个样本的方差为s2= [s+(-)2]+[s+(-)2].
如何通过样本的数字特征对总体数据作出恰当的估计?
提示:(1)用样本的数字特征估计总体的数字特征分两类:①用样本平均数估计总体平均数;②用样本标准差估计总体标准差.一般来说样本容量越大,这种估计就越精确.
(2)要从总体上去认识各部分内容之间的联系.例如,样本平均数与样本方差是反映样本的两个特征数(平均数反映了这组数据的平均水平,方差或标准差反映了这组数据的稳定与波动、集中与离散程度),频率分布反映的是样本数据(或一组数据)落在各个小范围内的比的大小,反映了样本在整体上的分布情况,将它们合在一起,就可使我们对样本的情况有一个清楚、全面的认识,从而对总体作出恰当的估计.
[预习自测]
1.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的下列数字特征对应相同的是( )
A.平均数 B.标准差
C.众数 D.中位数
解析:B [由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变,故选B.]
2.在高一期中考试中,甲、乙两个班的数学成绩统计如下表:
班级
人数
平均分数
方差
甲
20
甲
2
乙
30
乙
3
其中甲=乙,则两个班数学成绩的方差为( )
A.3 B.2
C.2.6 D.2.5
解析:C [由题意可知两个班的数学成绩平均数为=甲=乙,则两个班数学成绩的方差为
s2=[2+(甲-)2]+[3+(乙-)2]=×2+×3=2.6.]
3.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )
A.8 B.15
C.16 D.32
解析:C [令yi=2xi-1(i=1,2,3,…,10),则所求的标准差为s=2×8=16.]
4.某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差为 ________ .
解析:∵平均数==7,
∴方差s2=×[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]==3.2.
答案:3.2
5.某学校统计教师职称及年龄,中级职称教师的人数为50,其平均年龄为38岁,方差是2,高级职称的教师中有3人58岁,5人40岁,2人38岁,求该校中级职称和高级职称教师年龄的平均数和方差.
解:由已知条件可知高级职称教师的平均年龄为
高==45(岁),
年龄的方差为
s=[3×(58-45)2+5×(40-45)2+2×(38-45)2]=73,
所以该校中级职称和高级职称教师的平均年龄为
=×38+×45≈39.2(岁),
该校中级职称和高级职称教师的年龄的方差是
s2=[2+(38-39.2)2]+[73+(45-39.2)2]=20.64.
标准差、方差的计算与应用
[例1] 从甲、乙两种玉米苗中各抽10株,分别测它们的株高如下:(单位:cm)
甲:25 41 40 37 22 14 19 39 21 42
乙:27 16 44 27 44 16 40 40 16 40
问:(1)哪种玉米苗长得高?
(2)哪种玉米苗长得齐?
[思路点拨] 这显然是要计算两组数据的与s2,然后加以比较并作出判断.
[解] (1)甲=(25+41+40+37+22+14+19+39+21+42)=×300=30(cm),
乙=(27+16+44+27+44+16+40+40+16+40)=×310=31(cm).
所以甲 <乙,
即乙种玉米苗长得高.
(2)s=[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=(25+121+100+49+64+256+121+81+81+144)=×1 042=104.2(cm2),
s=[2×(27-31)2+3×(16-31)2+2×(44-31)2+3×(40-31)2]=×1 288=128.8(cm2).
所以s <s,
即甲种玉米苗长得齐.
1.用样本的标准差、方差估计总体的方法
用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差以确定稳定性.
2.计算标准差的算法
[变式训练]
1.对划艇运动员甲、乙二人在相同的条件下进行了6次测试,测得他们最大速度(m/s)的数据如下:
甲:27,38,30,37,35,31;
乙:33,29,38,34,28,36.
根据以上数据,试判断他们谁更优秀.
解析:甲=(27+38+30+37+35+31)==33,
s=[(27-33)2+(38-33)2+…+(31-33)2]
=×94≈15.7,
乙=(33+29+38+34+28+36)==33,
s=[(33-33)2+(29-33)2+…+(36-33)2]
=×76≈12.7,
∴甲=乙,s>s.
说明甲、乙二人的最大速度的平均值相同,但乙比甲更稳定,故乙比甲更优秀.
分层随机抽样的方差
[例2] 甲、乙两支田径队的体检结果为:甲队体重的平均数为60 kg,方差为200,乙队体重的平均数为70 kg,方差为300,又已知甲、乙两队的队员人数之比为1∶4,那么甲、乙两队全部队员的平均体重和方差分别是多少?
[思路点拨] 由各统计量的定义分别求出甲、乙的数字特征.
[解] 由题意可知甲=60,甲队队员在所有队员中所占权重为=,
乙=70,乙队队员在所有队员中所占权重为=,
则甲、乙两队全部队员的平均体重为=×60+×70=68(kg),
甲、乙两队全部队员的体重的方差为
s2=[200+(60-68)2]+[300+(70-68)2=296.
计算分层随机抽样的方差s2的步骤:
(1)确定1,2,s,s,
(2)确定;
(3)应用公式s2=[s+(1-)2]+[s+(2-)2],计算s2.
[变式训练]
2.某苗圃基地有甲、乙两块地种植了同一种树苗,其中甲地种了1 400棵,乙地种了2 600棵.为了了解甲、乙两块地树苗的长势情况,采用分层抽样的方法抽取样本,并观测样本的指标值(单位:cm),计算得甲地树苗高度的均值为262.5,方差为26,乙地树苗高度的均值为280.6,方差为32.03.根据以上信息,计算总样本的均值和方差,并对这个苗圃树苗长势的总体方差作出估计.
解:把甲地样本记为x1,x2,…,x1 400,其平均数记为,方差记为s;把乙地样本记为y1,y2,…,y2 600,其平均数记为,方差记为s;把总样本数据的平均数记为,方差记为s2.
由=262.5,=280.6,根据分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为=·
+=≈274.3.
总样本方差为s2={1 400×[26+(262.5-274.3)2]+2 600×[32.03+(280.6-274.3)2]}≈104.5.
我们可以计算出总样本的方差为104.5,并据此估计这个苗圃树苗长势的总体方差为104.5.
方差、标准差与统计图表的综合应用
[例3] 甲、乙两人参加某体育项目训练,近期的五次测试成绩得分情况如图所示.
(1)分别求出两人得分的平均数与方差;
(2)根据图形和(1)中计算结果,对两人的训练成绩作出评价.
[思路点拨] 先通过图形统计出甲、乙两人的成绩,再利用公式求出平均数、方差,据此分析两人的成绩,作出评价.
[解] (1)由图可得甲、乙两人五次测试的成绩分别为
甲:10,13,12,14,16;
乙:13,14,12,12,14.
甲==13,
乙==13,
s=×[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,
s=×[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)s>s可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
折线统计图中数字特征的求解技巧
根据折线统计图研究样本数据的数字特征与横坐标和纵坐标的统计意义有关,但一般情况下,整体分布位置较高的平均数大,数据波动性小的方差小.
[变式训练]
3.为了实施“精准扶贫”战略,农科院试种了甲、乙两个西红柿新品种,从这两个品种中各任选5株.测量其产量(单位:kg),得到如下数据:
甲
60
80
70
90
70
乙
80
60
70
80
75
利用上述数据,现从中选出一个品种推荐给农民种植,应该推荐哪个品种呢?
[解](方法一) 使用折线图描述数据如下:
从折线图上可以看出甲品种的平均产量稍高,但其产量不稳定;乙品种的产量稍低,但其产量较稳定.
(方法二) 甲品种的平均产量为甲=74(kg),乙品种的平均产量为乙=73(kg),
所以甲品种的平均产量稍高;
甲品种的方差是s=(142+62+42+162+42)=104,
乙品种的方差是s=(72+132+32+72+22)=56,
由于s>s,所以乙品种的产量较稳定.
1.一组数据的方差一定是( )
A.正数 B.负数
C.任意实数 D.非负数
解析:D [方差可为0和正数.]
2.某次民族运动会上,七位评委为某民族舞蹈节目打出分数分别为79,84,84,84,86,87,93,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )
A.84,4.84 B.84,1.6
C.85,1.6 D.85,4
解析:C [由题意知平均分==85,
s2=[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=×8=1.6.
3.高三学生李丽在一年中的五次数学模拟考试中的成绩(单位:分)为:x,y,105,109,110.已知该同学五次数学成绩数据的平均数为108,方差为35.2,则|x-y|的值为( )
A.15 B.16 C.17 D.18
解析:D [由题意得:=108,①
=35.2,②
由①②解得或
所以|x-y|=18.故选D.]
4.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:
甲
乙
丙
丁
平均数
8.5
8.7
8.8
8.0
方差s2
3.5
3.5
2.1
8.7
则参加奥运会的最佳人选应为 ________ .
解析:因丙的平均数最大,方差最小,故应选丙.
答案:丙
5.从一群游戏的小孩中抽出k人,一人分一个苹果,让他们返回继续游戏一会儿后,再从中任取m人,发现其中有n个小孩曾分过苹果,估计一共有小孩的人数是 ________ 。
解:由题意,k个小孩在总体中所占的比例是,故总体人数是k÷=k·.
学科网(北京)股份有限公司
$$