内容正文:
第1课时离差平方和、方差
第二十四章数据的分析
1
1. 体会刻画数据离散程度的意义,发展数据观念.
2. 理解离差平方和、方差的概念,能够计算一组
数据的离差平方和、方差.
3. 理解方差的意义,能通过方差比较两组数据的
离散程度.
素养目标
情境引入
问题(教材168页):某农业科学院专家为某地选择合适的甜玉米种子. 选择种子时,甜玉米的产量和产量的稳定性是专家所关心的问题. 为了解甲、乙两种甜玉米种子的相关情况,专家各用10块自然条件相同的试验田进行试验,得到各试验田每公顷的产量(单位:t)如下表所示.
甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41
乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49
根据这些数据估计,专家应该选择哪种甜玉米种子呢?
甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41
乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49
甲和乙两种玉米种子的平均产量为:
x甲 = 7.537
x乙 = 7.515
样本平均数
总体平均数
估计
说明在试验田中,甲、乙两种甜玉米的平均产量相差不大.由此可以估计出这个地区种植这两种甜玉米,它们的平均产量相差不大.
探索新知
思考:如何考查一种甜玉米产量的稳定性呢?
为了直观地反映出甜玉米产量的分布情况,把数据画成下图:
甲种甜玉米的产量
乙种甜玉米的产量
比较看看谁的数据波动比较大?
我们常常用平均数、中位数来刻画数据的“平均水平”,但在有些情况下只知道“平均水平”是不够的.针对以上问题.
统计图尤其是折线图可以很直观的看出一组数据的波动程度,但是要对比两组数据的波动程度时就不够精准了.那有没有一个量来刻画数据的波动程度或离散程度呢?
为了全面反映一组数据的离散程度,可以通过数据与平均数的差异来刻画.
思考:可以用平均离差刻画一组数据的离散程度吗?
概念引入:一般地,由 n 个数据 x1,x2,…,xn,用 x 表示它们的平均数,我们把 xi - x ( i =1,2,…,n ) 叫作 xi 关于平均数 x 的离差.
甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41
乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49
离差和:
(7.65-7.537) + (7.50-7.537) + … + (7.41-7.537)
= 7.65 + 7.50 + … + 7.41-10×7.537
= 0
同理乙的离差和也等于 0
( x1- x ) + ( x2- x ) + … + ( xn- x )
= x1 + x2 + … + xn-nx = 0
一组数据的离差和总是 0,因此平均离差无法刻画一组数据与平均数的差异.
为了避免离差求和时正负抵消的问题,统计中通常先对离差进行平方,然后求和.
我们把
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
叫作这 n 个数据关于平均数的离差平方和.
记作“d 2”.
离差平方和概念
把离差的平方的平均数
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
n
叫作这组数据的方差.
记作“s 2”.
方差越大,数据的离散程度越大;
方差越小,数据的离散程度越小.
数据分布比较分散
数据分布比较集中
方差的概念
甲 7.65 7.50 7.62 7.59 7.65 7.64 7.50 7.40 7.41 7.41
乙 7.55 7.56 7.53 7.44 7.49 7.52 7.58 7.46 7.53 7.49
试着用方差公式分析甲、乙两种甜玉米产量的波动程度.
根据样本估计总体的统计思想,种乙种甜玉米产量较稳定.
思考:用离差平方和是否可以刻画数据的离散程度?和方差比较,有什么不足?
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
d 2 =
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
n
s 2 =
离差平方和可以刻画一组数据的离散程度.在比较两组数据的离散程度时,离差平方和只适用于数据个数相同的情况,而方差不受这个限制.
例1(教材170页例1)甲、乙两名气手枪运动员进行射击训练,10次射击成绩(单位:环)如下表所示.
哪名射击运动员的发挥更稳定?
甲 9 7 9 10 10 8 9 10 5 10
乙 9 10 7 8 10 9 9 8 7 9
方差越大,数据离散程度越大,发挥就不稳定;
方差越小,数据离散程度越小,发挥就更稳定.
典型例题
甲 9 7 9 10 10 8 9 10 5 10
乙 9 10 7 8 10 9 9 8 7 9
解:两名运动员射击成绩的平均数分别为
x甲 =
9+7+ … +10
10
= 8.7
x乙 =
9+10+ … +9
10
= 8.6
两名运动员射击成绩的方差分别为
(9-8.7)2 + (7-8.7)2 + … + (10-8.7)2
10
=
= 2.41
(9-8.6)2 + (10-8.6)2 + … + (9-8.6)2
10
=
= 1.04
由 可知,乙射击运动员的发挥更稳定.
>
例2在一次芭蕾舞比赛中,甲、乙两个芭蕾舞团都表演了舞剧《天鹅湖》,参加表演的女演员的身高(单位:cm)如下表所示.
哪个芭蕾舞团女演员的身高更整齐?
甲团 163 164 164 165 165 166 166 167
乙团 163 165 165 166 166 167 168 168
解:甲、乙两团演员的身高平均数分别是
==165,
==166.
方差分别是
s甲²==1.5,
s乙2==2.5.
由 s甲2<s乙2可知,甲芭蕾舞团女演员的身高更整齐.
1. 如图,有4组数据,将这4组数据按离散程度从小到大排序. 先通过直观判断排序,再根据方差排序. 这两种排序的结果是否一致?
选自教材第171页 练习 第1题
解:这4组数据按离散程度从小到大排序为(1)<(2)<(3)<(4).
巩固练习
x(1)=6
=0
x(2)=6
=0.4
x(3)=6
=2
x(4)=6
=3.2
根据方差可知,这4组数据按离散程度从小到大排序为(1)<(2)<(3)<(4).这两种排序的结果一致.
2. 根据方差比较第149页“问题1”中两组跳绳成绩的离散程度.
选自教材第171页 练习 第2题
甲组 182 194 143 185 156
乙组 199 148 242 170 141
解:甲组跳绳成绩的方差为
(182-172)2 + (194-172)2 + … + (156-172)2
5
=
= 370
x甲
= 172(次/min)
x乙
= 180(次/min)
乙组跳绳成绩的方差为
(199-180)2 + (148-180)2 + … + (141-180)2
5
=
= 1370
由 可知,甲组跳绳成绩的离散程度更小.
<
课堂检测
1.一组数据2,1,1,4的方差为____.
2.甲、乙、丙、丁四名同学参加掷实心球测试,每人掷5次,他们的平均成绩恰好相同,方差分别是 s甲2=0.56,s乙2=0.56,
s丙2=0.52,s丁2=0.48,则这四名同学掷实心球的成绩最稳定的是__.
3.已知一组数据x₁,x₂,x₃,x₄,x₅的方差是 14,那么另一组数据 2x₁−2,2x₂− 2,2x₃−2,2x₄−2,2x₅−2的方差是____.
32
丁
1
4.某中学开展“唱红歌”比赛活动,九年级(1)、(2)班根据初赛成绩,各选出5名选手参加复赛,两个班各选出的5名选手的复赛成绩如图所示.
班级 平均数/分 中位数/分 众数/分
九(1)班 85 85
九(2)班 80
85
85
100
(1)根据图示填写上表;
(2)结合两班复赛成绩的平均数和中位数,分析哪个班级的复赛成绩较好;
(3)计算两班复赛成绩的方差,并说明哪个班级的成绩较稳定.
解:(2)九(1)班成绩好些.因为九(1)班的中位数高,所以九(1)班成绩好些.(回答合理即可)
=×[(75−85)2+(80−85)2+(85−85)2+(85−85)2+(100−85)2]=70,
=×[(70−85)2+(100−85)2+(100−85)2+(75−85)2+(80− 85)²]=160.
> ∴ 九(1)班的成绩较稳定.
5.若一组数据x1,x2,x3,…,xn的平均数x=9,方差s2=6,则另一组数据3x1-2,3x2-2, 3x3-2,…, 3xn-2,的平均数是________,方差是________.
25
54
课堂小结
离差平方和
离差:xi - x ( i =1,2,…,n )
公式:
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
d 2 =
公式:
( x1- x )2 + ( x2- x )2 + … + ( xn- x )2
n
s 2 =
方差越大(小),数据的波动越大(小)
方差的作用
比较数据的稳定性
利用样本方差估计总体方差
方差
课后分层作业
提升层: 某快餐公司的香辣鸡腿很受消费者欢迎.现有甲、乙两家农副产品加工厂到快餐公司推销鸡腿,两家鸡腿的价格相同,品质相近,快餐公司决定通过检查鸡腿的质量来确定选购哪家的鸡腿.检查人员从两家的鸡腿中各随机抽取15个,记录它们的质量(单位:g)如下表所示,根据表中数据,你认为快餐公司应该选购哪家加工厂的鸡腿?
基础层:教材第174~175页习题24.2第1,3,5题.
甲 74 74 75 74 76 73 76 73 76 75 78 77 74 72 73
乙 75 73 79 72 76 71 73 72 78 74 77 78 80 71 75
解:检查人员从甲、乙两家农副产品加工厂各随机抽取的15个鸡腿分别组戌一个样本,样本数据的平均数分别是
x甲=74+74+⋯+72+731575,
x乙=75+73+⋯+71+751575.
样本数据的方差分别是
s甲2=74−752+74−752+⋯+72−752+73−752153,
s乙2=75−752+73−752+⋯+71−752+75−752158
由 x甲x乙可知,两家加工厂的鸡腿质量大致相等;由s²<s² 可知,甲加工厂的鸡腿质量更稳定,大小更均匀.因此,快餐公司应该选购甲加工厂的鸡腿.
$