内容正文:
统 计
第六章
§4 用样本估计总体的数字特征
4.1 样本的数字特征
返回导航
高中数学 必修 第一册 (北)
学习目标 1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义(重点).
2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义(重点).
返回导航
高中数学 必修 第一册 (北)
平均值
从小到大
数据量是一样的
返回导航
高中数学 必修 第一册 (北)
多
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
×
×
×
√
×
√
返回导航
高中数学 必修 第一册 (北)
C
返回导航
高中数学 必修 第一册 (北)
解析
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
解析
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
解析
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
D
返回导航
高中数学 必修 第一册 (北)
D
返回导航
高中数学 必修 第一册 (北)
解析
返回导航
高中数学 必修 第一册 (北)
老板 30 000元
大厨 4 500元
二厨 3 500元
采购员 4 000元
杂工 3 200元
服务生 3 200元
会计 4 100元
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
C
返回导航
高中数学 必修 第一册 (北)
解析
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
解
返回导航
高中数学 必修 第一册 (北)
返回导航
高中数学 必修 第一册 (北)
D
水平达标
返回导航
高中数学 必修 第一册 (北)
解 析
返回导航
高中数学 必修 第一册 (北)
D
水平达标
返回导航
高中数学 必修 第一册 (北)
解 析
返回导航
高中数学 必修 第一册 (北)
B
水平达标
返回导航
高中数学 必修 第一册 (北)
解 析
返回导航
高中数学 必修 第一册 (北)
水平达标
返回导航
高中数学 必修 第一册 (北)
解 析
返回导航
高中数学 必修 第一册 (北)
课时梯级训练(41)
返回导航
高中数学 必修 第一册 (北)
谢谢观看
返回导航
高中数学 必修 第一册 (北)
样本的数字特征
数字特征
概念或计算公式
特征或作用
平均数
样本数据的_________
反映出样本数据中更多的信息,对样本中的极端值敏感
中位数
将样本数据按____________的顺序排列后,“中间”的那个数据
使样本数据被分成的两部分的_____________________,不受少数几个极端数据的影响
数字特征
概念或计算公式
特征或作用
众数
样本数据中出现次数最___的数据
体现了样本数据的最大集中点
极差
样本数据中最大值和最小值的差
能粗略地刻画样本数据的离散程度
数字特征
概念或计算公式
特征或作用
方差
s2=[(x1-)2+(x2-)2+…+(xn-)2]
较好地刻画样本数据偏离平均数的离散程度,标准差、方差越小,数据的离散程度越小
标准差
s=
(1)一组数据的“平均数”、“中位数”都是唯一的.众数不唯一,可以有一个,也可以有多个,还可以没有.
(2)“众数”一定是原始数据中的数,平均数和中位数都不一定是原始数据中的数.
(3)“标准差”的单位与原始数据的单位相同,“方差”的单位是原始数据单位的平方,在解决实际问题时,一般采用标准差.
(4)标准差(方差)的范围为[0,+∞),若样本数据都相等,表明数据没有波动幅度,数据没有离散性,标准差为0;反之,标准差为0,数据都相等.极差的范围为[0,+∞),标准差的大小不会超过极差.
1.判断下列说法是否正确,正确的在它后面的括号里画“√”,错误的画“×”.
(1)当样本中的数据都增加相同的量时,平均数不变. ( )
(2)一组样本数据的众数只有一个. ( )
(3)样本的中位数可以有两个值. ( )
(4)数据极差越小,样本数据分布越集中、稳定. ( )
(5)数据平均数越小,样本数据分布越集中、稳定. ( )
(6)样本的标准差和方差都是非负数. ( )
2.一组数据:85,88,73,88,79,85,其众数是 ( )
A.88 B.73
C.88,85 D.85
该组数据有两个众数,它们是88,85.
3.已知一组数据0,2,x,4,5的众数是4,那么这组数据的平均数是_______.
答案:3
∵数据0,2,x,4,5的众数是4,
∴x=4.
这组数据为0,2,4,4,5,
∴平均数为=3.
4.如果5个数x1,x2,x3,x4,x5的平均数为7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是________.
答案:8
∵(x1+x2+x3+x4+x5)=7,
∴[(x1+1)+(x2+1)+(x3+1)+(x4+1)+(x5+1)]=(x1+x2+x3+x4+x5)+1=7+1=8.
即x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数为8.
探究一 总体离散程度估计
[例1] 已知母鸡产蛋的最佳温度在10 ℃左右,下面是在甲、乙两地六个时刻测得的温度,你认为甲、乙两地哪个地方更适合母鸡产蛋?
时刻(时)
4
8
12
16
20
24
温度(℃)
甲地
-5
7
15
14
-4
-3
乙地
1
4
10
7
2
0
①甲=×(-5+7+15+14-4-3)=4(℃);
乙=×(1+4+10+7+2+0)=4(℃).
②标准差:
s甲=≈8.4,
s乙=≈3.5,
显然两地的平均温度相等,乙地温度的标准差较小,说明乙地温度波动较小.
因此,乙地比甲地更适合母鸡产蛋.
1.样本的方差、标准差反映了数据的离散程度.
2.用样本的标准差、方差估计总体的方法
用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.在实际应用中,常常把平均数与标准差结合起来进行决策.在平均值相等的情况下,比较方差或标准差以确定稳定性.
[练1] (1) (2025·德阳高一检测)下列说法不正确的是 ( )
A.方差是标准差的平方
B.标准差的大小不会超过极差
C.若一组数据的值大小相等,没有波动变化,则标准差为0
D.标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散
(2)(2025·六安高一期末)样本中共有5个个体,其值分别为a,0,1,2,3.若该样本的平均数为1,则样本的标准差为 ( )
A. B.
C.2 D.
(1)标准差越小,表明各个样本数据在样本平均数周围越集中;标准差越大,表明各个样本数据在样本平均数周围越分散.
(2)因为样本a,0,1,2,3的平均数为1,则(a+0+1+2+3)=1,解得a=-1,
则样本的方差s2=×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2,故标准差为.故选D.
探究二 总体集中趋势估计
[例2] 下面是某个体快餐店所有工作人员10月份的工资表:
(1)你认为快餐店所有工作人员的平均工资能否反映打工人员这个月收入的一般水平?为什么?哪个数字特征更能反映打工人员这个月收入的一般水平?
(2)去掉老板的工资后员工的平均工资能代表打工人员当月的收入水平吗?
(3)根据以上计算,以统计的观点,谈谈你有什么看法?
(1)所有员工10月份的平均工资1=×(30 000+4 500+3 500+4 000+3 200+3 200+4 100)=7 500(元).
所有员工的平均工资不能反映打工人员当月收入的一般水平,可以看出,打工人员的工资都低于平均工资.因为这7个值中有一个极端值——老板的工资特别高,所以他的工资对平均工资的影响较大,平均工资不能反映打工人员这个月收入的一般水平.中位数更能反映打工人员当月收入的一般水平.
(2)去掉老板的工资后的平均工资2=×(4 500+3 500+4 000+3 200+3 200+4 100)=3 750(元),该平均工资能代表打工人员当月收入的一般水平.
(3)从本题的计算可以看出,个别特殊值对平均数有很大的影响,因此在选择样本时,样本中尽量不用特殊数据.当样本数据中存在极端值时,中位数比平均数更能反映样本特征.
1.样本的众数、中位数、平均数反映了数据的集中趋势.
2.计算众数、中位数、平均数的策略
(1)样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算、不受少数几个极端值的影响,但只能表达样本数据中的少量信息,平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.
(2)当一组数据中有不少数据重复出现时,其众数往往更能反映问题,当一组数据中个别数据较大时,可用中位数描述其集中趋势.
[练2] 16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断他能否进入决赛.则从其他15位同学成绩的下列数据中,能使他得出结论的是 ( )
A.平均数 B.极差
C.中位数 D.众数
判断小刘能否进入决赛,只要判断是不是前8名,所以只要知道其他15位同学的成绩中是不是有8个高于他,也就是把其他15位同学的成绩从小到大排列后看第8个的成绩即可,小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8名的成绩就是这15位同学成绩的中位数.故选C.
探究三 用样本估计总体数字特征
[例3] 在一次科技知识竞赛中,两组学生的成绩如下表:
分数
50
60
70
80
90
100
人数
甲组
2
5
10
13
14
6
乙组
4
4
16
2
12
12
已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.
(1)∵甲组成绩的众数为90,乙组成绩的众数为70,
∴从成绩的众数比较看,甲组成绩好些.
(2)由已知得两个组的平均分都是80分,
甲组成绩的方差:
s=×[2×(50-80)2+5×(60-80)2+10×(70-80)2+13×(80-80)2+14×(90-80)2+6×(100-80)2]=172;
乙组成绩的方差:
s=×[4×(50-80)2+4×(60-80)2+16×(70-80)2+2×(80-80)2+12×(90-80)2+12×(100-80)2]=256.
∵s<s,∴甲组成绩较乙组成绩稳定,甲组好些.
(3)∵甲、乙两组成绩的中位数、平均数都是80分,
其中甲组成绩在80分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有26人,
∴从这一角度看,甲组的成绩较好.
(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于等于90分的有24人,
∴乙组成绩集中在高分段的人数多.同时乙组得满分的人数比甲组得满分的人数多6人,
∴从这一角度看,乙组的成绩较好.(以上四条任答一条即可)
用样本估计总体的关注点
(1)用样本的数字特征估计总体的数字特征时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差,这些偏差是由样本的随机性引起的.
(2)虽然样本的数字特征并不是总体真正的数字特征,而是总体的一个估计,但这种估计是合理的,特别是当样本容量很大时,样本的数字特征稳定于总体的数字特征.
[练3] 甲、乙两台机床同时生产某种零件,科研部门随机抽取了它们10天中生产的产品,统计其每天生产的次品数(单位:个)如下表:
甲
0
2
1
0
3
0
2
1
2
4
乙
2
1
1
2
1
0
2
1
3
2
(1)计算这10天中甲、乙机床次品数的平均数和方差;
(2)从计算结果看,哪台机床的性能更好?
(1)由题意,可得甲机床生产某种零件次品的平均数=i=1.5,
方差s=(xi-)2=1.65;
乙机床生产某种零件次品的平均数=i=1.5,方差s=yi-)2=0.65.
所以这10天中甲、乙机床生产产品的次品数的平均数均为1.5,方差分别为1.65,0.65.
(2)由(1)可知,=,且s>s,
即两机床的平均水平相同,但乙机床相对稳定,
所以乙机床的性能更好.
特别提醒:不要忽视数字特征的不同作用.
1.(2025·太原高一统考)下列数字特征中,刻画一组数据离散程度的是 ( )
A.平均数 B.中位数
C.众数 D.方差
平均数、中位数、众数是描述一组数据的集中趋势的量;
方差是衡量一组数据偏离其平均数的大小的量,即刻画一组数据离散程度.故选D.
2.每年的4月23日是世界读书日,某中学为了了解八年级学生的读书情况,随机调查了50名学生每月读书的册数,统计数据如表所示:
册数
0
1
2
3
4
人数
3
13
16
17
1
则这50名学生读书册数的众数、中位数分别是 ( )
A.3,3 B.2,2
C.2,3 D.3,2
∵这组样本数据中,3出现了17次,出现的次数最多,
∴这组数据的众数是3;
∵将这组样本数据按从小到大的顺序排列,其中处于中间的两个数都是2,
∴这组数据的中位数为2.故选D.
3.已知五个数2,a,6,5,3的平均数为4,则a= ( )
A.3 B.4
C.5 D.6
由题意可得=4,∴a=4.故选B.
4.已知一组数据6,7,8,9,10,则该组数据的方差是________.
答案:2
∵该组数据的平均数==8,
∴该组数据的方差s2=×[(6-8)2+(7-8)2+(8-8)2+(9-8)2+(10-8)2]=2.
$$