内容正文:
14.4.1
用样本估计总体集中趋势参数
第十四章
统计
(第1课时)平均数
学 习 目 标
1
2
3
理解总体均值、样本平均数的核心概念,掌握算术平均数的计算公式;
熟练掌握原始数据求平均数、组中值估算平均数、分层抽样样本平均数三种计算方法;
深度体会用样本估计总体的核心统计思想,理解样本平均数作为数据集中趋势代表值的科学性.
新课导入
上几节课我们学习了如何获取数据、如何用统计图表呈现数据,统计的基本思想是什么?
问题 1:甲、乙两个班各 50 人,语文考试成绩出来了,如何比较哪个班的整体成绩更好?
问题 2:某企业 40 个分公司的销售收入数据,如何评价一个销售收入 127 万元的分公司的业绩?
统计的基本思想是用样本估计总体.
新课导入
以上两个问题,我们只需要一个“代表值”,就可以对比各组数据的集中趋势,进而区分好坏.
用一个 “代表值” 描述一组数据的整体水平,这个代表值就是平均数.
本节课我们就来学习如何计算样本平均数,并用它估计总体的集中趋势参数.
探究一:平均数的定义与数学合理性
新知探究
1.平均数的定义
①总体均值:总体中所有数据的算术平均数,代表总体的平均水平.
②样本平均数:样本中所有数据的算术平均数,是总体均值的估计值.
基本公式:
对于 个数据
样本平均数
简记为
个实数 的和记为 ,“”读作 sigma .
新知探究
新知探究
2.平均数的数学合理性
为什么平均数可以代表一组数据的整体水平?
处理实验数据的原则是使近似值与实验数据越接近越好.
设这个近似值为,它与个实验数据的离差分别为
由于上述离差有正有负
故不宜直接相加.可以考虑离差的平方和,即
因为
新知探究
所以当时,离差的平方和最小,故可用
作为表示这个量的理想近似值
样本平均数能代表样本的整体水平,因此可以用它估计总体的平均水平.
典例分析
例1
某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩(总分:150分)如下,试确定这次考试中,哪个班的语文成绩更好一些.
甲班
乙班
典例分析
乙班的平均分约为分,故这次考试乙班成绩要好于甲班.
【分析】我们可用一组数据的平均数衡量这组数据的集中趋势,因此,分别求出甲、乙两个班级的平均分即可.
解:用计算器分别求出甲班的平均分为分
典例分析
例2
下表是某校学生日睡眠时间(单位:h)的抽样频 率分布表,试估计该校学生的平均日睡眠时间.
睡眠时间 人数 频率
【分析】要确定这100名学生的平均日睡眠时间,就必须计算其总睡眠时间.由于每组中的个体日睡眠时间只是一个范围,所以可用各组区间中点的数值(称为“组中值”)近似地表示.
典例分析
解法1 :总睡眠时间约为
故平均日睡眠时间约为.
解法2 :求组中值与对应频率之积的和.
答:估计该校学生的平均日睡眠时间约为.
一般地,若取值为的频率分别为,则其平均数为.
典例分析
例3
某地统计部门为了解企业员工的收入状况,决定进行抽样调查.估计该地共有产业工人大约50 000人,企业管理人员约1 000人,工人与管理人员的月工资收入差异比较大,该地统计部门用分层抽样的方法抽取产业工人500人、企业管理人员10人.被抽取的500名产业工人的人均月工资为5 328元,10名企业管理人员的人均月工资为8 426元,试估计这个地区企业员工的人均月工资.
【分析】利用分层抽样的加权平均方法,分别计算产业工人和企业管理人员的工资估计值,再按总体数量比例求和,得到该地区企业员工的人均月工资估计值.
典例分析
解:被抽取的500名产业工人的人均月工资为5 328元
故这500名产业工人的月工资总额为元.
同理,被抽取的10名企业管理人员的月工资总额为元
所以被抽取的这510名企业员工的月工资总额为元.
因此,被抽取的这510名企业员工的人均月工资(即样本的平均数)为
答:估计该地区企业员工的人均月工资约为5 389元.
知识小结
平均数的定义与数学合理性
1.平均数的计算
①原始数据:
②分组数据:
③分层抽样:
2.数学合理性
离差平方和最小 → 最佳代表值
14
巩固提升
题型1 求平均数
1.数据1,3,6,2,2,4,6,8的平均值是( )
A.3 B.4 C.5 D.6
【分析】根据平均数的定义进行求解即可.
故选:B
【详解】数据1,3,6,2,2,4,6,8的平均值是
,
B
巩固提升
题型1 求平均数
2.已知一组数据的平均数为2;则的平均数为( )
A.2 B.5 C.6 D.8
【分析】利用题给条件和平均数的定义即可求得的平均数为8.
【详解】因为数据的平均数为2
则 ,即
所以的平均数为
,
故选:D.
D
巩固提升
题型2 利用平均数解决问题
3.我国智慧港口的建设飞速发展,作为智能化搬运设备的自动化引导车作用越发凸显.自重吨.再加上集装箱的重量,全车最重可达吨,但其停启位置十分精确,停车误差不超过厘米.码头地面埋设了几万个磁钉,车辆的位置由它们记录下来,传给后台,再由软件精确计算行驶路径,防止碰撞和刮擦.经统计,某港口某次运输中,有台的停车误差为厘米,有台的停车误差为厘米,有台没有停车误差,则该港口本次运输中所有的平均停车误差约为( )
A.厘米 B.厘米 C.厘米 D.厘米
【分析】利用平均数公式可求得该港口本次运输中所有的平均停车误差.
【详解】由题意可知,这该港口本次运输中所有的平均停车误差为厘米.
B
巩固提升
题型2 利用平均数解决问题
4.某单位共有、、三个部门,三部门人员平均年龄分别为岁、岁、岁,又已知和两部门人员平均年龄为岁,和两部门人员平均年龄为岁,则该单位全体人员的平均年龄为( )
A.岁 B.岁 C.岁 D.岁
【分析】设、、三个部门的人数分别为,根据已知条件列出方程组可求出,然后再根据平均数的计算公式即可求出平均年龄.
【详解】设、、三个部门的人数分别为,由题意得
,所以,
所以该单位全体人员的平均年龄为.
B
课堂总结
一起来看看这节课我们学到了些什么?
点击图标,进入本节课的课堂总结
要点回顾
感谢聆听!
用样本估计总体的集中趋势(平均数)
沪教版必修二 · 课堂小结
1. 知识点回顾
2. 易错点警示
3. 解题技巧
点击蓝色下划线显示答案
样本平均数与总体平均数
1. 样本平均数:样本数据的算术平均数,记作 x。若样本容量为 n,数据为 x1, x2, ..., xn,则:
x =
1
n
(x1 + x2 + ... + xn)
2. 总体平均数:总体中所有个体的算术平均数,记作 μ。
3. 统计思想:在实际问题中,通常用样本平均数来估计总体平均数。
频率分布中的平均数
若样本数据中,数值 x1, x2, ..., xk 出现的频率分别为 f1, f2, ..., fk,则样本平均数为:
x = x1f1 + x2f2 + ... + xkfk
在频率分布直方图中,平均数的估计值等于每个小矩形的面积乘以其底边中点的横坐标之和。
概念与计算误区
⚠️ 易错点 1:直方图取值错误
在频率分布直方图中估算平均数时,必须使用区间的中点值(组中值),不能使用左端点或右端点。
⚠️ 易错点 2:极端值的影响
平均数对数据中的极端值(极大或极小值)非常敏感。如果数据中存在极端值,平均数可能无法很好地代表数据的集中趋势。
⚠️ 易错点 3:频率与频数混淆
计算加权平均数时,权重应为频率。如果题目给出的是频数,需先除以样本容量转化为频率,或直接使用频数加权后再除以总数。
直方图估算平均数“三步走”
找中点:确定每个小矩形底边的中点横坐标 mi。
求面积:计算每个小矩形的面积(即该组的频率 fi)。
求和:计算 x ≈ ∑(mi × fi)。
加权平均数模型
平均数可以看作是数据的“重心”。在处理分组数据时,我们将每一组的数据都“看作”集中在该组的组中值上,然后按频率进行加权。
平均数 = 组中值1 × 频率1 + 组中值2 × 频率2 + ...
数学表达规范
向量表示规范:a, b。
样本均值符号:x。
总体均值符号:μ。
$