内容正文:
第九章 统计
9.2 用样本估计总体
9.2.3 总体集中趋势的估计(第1课时)
【学习目标】
1. 掌握频率分布直方图中的平均数、中位数、众数的计算方法.
1. 能用样本估计总体的集中趋势,如平均数、中位数、众数,理解集中趋势参数的统计含义.
1. 通过总体均值趋势的学习,提升学生的数学运算、数据分析素养.
【学习重点】
1. 平均数、中位数、众数的定义及计算方法.
2. 在频率分布直方图中估计平均数、中位数、众数.
3. 根据数据分布形态判断平均数与中位数的大小关系.
【学习难点】
1. 理解平均数对极端值的敏感性,以及中位数、众数的稳健性.
2. 根据实际问题选择合适的集中趋势统计量.
学习任务一 平均数、中位数、众数的概念与计算
【合作探究】
1. 问题引入:
· 一家公司招聘员工,宣称“公司50名员工的平均年收入为11.5万元”.如果你期望年薪10万元,这个信息是否可靠?
· 需要注意的是,平均数可能会受极端值影响,因此还需要看中位数、众数等反映集中趋势的统计量.
1. 定义回顾:
1. 众数:一组数据中出现次数最多的数.
2. 中位数:将数据从小到大排列后,处于中间位置的数(若样本量为偶数,则取中间两个数的平均值).
3.
平均数:所有数据之和除以数据个数,即 .
1. 计算实例(以教材中100户居民月均用水量数据为例):
1.
平均数: 吨.
2.
中位数:将数据排序后,第50和第51个数据的平均值.由排序列表可得中位数约为 吨.
3.
众数:出现次数最多的数据,例如 出现了多次.
·
可见平均数远大于中位数,说明数据中存在较大的极端值(如 吨),导致平均数被拉高.
1. 思考:
1. 若有人用平均数11.5万元来宣称公司待遇好,而你的期望是10万元,你会相信吗?
· (不一定,因为可能有高管年薪极高拉高了平均数,普通员工可能远低于10万.)
2. 中位数和众数受极端值影响较小,更能反映“多数人”的水平.
【自主梳理】
1. 平均数:反映总体平均水平,受极端值影响大.
2. 中位数:反映数据中间位置,稳健.
3. 众数:反映出现最频繁的值,适用于分类型数据.
4. 当数据分布对称时,平均数≈中位数;右偏(正偏)时,平均数>中位数;左偏(负偏)时,平均数<中位数.
学习任务二 频率分布直方图中集中趋势的估计
【合作探究】
1. 估计众数:
· 在频率分布直方图中,最高的小矩形所在区间的中点值即为众数的估计值.
·
例如,若用水量直方图中最高矩形对应的区间是 ,则众数约为 .
1. 估计中位数:
·
中位数是累计频率达到 时的横坐标.
· 步骤:
(1) 计算各组频率(面积).
(2)
从左到右累加频率,直到累加和首次达到或超过 ,确定所在组.
(3)
在该组内按比例插值:设该组下限为 ,组距为 ,组频率为 ,前 组频率和为 ,则中位数 .
1. 估计平均数:
· 在频率分布直方图中,平均数的估计值为各组组中值与对应频率的乘积之和.
·
设第 组组中值为 ,频率为 ,则 .
1. 例题:
·
某校学生身高的频率分布直方图(文字描述:组距 ,各组频率 ).
(1)
众数:最高矩形频率 ,组中值 需具体数值,设为 则众数约 .
(2)
中位数:累计频率 ,,正好在第三组累计到 ,中位数取第三组上限?若恰好等于 ,则取该组上界.实际应取组中值或上界.
(3) 平均数:用组中值计算.
【自主梳理】
· 在频率分布直方图中:
1. 众数 = 最高矩形中点.
2.
中位数 = 累计频率 对应的横坐标(插值).
3. 平均数 = 组中值与频率乘积之和.
· 平均数、中位数、众数的大小关系可反映数据分布形态.
学习任务三 集中趋势统计量的选择与应用
【合作探究】
1. 例题:校服规格选择
· 某校高一年级女生需要不同规格校服的频数如下表(文字描述:规格155、160、165、170、175,频数分别为30、50、80、40、20).
· 若用一个量代表该校高一年级女生所需校服的规格,应选哪个统计量?
·
解:数据为分类型(规格),应选用众数.众数为 ,故校服规格选择 比较合适.
1. 思考:
1. 用这所学校的数据估计全国高一年级女生校服规格合理吗?
· (不合理,因为各地身高存在差异.)
2. 数值型数据一般用平均数或中位数,分类型数据用众数.
1. 极端值影响:
· 平均数对极端值敏感,中位数和众数较稳健.
· 例如,某次考试中,一个学生得满分,其余低分,则平均数被拉高,中位数更能反映大多数学生水平.
【自主梳理】
· 统计量选择原则:
1. 数值型数据:平均数或中位数(数据对称用平均数,偏态用中位数).
2. 分类型数据:众数.
· 平均数反映整体水平,易受极端值影响;中位数反映中等水平,稳健;众数反映多数水平.
【自查自纠】(正误判断)
1. 中位数是一组数据中间的数. ( )
1. 众数是一组数据中出现次数最多的数. ( )
1. 一组数据中的众数只有1个. ( )
1. 平均数反映了一组数据平均水平,任何样本数据改变都会引起平均数变化. ( )
1. 一组数据中,有一半的数据不大于中位数,而另一半则不小于中位数,中位数受极端值的影响较小. ( )
答案:1.×(偶数时是中间两数的平均数) 2.√ 3.×(可能有多个) 4.√ 5.√
【典例分析】
例1:某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为165,那么由此求出的平均数与实际平均数的差是多少?
解:输入错误导致总和增加了 ,平均数增加了 ,所以求出的平均数比实际平均数大 .
例2:在某次演讲比赛中,7个评委给某学生的分数为 .去掉一个最高分和一个最低分后,求该学生的最后得分.
解:最高分 ,最低分 ,去掉后剩下 ,排序:,平均数为 .
众数为 .
例3:甲、乙两位选手的10个评委评分(略),去掉最低分和最高分后,甲得分为 ,乙得分为 ,乙获胜.若直接用原始平均数,甲可能高于乙?说明去掉极端值后排名可能改变,这种评分机制更公平.
【习题巩固】
1.
一组数据 的众数是( )
· A. 3 B. 5 C. 8 D. 10
1.
若一组数据的中位数是 ,则这组数据中( )
·
A. 至少有 的数据大于等于
·
B. 至少有 的数据小于等于
·
C. 恰好有 的数据大于等于
·
D. 恰好有 的数据小于等于
1.
某校高一年级8个班合唱比赛得分分别为 ,则这组数据的中位数与平均数的和是( )
· A. 182 B. 183 C. 184 D. 185
1.
某次体检,6位同学的身高(单位:米)为 ,则这组数据的中位数是______.
1.
(选做)某校为了解高一年级学生的数学成绩,抽取了50名学生,成绩的频率分布直方图(文字描述:组距,第一组频率,第二组频率,第三组频率,第四组频率,第五组频率,第六组频率,第七组频率.估计该年级学生数学成绩的平均数、中位数和众数.
【参考答案】
自查自纠:1.× 2.√ 3.× 4.√ 5.√
习题巩固:
1. C
1. A、B(由中位数定义,至少一半数据不小于中位数,也至少一半不大于中位数)
1.
C(排序:,中位数 ,平均数 ,和为 )
1.
排序:,中位数 米
1. 解:
·
平均数:组中值分别为 ,加权平均:
·
分.
·
中位数:累计频率 ,,,在第4组 内达到 .前3组频率和 ,需增加 ,组内频率 ,比例 ,组距 ,中位数 分.
·
众数:最高矩形是第五组 ,组中值 分.
学科网(北京)股份有限公司
$