内容正文:
14.4.1
用样本估计总体集中趋势参数
第十四章
统计
(第2课时)
众数和中位数
学 习 目 标
1
2
3
准确理解众数、中位数的定义,掌握原始数据中众数和中位数的计算方法;
能系统对比平均数、众数、中位数的核心特点与适用范围,明确极端值对三个统计量的不同影响;
通过对比三个集中趋势参数的异同,培养归纳概括能力,深化用样本特征估计总体特征的统计思想.
新课导入
上节课我们学习了用平均数刻画数据的集中趋势,平均数的特点是什么?
平均数会利用所有数据,但易受极端值影响.
4 号牙膏卖了 547 支,远高于其他品牌,平均数被拉高,按平均数进货会导致其他品牌滞销.
超市更关心什么信息?
今天我们学习另外两个刻画集中趋势的统计量 —— 众数和中位数,它们能解决平均数不适用的问题.
某超市 5 种牙膏的销售量分别为 65、70、280、547、102 支,能按平均销售量 212.8 支进货吗?为什么?
探究一:众数
新知探究
某超市上个月出售的牙膏(品牌、销售量)的相关数据如表所示.对于这组数据,超市更关心怎样的信息?
牙膏品牌编号 销售量
1 65
2 70
3 280
4 547
5 102
如果分别列出每支卖出的牙膏的品牌编号,则出现次数最多的是“4”,也就是说 4 号牙膏最受消费者欢迎.所以下次进货时就要多进 4 号牙膏.
新知探究
在这里,5 种品牌的牙膏的平均销售量对经营决策已经没有实际意义了.
一般地,我们将一组数据中出现次数最多的数据叫作该组数据的众数(mode).
众数是一种刻画数据集中趋势的度量值.
即时训练
1.某篮球兴趣小组名学生参加投篮比赛,每人投个,投中的个数分别为:、、、、、、,则这组数据的众数为( )
A. B. C. D.
【分析】找数据众出现次数组多的数字,利用众数的定义可求得结果.
【详解】这句数据中出现次数最多的为8,
因此,这组数据的众数为
故选:D.
D
探究二:中位数
新知探究
某篮球队 11 名队员的得分:
108,92,42,47,343,32,50,71,51,83,112,能用平均数或众数代表球队得分水平吗?
①平均数≈96.5,被极端值 343 拉高;
②所有数据互不相同,没有众数.
将一组数据从小到大排列
(1)若数据个数为奇数,正中间的数是中位数;
(2)若为偶数,正中间两个数的平均数是中位数.
新知探究
排序后为
32,42,47,50,51,71,83,92,108,112,343,中位数是 71。
注:中位数不受极端值影响,适合数据中有极端值的情况.
即时训练
2.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( )
A. B. C. D.
【分析】将数据从小到大重新排列(也可以是从大到小),计算出的值即可比较大小.
【详解】解:重新排列得:10,12,14,14,15,15,16,17,17,17.
则有:.
所以
D
知识小结
众数、中位数
①众数:出现次数最多的数据
②中位数:排序后中间的数(或平均数)
10
典例分析
例1
某校高一(2)班的6名学生的体重分别为47,49,52,57,60,71.
(1)用哪种统计量代表这6名学生的体重比较合适?
(2)这6个数据的中位数是多少?
【分析】根据数据中存在极端值的特点,排除易受极端值影响的平均数和无众数的情况,选择不受极端值影响的中位数作为代表.
解:(1)因为有“71”这一个“极端值”,所以不宜使用平均数.
又各个数据均不相同,因而这组数据没有众数.
由于极端值的大小对中位数的位置并没有影响
故用中位数作为这组数据的代表较为合适.
(2)这6个数据的中位数是 .
典例分析
例2
下面的说法是否恰当?为什么?
(1)5人中有4名学生,1名教师,其中3名学生16岁,1名学生18岁,1名教师59岁,用他们的平均年龄25岁作为他们年龄的代表值。
(2)某服装店生产一种男式运动衫,店里决定用顾客购买的这种运动衫尺码的平均数作为生产的标准尺码(即生产的这种运动衫中大多数为该尺码)。
(3)在一次满分为30分的小测试中,某小组的成绩是5个20分,3个26分,1个29分,采用中位数20作为这组数据的代表值。
【分析】根据平均数、中位数、众数的特点和适用场景,结合题目情境判断说法是否恰当,并说明理由.
典例分析
解:(1)不恰当.教师的年龄与学生的年龄差异太大,明显地拉高了平均数.
此时平均数没有代表性.
(2)不恰当.销售商品的型号应该以众数为最多进货或生产的标准
平均数无太大的参考价值.
(3)测试的分数分布很特殊,中位数即为最小数
用中位数来代表小组的水平不恰当.
典例分析
例3
根据图 ,估计这组数据的中位数和众数(精确到0.1).
【分析】根据频率分布直方图,先确定众数为最高矩形的中点,再通过累计频率找到中位数所在组,用公式估算出中位数。
解:根据中位数的定义,样本中有50%的个体小于或等于中位数
也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.
由于
典例分析
因此,中位数落在区间内.
在直方图中,无法知道每个组内的数据是如何分布的
我们通常假设它们在组内是均匀分布的,故若设中位数为
则 , 解得 .
由此估计这组数据的中位数约为72.8.
根据直方图发现,区间内的数据最多
所以可用这个区间的中点对应的横坐标(组中值)74.5作为这组数据的众数的估计值.
知识小结
三个统计量的对比与选择
统计量 极端值影响 利用数据程度 核心特点 适用场景
平均数 影响大 利用所有数据 平均水平 数据分布均匀、无极端值
中位数 无影响 利用中间位置数据 中等水平 数据中有极端值
众数 无影响 利用出现次数最多的数据 多数水平 商业决策、分类数据
16
巩固提升
巩固提升
题型1 求中位数和众数
1.对于数据3,3,2,3,6,3,10,3,6,3,2,下列说法正确的是( )
A.这组数据的众数是3
B.这组数据的众数与中位数的数值相等
C.这组数据
【分析】根据众数、中位数、平均数的定义求解即可.
【详解】解:从小到大排列数据为:
2,2,3,3,3,3,3,3,6,6,10;
所以众数为3,中位数为3,
平均数为:.
故选:AB.
AB
巩固提升
题型1 求中位数和众数
2.在“美丽乡村”评选活动中,某乡镇个村的得分如下:,这组数据的中位数和众数分别是( )
A. B. C. D.
【分析】把个数由小到大重新排序,即可得到中位数为,众数为.
【详解】某乡镇个村的得分:
由小到大排序为:
所以中位数为,众数为.
故选:D.
D
巩固提升
题型2 利用平均数、中位数解决问题
3.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有( )
A. B. C. D.
【分析】将数据从小到大重新排列(也可以是从大到小),计算出的值即可比较大小.
【详解】解:重新排列得:10,12,14,14,15,15,16,17,17,17.
所以
D
则有:
.
巩固提升
题型2 利用平均数、中位数解决问题
4.为庆祝中国共产主义青年团成立100周年,某班级准备利用暑假进行“请党放心,强国有我”为主题的研学旅行.为了便于识别,该班级准备定做一批容量一致的双肩包.为此,班级负责人征求班内同学的意向,得到如下数据:为了照顾到绝大多数人的需求,则应该定做双肩包的容量为______.
容量
频数
【分析】根据表中数据直接求解即可.
【详解】解:由题知,容量为29的双肩包的频数为26,大于其他容量的频数,
所以,为了照顾到绝大多数人的需求,则应该定做双肩包的容量为29.
29
课堂总结
一起来看看这节课我们学到了些什么?
点击图标,进入本节课的课堂总结
要点回顾
感谢聆听!
高中数学 · 苏教版
众数与中位数
知识点回顾
易错点警示
解题技巧
知识点回顾
1. 众数 (Mode)
一组数据中出现次数 最多 的数。众数不一定唯一,也可能不存在。
在频率分布直方图中,众数是 最高矩形 底边中点的横坐标。
2. 中位数 (Median)
将一组数据按 大小顺序 排列后,处在最中间位置的一个数(或最中间两个数的平均数)。
计算规则:设数据个数为 n
若 n 为奇数,中位数为第 n + 12 个数。
若 n 为偶数,中位数为第 n2 个与第 n2 + 1 个数的 算术平均数。
3. 频率分布直方图中的中位数
中位数左边和右边的直方图 面积相等(均为 0.5)。
易错点警示
排序遗忘: 求中位数前必须先进行 排序,这是最容易忽略的步骤。
众数不唯一: 一组数据中可能存在多个众数,不能想当然认为只有一个。
直方图估算误差: 在频率分布直方图中求得的众数、中位数是 估计值,与原始数据的真实值可能存在偏差。
中位数位置: 注意区分“第几个位置”和“该位置上的数值”。
解题技巧
1. 频率分布直方图求中位数步骤
① 确定中位数所在的 小矩形(累积频率跨越 0.5 的区间)。
② 利用面积比例公式计算:
中位数 = L + 0.5 - Ff × d
其中 L 为下限,F 为前一小组累积频率,f 为该组频率,d 为组距。
2. 统计量的选择
当数据中出现 极端值 时,中位数比平均数更能客观反映数据的集中趋势。
$