内容正文:
江苏省丹阳高级中学2022-2023高二数学教(学)案 必修第二册第十四章 统计(第5课时)
第5课时 用样本估计总体的集中趋势参数
【教学目标】
1. 结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数).
2. 理解集中趋势参数的统计含义.
【教学过程】
活动一、理解平均数的概念
某校高一(1)班同学在老师的布置下,用单摆进行测试,以检验重力加速度.全班同学两人一组,在相同条件下进行测试,得到下列实验数据(单位:m/s2):
9.62 9.54 9.78 9.94 10.01 9.66 9.88 9.68 10.32 9.76 9.45 9.99 9.81 9.56 9.78 9.72 9.93 9.94 9.65 9.79 9.42 9.68 9.70 9.84 9.90
怎样利用这些数据对重力加速度进行估计?
我们常用算术平均数i[其中ai(i=1,2,…,n)为n个实验数据]作为重力加速度的“最理想”的近似值,它的依据是什么呢?
处理实验数据的原则是使近似值与实验数据越接近越好.设这个近似值为x,它与n个实验数据ai(i=1,2,…,n)的离差分别为x-a1,x-a2,x-a3,…,x-an.由于上述离差有正有负,故不宜直接相加.可以考虑离差的平方和,即(x-a1)2+(x-a2)2+…+(x-an)2.因为(x-a1)2+(x-a2)2+…+(x-an)2=nx2-2(a1+a2+…+an)x+a+a+…+a,所以当x=时,离差的平方和最小,故可用作为表示这个量的理想近似值,称为这n个数据a1,a2,…,an的平均数或均值,一般记为
=.
这样,我们可以用计算器求得,由高一(1)班学生的实验数据估计的重力加速度的最佳近似值为9.774m/s2.
关于平均数有如下结论:
(1) 若a1,a2,…,an的平均数为,则ba1+a,ba2+a,…,ban+a的平均数为________;
(2) 在n个数据中有k1个a1,k2个a2,…,km个am,
则这n个数的平均数为____________________(其中k1+…+km=n);
(3) 在一组数据中,a1的频率是p1,a2的频率为p2,…,an的频率为pn,则这组数据的平均数为____________________________.
反思与感悟
1. 求52,49,48,54,47,48,55,52 的平均数.
2. 某公司有3名经理,14名科技人员,23名工人,经理工资为4 800元,科技人员3 400元,工人 1 600元,求该公司的平均工资.
活动二、掌握平均数的应用
例1下面是某校学生日睡眠时间(单位:h)的抽样频率分布表.
睡眠时间
人数
频率
[6.0,6.5)
5
0.05
[6.5,7.0)
17
[7.0,7.5)
[7.5,8.0)
0.37
[8.0,8.5)
6
[8.5,9.0]
2
合计
1
(1) 完成表格;
(2) 用两种方法估计该校学生的日平均睡眠时间.
反思与感悟
1. 若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,
则其平均数为x1p1+x2p2+…+xnpn.
2. 若每组数据在一个范围内,则x1,x2,…,xn的值近似地取各组区间中点的数值(称为“组中值”).
某单位年收入(单位:元)在10 000~15 000,15 000~20 000,20 000~25 000,25 000~30 000,30 000~35 000,35 000~40 000及40 000~50 000之间的职工所占的百分比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.
活动三、理解众数与中位数的概念
一般地,我们将一组数据中出现次数最多的那个数据叫作该组数据的众数.将一组数据按照从小到大的顺序排成一列,如果数据的个数为奇数,那么排在正中间的数据就是这组数据的中位数;如果数据的个数是偶数,那么排在正中间的两个数据的平均数即为这组数据的中位数.
思考►►►平均数、众数、中位数这三个量都是反映一组数据的什么趋势?
平均数、众数、中位数这三种估计总体集中趋势参数的优缺点:
名称
优 点
缺 点
平均数
代表性较好,是反映数据集中趋势的量.一般情况下,可以反映出更多的关于样本数据全体的信息
受少数极端值的影响较大,使其在估计总体时的可靠性降低.任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
众数
①体现了样本数据的最大集中点;
②容易计算
①它只能表达样本数据中很少的一部分信息;
②无法客观地反映总体的特征
中位数
①不受少数几个极端数据(即排序靠前或