内容正文:
数学 必修·第二册[RJB]
5.1.4 用样本估计总体
(教师独具内容)
课程标准:1.结合实例,能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义.2.结合实例,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.3.结合实例,能用样本估计总体的取值规律.4.结合实例,能用样本估计百分位数,理解百分位数的统计含义.5.结合具体实例,掌握分层抽样的样本均值和样本方差.
教学重点:1.用样本的数字特征估计总体的数字特征.2.用样本的分布估计总体的分布.
教学难点:利用样本估计总体的方法解决实际问题.
核心素养:通过用样本估计总体提升数据分析素养、数学运算素养和逻辑推理素养.
知识点一 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征.
知识点二 分层抽样的平均数和方差
已知由两层构成的样本中,假设第一层有m个数,分别为x1,x2,…,xm,平均数为,方差为s2;第二层有n个数,分别为y1,y2,…,yn,平均数为,方差为t2.则
=xi,s2= (xi-)2,
=yi,t2= (yi-)2.
如果记样本均值为,样本方差为b2,则
==,
b2=
=.
知识点三 用样本的分布来估计总体的分布
如果样本的容量恰当,抽样方法又合理的话,样本的分布与总体分布会差不多.如果容许有一定误差,则可以用样本的分布去估计总体的分布.
1.中位数不受几个极端数据(即排序靠前或靠后的数据)的影响,容易计算.它仅利用了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据时,应该用抗极端性很强的中位数表示数据的中心值.
2.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息.
3.平均数与标准差在估计总体时的差异
(1)平均数提供了样本数据的重要信息,但是平均数有时也会使人对总体作出片面的判断,样本中的最大值和最小值对平均数的影响较大,所以平均数有时难以概括样本数据的实际状态.
(2)当两组或多组样本的平均数相等或相差无几的时候,就要用样本数据的离散程度来估计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.
(3)标准差反映了各个样本数据聚集于样本平均数周围的程度.标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,表明各个样本数据在样本平均数的周围越分散.
4.茎叶图不仅能够保留原始数据,而且能够展示数据的分布情况.当样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但当样本数据较多时,茎叶图就显得不太方便.因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.
5.频率分布直方图直观、形象地反映了样本的分布规律.但是从频率分布直方图中得不出原始的数据内容.把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.
6.随着样本容量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
1.判一判(正确的打“√”,错误的打“×”)
(1)一组样本数据的众数可能不止一个,而中位数是唯一的.( )
(2)由样本的频率分布直方图,不能估计总体的众数、中位数和平均数.( )
(3)当样本数据较多时,用茎叶图表示样本数据较好.( )
答案 (1)√ (2)× (3)×
2.做一做
(1)我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( )
A.134石 B.169石
C.338石 D.1365石
(2)某医院急救中心随机抽取20位病人等待急诊的时间记录如下表:
等待时间(分钟)
[0,5)
[5,10)
[10,15)
[15,20)
[20,25]
频数
4
8
5
2
1
用上述分组资料计算出病人平均等待时间的估计值=________.
(3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中每周自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,则这200名学生中每周的自习时间不少于22.5小时的人数是________.
答案 (1)B (2)9