内容正文:
《第 13 章 统计》【13.5 统计估计】
【附录】相关考点
考点一
总体分布
密度曲线
总体分布密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.;
考点二
样本的
平均数,
中位数,
众数,
方差,
标准差;
已知样本:;
样本的平均数:
样本的中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组样本数据的中位数;
样本的众数:在一组数据中,出现次数最多的数据叫做这组样本数据的众数;
样本的方差:会用样本方差
去估计总体方差及总体标准差;
样本的标准差:
;
考点三
百分位数
1、第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2、计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,则将i向上取整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数;
【注意】由百分位数定义,显然可得:中位数是第50百分位数,而中位数和第25百分位数、第75百分位数将一组数据分成了四个部分, 故又均称为四分位数;
3.用样本估计总体时,如果抽样的方法比较合理,那么样本可以反映总体的信息,但从样本得到的信息会有偏差。在随机抽样中,这种偏差是不可避免的。
虽然我们用样本数据得到的分布、均值和标准差并不是总体的真正的分布、均值和标准差,而只是一个估计,但这种估计是合理的,特别是当样本量很大时,它们确实反映了总体的信息。
4.(1)如果把一组数据中的每一个数据都加上或减去同一个共同的常数,标准差不变
(2)如果把一组数据中的每一个数据乘以一个共同的常数k,标准差变为原来的k倍
(3)一组数据中的最大值和最小值对标准差的影响,区间的应用;
“去掉一个最高分,去掉一个最低分”中的科学道理
总体分布的估计:用样本估计总体,是研究统计问题的一个基本思想方法,一般地,样本容量越大,
这种估计就越精确,要求能画出频率分布表和频率分布直方图;⑴学会用样本平均数
去估计总体平均数;⑵会用样本方差