内容正文:
专题23:用样本估计总体(7知识点+5题型)
用样本估计总体
题型五:条形图、折线图、扇形图、总体密度曲线
频率分布直方图求极差、方差和标准差
样本的集中趋势(众数、平均数、中位数)
百分位数
条形图、折线图、扇形图、总体密度曲线
频率分布直方图
题型一:样本的平均数、中位数、众数的求法
题型二:百分位数的求法
题型三:样本中极差、方差和标准差的求法
题型四:频率分布直方图求平均数、中位数、众数、极差、方差和标准差
总体离散程度的估计(极差、方差、标准差)
频率分布直方图求平均数、中位数和众数
知识点一:频率分布直方图
1、频率分布直方图
(1)列出样本数据的频率分布表和频率分布直方图的步骤:
①计算极差:找出数据的最大值与最小值,计算它们的差;
②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;
③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.
④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.
⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.
(2)频率分布直方图的特点:
①,
②个小长方形的面积等于1,
③.
知识点二:条形图、折线图、扇形图、总体密度曲线
(1) 条形图
①特点:一般地,条形图中,一条轴上显示的是所关注的数据类型,另一条轴上对应的是数量、个数或者比例,条形图中每一长方形都是等宽的.
②作用及选用情景;能清楚地表示每个项目的具体数量,便于相互比较大小.
(2) 折线图
①特点:用一个单位长度表示一定的数量,用折线的起伏表示数量的增减变化.
②作用及选用情景:能清楚地看出数量增减变化的情况及各部分数量的多少.常用来表示随时间变化的数据,当然,也可以用在其他合适的情形中.
(3) 扇形图
①特点:用整个圆表示总体,扇形图中,每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成正比.
②作用及选用情景:可以形象地表示出各部分数据在全部数据中所占的比例情况.
(4) 总体密度曲线:
①特点:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,
频率分布直方图可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.
知识点三:百分位数
1.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
2.计算一组n个数据的第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i=n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知识点四:样本的集中趋势
(1)用样本的平均数估计总体平均数
①众数:在样本数据中,出现次数最多的那个数据;
②中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,若样本数据个数为偶数,则取中间两个数据的平均数作为中位数.
④平均数:设样本的数据为,则样本的算术平均数为;
⑤众数、中位数和平均数的比较
名称
优点
缺点
平均数
与中位数相比,平均数反映出样本数据中更多的信息,对样本中的极端值更加敏感
任何一个数据的改变都会引起平均数的改变.数据越“离群”,对平均数的影响越大
中位数
不受少数几个极端数据(即排序靠前或靠后的数据)的影响
对极端值不敏感
众数
体现了样本数据的最大集中点
众数只能传递数据中的信息的很少一部分,对极端值不敏感
(2)平均数相关结论:
①如果两组数和的平均数分别是和,则一组数的平均数是;
②如果一组数的平均数为,则一组数的平均数为.
③如果一组数的平均数为,则一组数的平均数为
知识点五:频率分布直方图求平均数、中位数和众数
(1)根据频率分布直方图求平均数、中位数和众数
①平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.
②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(也就是50%百分位数)
③众数:众数是最高小矩形底边的中点所对应的数据.
知识点六:总体离散程度的估计(极差、方差、标准差)
(1)数据的离散程度可以用极差、方差或标准差来描述;
①极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;
②样本方差描述了一组数据围绕平均数波动的大小;
一般地,设样本的数据为,样本的平均数为,定义样本方差为;
简化公式:=(方差等于原数据平方的平均数减去平均数的平方)
③样本的标准差是