内容正文:
专题11 统计的综合应用
【知识梳理】
知识点1.简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
知识点2.简单随机抽样的方法
(1)抽签法:
把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数.
(2)随机数法:
用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
①用随机试验生成随机数;
②用信息技术生成随机数;
③用计算器生成随机数;
④用电子表格软件生成随机数;
⑤用R统计软件生成随机数.
知识点3.总体均值
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称 为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
知识点4.分层抽样定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.
知识点5.分层抽样的步骤
(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比k=.
(3)根据抽样比k计算出各层中应抽取的个体数:·Ni (其中Ni为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
知识点6.频率分布直方图绘制步骤
①求极差,即一组数据中的最大值与最小值的差.
②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.
③将数据分组.
④列频率分布表.计算各小组的频率,第i组的频率是.
⑤画频率分布直方图.其中横轴表示分组,纵轴表示.实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.
知识点7. 频率分布直方图意义:各个小长方形的面积表示相应各组的频率,频率分布直方图以面积的形式反映数据落在各个小组的频率的大小,各小长方形的面积的总和等于1.
知识点8.常见的其他统计图:条形图、扇形图、折线图.
扇形图主要用于直观描述各类数据占总数的比例;
条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率;
折线图主要用于描述数据随时间的变化趋势.
知识点9.第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
知识点10.计算第p百分位数的步骤
第1步,按从小到大排列原始数据.
第2步,计算i =n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.
知识点11.众数、中位数、平均数定义
(1)众数:一组数据中重复出现次数最多的数.
(2)中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.
(3)平均数:如果n个数x1,x2,…,xn,那么=(x1+x2+…+xn)叫做这n个数的平均数.
知识点12.频率分布直方图中的众数、中位数、平均数
①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
知识点13.方差、标准差的定义
一组数据x1,x2,…,xn,用表示这组数据的平均数,则这组数据的方差为(xi-)2=-2,标准差为.
知识点14.总体方差、总体标准差的定义
如果总体中所有个体的变量值分别为Y1,Y2,…,YN,总体平均数为,则称S2=(Yi-)2
为总体方差,S=为总体标准差.如果总体的N个变量值中,不同的值共有k(k≤N)个,记为Y1,Y2,…,Yk,其中Yi出现的频数为fi(i=1,2,…,k),则总体方差为S2=