内容正文:
统计(公式、定理、结论图表)
1.全面调查和抽样调查
调查方式
全面调查(普查)
抽样调查
定义
对每一个调查对象都进行调查的方法,称为全面调查,又称普查
根据一定目的,从总体中①抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查
相关概念
总体:在一个调查中,我们把调查对象的全体称为总体.
个体:组成总体的每一个调查对象称为个体
样本:把从总体中抽取的那部分个体称为样本.
样本量:样本中包含的个体数称为样本量
2.简单随机抽样的概念
放回简单随机抽样
不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中②逐个抽取n(1≤n<N)个个体作为样本
如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都③相等,我们把这样的抽样方法叫做放回简单随机抽样
如果抽取是不放回的,且每次抽取时总体内④未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样
放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本
3.抽签法
先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个⑤不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.
4.随机数法
(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.
(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.
5.总体均值和样本均值
(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称 =⑥=⑦为总体均值,又称总体平均数.
(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式=⑧.
(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称 =⑨=⑩为样本均值,又称样本平均数.
6.分层随机抽样的相关概念
(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行①简单随机抽样,再把所有子总体中抽取的样本②合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.
(2)比例分配:在分层随机抽样中,如果每层③样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
7.画频率分布直方图的步骤
(1)求极差:极差为一组数据中①最大值与②最小值的差;
(2)决定组距与组数:当样本容量不超过100时,常分成③5~12组,为方便起见,一般取等长组距,并且组距应力求“取整”;
(3)将数据分组;
(4)列频率分布表:一般分四列:分组、④频数累计、频数、⑤频率.其中频数合计应是样本容量,频率合计是⑥1;
(5)画频率分布直方图:横轴表示分组,纵轴表示⑦.
小长方形的面积=组距×⑧=⑨频率,各小长方形的面积的总和等于1.
8.其他统计图表
统计图表
主要应用
扇形图
直观描述各部分数据在全部数据中所占的比例
条形图和直方图
直观描述不同类别或分组数据的频数和频率
折线图
反映统计对象在不同时间(或其他合适情形)的发展变化情况
9.第p百分位数
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有①p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.
10.计算一组n个数据的第p百分位数的步骤
第1步,按②从小到大排列原始数据.
第2步,计算i=③n×p%.
第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的④平均数.
11.四分位数
⑤第25百分位数,⑥第50百分位数,⑦第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.
12.众数、中位数和平均数的定义
(1)众数:一组数据中①出现次数最多的数.
(2)中位数:一组数据按大小顺序排列后,处于②中间位置的数.如果这组数据是偶数个,则取③中间两个数据的平均数.
(3)平均数:一组数据的④和除以数据个数所得到的数.
13.众数、中位数、平均数与频率分布直方图的关系
(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的⑤横坐标与小矩形