内容正文:
第九章 统计(知识归纳+题型突破)
(1)理解简单随机抽样的概念,掌握抽签法、随机数法的一般步骤.
(2)理解分层随机抽样的概念,学会用分层抽样的方法从总体中抽取样本.
(3)区分简单随机抽样与分层随机抽样,并会选择适当方法进行抽样.
(4)掌握分层随机抽样在实际生活中的应用.
(5)能用样本估计总体的集中趋势参数(平均数、中位数、众数),理解集中趋势参数的统计含义,能用样本估计总体的离散程度参数(标准差、方差、极差),理解离散程度参数的统计含义.
(6)能用样本估计总体的取值规律.
(7)能用样本估计百分位数,理解百分位数的统计含义.
1.简单随机抽样
(1)定义:一般地,设一个总体含有N(N为正整数)个个体,从中逐个不放回地抽取n()个个体作为样本,如果每次抽取时各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样方法有两种:随机数法和抽签法.
2.分层抽样
(1)定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.
(2)应用范围:总体是由差异明显的几个部分组成的.
(3)分层抽样的关键是根据样本特征的差异进行分层,实质是等比例抽样,抽样比 .
3.频率分布表与频率分布直方图
频率分布表与频率分布直方图的绘制步骤如下:
(1)求极差,即求一组数据中最大值与最小值的差;
(2)决定组距与组数;
(3)将数据分组;
(4)列频率分布表,落在各小组内的数据的个数叫做频数,每小组的频数与样本容量的比值叫做这一小组的频率,计算各小组的频率,列出频率分布表;
(5)画频率分布直方图,依据频率分布表画出频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即每个小长方形的面积.
各个小长方形面积的总和等于1.
4.用样本的数字特征估计总体的数字特征
数字特征
样本数据
频率分布直方图
众数
出现次数最多的数据
取最高的小长方形底边中点的横坐标
中位数
将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)
把频率分布直方图划分为左右两个面积相等的部分,分界线与x轴交点的横坐标
平均数
样本数据的算术平均数
每个小长方形的面积乘小长方形底边中点的横坐标之和
方差和标准差反映了数据波动程度的大小.
方差:;
标准差:.
5.百分位数
(1)把100个样本数据按从小到大排序,得到第p个和第p+1个数据分别为.可以发现,区间内的任意一个数,都能把样本数据分成符合要求的两部分.一般地,我们取这两个数的平均数,并称此数为这组数据的第p百分位数,或p%分位数.
(2)一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有的数据大于或等于这个值.
(3)四分位数
常用的分位数有第25百分位数,第50百分位数(即中位数),第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数等,第75百分位数也称为第三四分位数或上四分位数等.
题型一:随机数表法
例题1.(2023下·江西景德镇·高一景德镇一中校考期中)现要用随机数表法从总体容量为240(编号为001到240)的研究对象中挑选出50个样本,则在下列数表中按从左至右的方式抽取到的第四个对象的编号为( )
32451 74491 14562 16510 02456 89640 56816 55464 41630 85621 05214 84513 12541 02145
A.5 B.44 C.165 D.210
例题2.(2023·全国·高三专题练习)某班对八校联考成绩进行分析,利用随机数表法抽取样本时,先将60个同学按01,02,03,…,60进行编号,然后从随机数表第9行第5列的数开始向右读,则选出的第6个个体是( )
(注:下表为随机数表的第8行和第9行)
第8行
第9行
A.07 B.25 C.42 D.52
例题3.(2023下·辽宁沈阳·高一校联考期末)福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为 .
49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 64
57 24 55 06 88