内容正文:
专题11 灵活运用两种抽样
【考点预测】
1.统计的相关概念
(1)普查
像人口普查这样,对每一个调查对象都进行调查的方法,称为全面调查,又称普查.
(2)总体、个体
在一个调查中,我们把调查对象的全体称为总体.组成总体的每一个调查对象称为个体.为了强调调查目的,也可以把调查对象的某些指标的全体作为总体,每一个调查对象的相应指标作为个体.
(3)抽样调查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为抽样调查.
(4)样本、样本量
我们把从总体中抽取的那部分个体称为样本,样本中包含的个体数称为样本量.
2.简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.除非特殊声明,本章所称的简单随机抽样指不放回简单随机抽样.
3.简单随机抽样的方法
(1)抽签法:
把总体中的N个个体编号,把编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,将这些小纸片放在一个不透明的盒里,充分搅拌,最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需的个数.
(2)随机数法:
用随机数工具产生编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本.重复上述过程,直到抽足样本所需的个数.
①用随机试验生成随机数;
②用信息技术生成随机数;
③用计算器生成随机数;
④用电子表格软件生成随机数;
⑤用R统计软件生成随机数.
4.总体均值
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称 为总体均值,又称总体平均数.
如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体均值还可以写成加权平均数的形式
5.样本均值
如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称 为样本均值,又称样本平均数.
探究:总体均值与样本均值有何区别与联系?
答案:(1)区别:当总体中个体较多时,总体均值不易计算,样本均值比较方便计算.总体均值是一个确定的数,样本均值具有随机性.
(2)联系:在简单随机抽样中,我们常用样本均值估计总体均值.
6.分层抽样定义
一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.
7.分层抽样适用范围
当总体是由差异明显的几个部分组成时,往往采用分层抽样.
8.分层抽样的步骤
(1)根据已掌握的信息,将总体分成若干部分.
(2)根据总体中的个体数N和样本容量n计算出抽样比k=.
(3)根据抽样比k计算出各层中应抽取的个体数:·Ni (其中Ni为第i层所包含的个体总数).
(4)按步骤3所确定的数在各层中随机抽取个体,并合在一起得到容量为n的样本.
9. 两种抽样方法的区别和联系
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中各个个体被抽到的机会相等,且都是不放回抽取
从总体中逐个抽取
最基本的抽样方法
总体容量较少
分层抽样
抽样过程中各个个体被抽到的机会相等,且都是不放回抽取
将总体分成几部分,每一部分按比例抽取
每层抽样时采用简单随机抽样
总体由差异明显的若干部分组成
10.获取数据的途径
统计学是通过收集数据和分析数据来认识未知现象的,因此如何收集数据,像统计报表和年鉴、社会调查、普查和抽样、互联网、试验设计等等都是常见的.
(1)通过调查获取数据
适用范围:对于有限总体问题,一般通过抽样调查或普查的方法获取数据.
注意事项:充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误.
(2)通过试验获取数据.
适用范围:没有现存的数据可以查询,就需要通过对比试验的方法去获取样本观测数据.
注意事项:严格控制试验环境,通过精心的设计安排试验,以提高数据质量,为获得好的分析结果奠定基础.
(3)通过观察获取数据.
适用范围:自然现象.
注意事项:需要专业测量设备获取观测数据.
(4)通过查询获得数据.
适用范围:二手数据.
注意事项:数据来历和渠道多样,所以质量会参差不齐,必须根据问题背景知识“清洗”数据,去伪存真.
【典型例题】
例1.(2022·全国·高一单元测试)某学校在校学生有2000人,为了增强学生的体质,学校举行了