内容正文:
9.1 随机抽样
一、全面调查和抽样调查
调查方式
全面调查
抽样调查
定义
对每一个调查对象都进行调查的方法,称为全面调查,又称普查
根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法
相关概念
总体:在一个调查中,把调查对象的全体称为总体
个体:组成总体的每一个调查对象称为个体
样本:把从总体中抽取的那部分个体称为样本,
样本量:样本中包含的个体数称为样本量
注意点:
(1)全面调查的优点是精确,缺点是不宜操作,需要耗费巨大的人力、物力.
(2)抽样调查的优点是花费少,效率高,易操作,缺点是不够精确.
一般地,如果调查的对象比较少,容易调查,适合普查,如果调查的对象较多或者具有破坏性,适合于抽样调查.
二、简单随机抽样
1. 放回简单随机抽样、不放回简单随机抽样
一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n<N)个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,把这样的抽样方法叫做放回简单随机抽样;
如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,把这样的抽样方法叫做不放回简单随机抽样。
2. 简单随机抽样:放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本
三、简单随机抽样的方法
1.抽签法具体的操作步骤:
(1)确定总体容量N并编号;
(2)制签并放入不透明容器中;
(3)充分搅拌均匀;
(4)不放回地逐个抽取n次,得到容量为n的样本.
2.随机数法:把总体的N个个体依次编号,例如按0,1,2,…,N-1编号,然后利用随机数工具产生0~N-1 范围内的整数随机数,产生的随机数是几就是选几号个体,直到抽足样本所需的数量.
注意点:(1)当总体个数较少时采用抽签法;
(2)产生随机数的方式有多种:①用随机试验生成随机数;②用信息技术生成随机数:(ⅰ)用计算器生成随机数,(ⅱ)用电子表格软件生成随机数,(ⅲ)用R统计软件生成随机数.
(3)如果生成的随机数有重复,可以剔除重复的编号并重新产生随机数,直到产生的不同编号个数等于样本所需要的数量.
反思感悟 (1)一个抽样试验能否用抽签法,关键看两点:一是制签是否方便;二是个体之间差异不明显.一般地,当样本容量和总体容量较小时,可用抽签法.
(2)当总体容量较大、样本容量不大时,用随机数法抽取样本较好.
四、用样本的平均数估计总体的平均数
一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,YN,则称==i为总体均值,又称总体平均数.如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,yn,则称==i为样本均值,又称样本平均数.我们常用样本平均数去估计总体平均数.
样本均值与总体均值的关系
(1)在简单随机抽样中,我们常用样本均值去估计总体均值;
(2)总体均值是一个确定的数,样本均值具有随机性;
(3)一般情况下,样本容量越大,估计值越准确.
五、分层随机抽样的定义
分层随机抽样:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.
反思感悟 使用分层随机抽样的前提
分层随机抽样的使用前提条件是总体可以分层、层与层之间有明显区别,而层内个体间差异较小.
六、分层随机抽样的应用
在分层随机抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体容量之比.
七、用分层随机抽样样本的平均数估计总体的平均数
如果总体分为2层,两层包含的个体数分别为M,N,两层抽取的样本量分别为m,n,两层的样本平均数分别为,,两层的总体平均数分别为,,总体平均数为,样本平均数为,则=+,=+.
求总体平均数的方法有
(1)+;
(2)+;
(3)+.
八、获取数据的基本途径
获取数据的基本途径
获取数据的基本途径
适用类型
注意问题
通过调查获取数据
对于有限总体问题,一般通过抽样调查或普查的方法获取数据
要充分有效地利用背景信息选择或创建更好的抽样方法,并有效避免抽样过程中的人为错误
通过试验获取数据
没有现存的数据可以查询
严格控制试验环境,通过精心的设计安排试验,以提高数据质量
通过观察获取数据
自然现象
借助专业测量设备通过长久的持续观察获取数据
通过查询获得数据
众多专家研究过,其收集的数据有所存储
必须根据问题背景知识“