内容正文:
考点17 特征数及抽样方法
知识理解
1. 三种抽样方法
(一)简单随机抽样
1.概念:一般地,从元素个数为N的总体中逐个不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.
2.最常用的简单随机抽样的方法:抽签法和随机数法(重点掌握随机数表法的读数)
3.适用范围是:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小.
(二)系统抽样
1.概念及步骤:假设要从容量为N的总体中抽取容量为n的样本,
第一步,先将总体的N个个体编号;
第二步,确定分隔间距,对编号进行分段,当(n是样本容量)是整数时,取k=;当(n是样本容量)不是整数时,先用简单随机抽样剔除-[]个个体,取k=[];
第三步,在第1段用简单随机抽样确定第一个个体编号l (l≤k);
第四步,按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号,再加k得到第3个个体编号,依次进行下去,直到获取整个样本.
2. 系统抽样的适用范围是:元素个数很多且均衡的总体;各个个体被抽到的机会均等.
3. 特征:等间隔抽样,每组抽一个号码,号码数符合等差数列的通项公式
三.分层抽样
1.概念:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样,将总体中各个个体按某种特征分成若干个互不交叉的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.
2.应用范围是:总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.
3.特征:等比例抽样
二.频率分布直方图(表)
1.频率分布直方图基础概念
①纵轴表示,
②频率:数据落在各小组内的频率用各长长方形的面积表示
③各小长方形的面积总和等于1.
④分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑的曲线,统计中称之为总体密度曲线,它能够更加精细的反映出总体的分布规律.
2.频率分布直方图的步骤如下
(ⅰ)求极差;(ⅱ)确定组距和组数;(ⅲ)将数据分组;(ⅳ)列频率分布表;
(ⅴ)画频率分布直方图.频率分布直方图能很容易地表示大量数据,非常直观地表明分布的形状.
三.茎叶图
1.概念:当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.
当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).
2.两个突出的优点:其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.
四.样本的数字特征
特征数
具体数字算法
频率分布直方图(表)
众数
次数出现最多的数字
频率最大或最高组的中间值
中位数
样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数
频率等于0.5时的横坐标
平均数
所有数字之和除以总个数
每个小矩形面积乘以小矩形底边中点的横坐标之和
方差
s2=[(x1-)2+(x2-)2+…+(xn-)2].
平均数反映了数据取值的平均水平,标准差、方差描述了一组数据波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定
考向一 抽样方法考向分析
【例1】(1)(2020·全国高三专题练习)福利彩票“双色球”中红球的号码可以从,,,…,,这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的个号码,选取方法是从第行第列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )
A. B. C. D.
(2)(2020·全国高三专题练习)某校高一、高二、高三共有2800名学生,为了解暑假学生在家的每天学习情况,计划用分层抽样的方法抽取一个容量为56人的样本,已知从高二学生中抽取的人数为19人,则该校高二学生人数为( )
A.900 B.950 C.1000 D.1050
(3)(2020·云南省保山第九中学高三月考)某一考场有64个试室,试室编号为001﹣064,现根据试室号,采用系统抽样法,抽取8个试室进行监控抽查,已抽看了005,021试室号,则下列可能被抽到的试室号是( )
A.029,051 B.036,052 C.037,053 D.045,054
(4)(2020·全国高三专题练习)某中学有学生300人,其