内容正文:
专题13 统计
(一)抽样
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.
(2)常用方法:抽签法和随机数法.
(3)随机数法步骤:
①将总体中的个体编号.
②在随机数表中任选一个数作为开始.
③规定一个方向作为从选定的数读取数字的方向.
④开始读取数字,若不在编号中,则跳过,若在编号中则取出,依次取下去,直到取满为止(相同的号只计一次).
⑤根据选定的号码抽取样本.
2.分层抽样
(1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)分层抽样的应用范围
当总体是由差异明显的几个部分组成时,往往选用分层抽样.
(二)统计图表
1.频率分布直方图
(1)纵轴表示,即小长方形的高=;
(2)小长方形的面积=组距×=频率;
(3)各个小方形的面积总和等于1.
2.频率分布表的画法
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
3.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
4.茎叶图
茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数.
①“叶”位置只有一个数字,而“茎”位置的数字位数一般不需要统一;
②茎叶图上重复出现的数据要重复记录,不能遗漏.
5.条形图:建立直角坐标系,用横轴(横轴上的数字)表示样本数据类型,用纵轴上的单位长度表示一定的数量,根据每个样本(或某个范围内的样本)的数量多少画出长短不同的等宽矩形,然后把这些矩形按照一定的顺序排列起来,这样一种表达和分析数据的统计图称为条形图.
6.折线图:建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应各点,然后把各点用线段顺次连接,得到一条折线,用这种折线表示出样本数据的情况,这样的一种表示和分析数据的统计图称为折线图.
7.扇形图:用一个圆表示总体,圆中各扇形分别代表总体中的不同部分,每个扇形的大小反映所表示的那部分占总体的百分比的大小,这样的一种表示和分析数据的统计图称为扇形图.
(三)用样本估计总体
1.众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平;
2.中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平;
平均数:反应一组数据的平均水平;
3.方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.方差的简化计算公式:s2=[(x+x+…+x)-n 2]或写成s2=(x+x+…+x)-2,即方差等于原数据平方的平均数减去平均数的平方.
4.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.
5.百分位:一般地,一组数据的第p百分位是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p%)的数据大于或等于这个值.
题型一 抽样
【典例1】(2022春·江苏盐城·高一统考期末)工厂生产A,B,C,3种不同型号的产品,产量之比为3:2:7.现用分层抽样的方法抽取一个容量为n的样本,若样本中B种型号的产品有12件,则样本容量n=( )
A.72 B.48 C.24 D.60
【典例2】(2022春·江苏宿迁·高一统考期末)某工厂生产A,B,C三种不同型号的产品,某月生产A,B,C这三种型号的产品的数量之比为,现用分层抽样的方法抽取一个容量为60的样本,已知B种型号的产品被抽取30件,则a的值为( )
A.1 B.2 C.3 D.4
【典例3】(2022春·江苏苏州·高一校联考期末)某单位有青年职工160人,中年职工人数是老年职工人数的2倍,老、中、青职工共有430人,为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为( )
A.16 B.18 C.27 D.36
【典例4】(2022春·江苏南京·高一江苏省江浦高级中学校联考期末)总体编号为01,02,…,29,30的30个个体组成.利用下面的随机数