内容正文:
第一节 随机抽样与样本估计总体
知识回顾
1.随机抽样
(1)简单随机抽样
①定义:一般地,从个体数为N的总体中逐个不放回地取出n个个体作为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.
②最常用的简单随机抽样方法有两种——抽签法和随机数表法.
(2)分层抽样
①定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几个部分,然后按各个部分在总体中所占的比实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”.
②分层抽样的应用范围:
当总体由差异明显的几个部分组成时,往往选用分层抽样的方法.
2.用样本的频率分布估计总体分布
(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.
(2)①频率分布折线图:如果将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,那么就得到频率分布折线图.
②总体分布的密度曲线:如果将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布的密度曲线.
3.用样本的数字特征估计总体的数字特征
(1)众数:一组数据中出现次数最多的数.
(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.
(3)平均数:=,反映了一组数据的平均水平.
(4)标准差:是样本数据到平均数的一种平均距离,s=.
(5)方差:s2=[(x1-)2+(x2-)2+…+(xn-)2](xn是样本数据,n是样本容量,是样本平均数).
课前检测
1.某学校高一年级共有200名学生,为了了解这些学生的身高状况,从中抽取了15名学生进行测量.在这个问题中,200名学生的身高是()
A.总体
B.个体
C.样本的容量
D.从总体中抽取的一个样本
A
200名学生的身高是指总体,15名学生的身高从总体中抽取的是样本,15是样本容量,每一名学生的身高是个体.故选A.
随机抽样,总体、个体、样本、样本容量.
2. 为了了解某地参加计算机水平测试的5 000名学生的成绩,从中抽取了200名学生的成绩进行统计分析.在这个问题中,这200名学生成绩的全体是( )
A.总体 B.个体
C.从总体中抽取的一个样本 D.样本容量
【答案】选C 根据随机抽样的概念可知选C.
3.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )
A.33,34,33 B.25,56,19
C.20,40,30 D.30,50,20
答案 B
解析 设在不到35岁的员工抽取x人,则=,所以x=25,同理可得这三个年龄段抽取人数分别为25,56,19.
4.为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
【答案】选B 统计问题中,体现数据的稳定程度的指标为数据的方差或标准差.故选B.
5.(多选)下表是某电器销售公司2019年度各类电器营业收入占比和净利润占比统计表:
空调类
冰箱类
小家电类
其它类
营业收入占比
90.10%
4.98%
3.82%
1.10%
净利润占比
95.80%
-0.48%
3.82%
0.86%
则下列判断中正确的是( )
A.该公司2019年度冰箱类电器销售亏损
B.该公司2019年度小家电类电器营业收入和净利润相同
C.该公司2019年度净利润主要由空调类电器销售提供
D.剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低
答案 ACD
解析 根据表中数据知,该公司2019年度冰箱类电器销售净利润占比为-0.48%,是亏损的,A正确;小家电类电器营业收入占比和净利润占比是相同的,但收入与净利润不一定相同,B错误;该公司2019年度空调类电器净利润占比为95.80%,是主要利润来源,C正确;所以剔除冰箱类电器销售数据后,该公司2019年度空调类电器销售净利润占比将会降低,D正确.故选ACD.
6.(2020·惠州调研)某高校调查了320名学生每周的自习时间(单位:小时)制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分