内容正文:
第一讲 统计
1.简单随机抽样
(1)定义:一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),且每次抽取时各个个体被抽到的机会都相等,就称这样的抽样方法为简单随机抽样.
(2)常用方法:抽签法和随机数法.
2.分层抽样
(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.
(2)适用范围:适用于总体由差异比较明显的几个部分组成时.
(3)在分层抽样中:.=
3.简单随机抽样和分层抽样的异同点
相同点:等概率性。两种抽样方法的共同点都是等概率不放回抽样.若样本容量为n,总体的个体数为N,则用这两种方法抽样时,每个个体被抽到的概率都是.
不同点:
(1)简单随机抽样:总体容量较少,尤其是样本容量较少.
(2)分层抽样:适用于总体由差异明显的几部分组成的情形.
例1.(2019·山东泰安模拟)某校数学教研组为了解学生学习数学的情况,采用分层抽样的方法从高一600人、高二780人、高三n人中,抽取35人进行问卷调查.已知高二被抽取的人数为13,则n=( )
A.660
B.720
C.780
D.800
练习.(2019·山东德州检测) 2018年11月11日的“双十一”又掀购物狂潮,淘宝网站对购物情况做了一项调查,收回的有效问卷共500 000份,其中购买下列四种商品的人数统计如下:服饰鞋帽198 000人;家居用品94 000人;化妆品116 000人;家用电器92 000人.为了解消费者对商品的满意度,淘宝网站用分层抽样的方法从中选出部分问卷进行调查,已知在购买“化妆品”这一类中抽取了116人,则在购买“家居用品”这一类中应抽取的问卷份数为( )
A.92
B.94
C.116
D.118
4.常用统计图表
(1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图.
①横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.
②频率分布直方图中的常见结论
1)众数的估计值为最高矩形的中点对应的横坐标.
2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
例2. (2018·全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,
0.2)
[0.2,
0.3)
[0.3,
0.4)
[0.4,
0.5)
[0.5,
0.6)
[0.6,
0.7)
频数
1
3
2
4
9
26
5
使用了节水龙头50天的日用水量频数分布表
日用
水量
[0,0.1)
[0.1,
0.2)
[0.2,
0.3)
[0.3,
0.4)
[0.4,
0.5)
[0.5,
0.6)
频数
1
5
13
10
16
5
(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)
(3)频率分布折线图和总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(4)茎叶图的画法:
第一步:将每个数据分为茎(高位)和叶(低位)两部分;
第二步:将各个数据的茎按大小次序排成一列;
第三步:将各个数据的叶依次写在其茎的右(左)侧.
例3.(2019年武汉月考)为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图所示.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为( )
0
7
9
1
3
3
5
6
7
2
1
2
4
5
8
8
3
0
1
4
7
4
1
1
2
A.100
B.