内容正文:
第82讲 随机抽样的方法、用样本估计总体
一、抽样方法
1. 简单随机抽样
(1)定义:设一个总体含有N个个体,从中 抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会 ,就把这种抽样方法叫做简单随机抽样.
(2)最常用的简单随机抽样的方法: 和 .
2. 分层抽样
(1)定义:在抽样时,将总体分成 的层,然后按照 从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
(2)分层抽样的应用范围:当总体是由 组成时,往往选用分层抽样.
3. 两种抽样方法的区别与联系:
类别
简单随机抽样
分层抽样
共同点
抽样过程中每个个体被抽到的机会均等,不放回抽样
各自特点
从总体中逐个抽取
将总体分n层,分层进行抽取
适用范围
总体中个体数较少
总体由差异明显的几部分组成
二、总体分布特征数的估计
1. 总体分布
(1)频率分布表:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布,我们把反映总体频率分布的表格称为 .
(2)频率分布直方图:利用直方图反映样本的频率分布规律,这样的直方图称为频率分布直方图.
(3)频率分布折线图:如果将频率分布直方图中,各相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率分布折线图.频率分布折线图的优点是它反映了数据的变化趋势.
4. 总体特征数的估计
(1)中位数:在频率分布直方图中,中位数左边和右边的直方图面积应该相等,由此可以估计中位数的值.
(2)众数:在频率分布直方图中,众数是最高的矩形的中点的横坐标.
(3)平均数及其估计:平均数是直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
平均数x= .
(4)方差与标准差
标准差s= 、方差s2= .
5、频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,则mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)若数据x1,x2,…,xn的方差为s2,则数据ax1+b,ax2+b,…,axn+b的方差为a2s2.
1、(2023•上海)如图为年上海市货物进出口总额的条形统计图,则下列对于进出口贸易额描述错误的是
A.从2018年开始,2021年的进出口总额增长率最大
B.从2018年开始,进出口总额逐年增大
C.从2018年开始,进口总额逐年增大
D.从2018年开始,2020年的进出口总额增长率最小
2、(2023•上海)现有某地一年四个季度的(亿元),第一季度为232(亿元),第四季度为241(亿元),四个季度的逐季度增长,且中位数与平均数相同,则该地一年的为 .
3、(2023•上海)某校抽取100名学生测身高,其中身高最大值为,最小值为,根据身高数据绘制频率组距分布直方图,组距为5,且第一组下限为153.5,则组数为 .
4、(2022•天津)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:的分组区间为,,,,,,,,,,将其按从左到右的顺序分别编号为第一组,第二组,,第五组,右图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为
A.8 B.12 C.16 D.18
5、(2021•天津)从某网络平台推荐的影视作品中抽取400部,统计其评分数据,将所得400个评分数据分为8组:,,,,,,,并整理得到如下的频率分布直方图,则评分在区间,内的影视作品数量是
A.20 B.40 C.64 D.80
6、(多选题)(2023•新高考Ⅰ)有一组样本数据,,,,其中是最小值,是最大值,则
A.,,,的平均数等于,,,的平均数
B.,,,的中位数等于,,,的中位数
C.,,,的标准差不小于,,,的标准差
D.,,,的极差不大于,,,的极差
7、(多选题)(2021•新高考Ⅱ)下列统计量中,能度量样本,,,的离散程度的有
A.样本,,,的标准差 B.样本,,,的中位数
C.样本,,,的极差 D.样本,,,的平均数
8