内容正文:
2021年高考数学(理)选考与统计部分突破性讲练
03 用样本估计总体
一、考点传真:
1.了解分布的意义和作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点;
2.理解样本数据标准差的意义和作用,会计算数据标准差;
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想;
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
二、知识点梳理:
1.频率分布直方图
(1)频率分布表的画法:
第一步:求极差,决定组数和组距,组距=;
第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示,每个小矩形的面积表示样本落在该组内的频率.
2.茎叶图
统计中一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数.
3.样本的数字特征
(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.
(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.
(3)平均数:把称为a1,a2,…,an这n个数的平均数.
(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为,则这组数据的标准差和方差分别是
s=,
s2=[(x1-)2+(x2-)2+…+(xn-)2].
【注意点】
1.频率分布直方图与众数、中位数与平均数的关系
(1)最高的小长方形底边中点的横坐标即是众数.
(2)中位数左边和右边的小长方形的面积和是相等的.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
2.平均数、方差的公式推广
(1)若数据x1,x2,…,xn的平均数为,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是m+a.
(2)数据x1,x2,…,xn的方差为s2.
①数据x1+a,x2+a,…,xn+a的方差也为s2;
②数据ax1,ax2,…,axn的方差为a2s2.
三、例题:
例1.(2020年全国3卷理数,3)在一组样本数据中,1,2,3,4出现的频率分别为,且,则下面四种情形中,对应样本的标准差最大的一组是( )
A., B.,
C., D.,
【答案】B
【解析】对于A,当,时,随机变量的分布列为
1
2
3
4
0.1
0.4
0.4
0.1
,,所以.
对于B,当,时,随机变量的分布列为
1
2
3
4
0.4
0.1
0.1
0.4
,,
所以.
对于C,当,时,随机变量的分布列为
1
2
3
4
0.2
0.3
0.3
0.2
,,所以.
对于D,当,时,随机变量的分布列为
1
2
3
4
0.3
0.2
0.2
0.3
,,所以.所以B中的标准差最大.
例2..(2020年天津卷,4)从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A.10 B.18 C.20 D.36
【答案】B
【解析】由题知与所对应的小矩形的高分别为6.25,5.00,所以的频率为,所以直径落在区间内的个数为,故选B.
例 3.(2019全国II卷)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )
A.中位数 B.平均数
C.方差 D.极差
【答案】A
【解析】:根据题意,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变.故选A.
例4.(2019全国II卷)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为__________.
【答案】0.98
【解析】 经停该站高铁列车所有车次的平均正点率的估计值为:
.
例5.(2019全国III卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每