内容正文:
第10讲 用样本估计总体
1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.
5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.
1.用样本估计总体
通常我们对总体作出的估计一般分成两种:一种是用样本
的频率分布估计总体的分布;另一种是用样本的数字特征估计
总体的数字特征.
2.统计图
(1)频率分布直方图.
①求极差:极差是一组数据的最大值与最小值的差.
②决定组距和组数:当样本容量不超过 100 时,常分成 5~
12 组,组距=________;
③将数据分组:通常对组内数值所在区间取左闭右开区间,
最后一组取闭区间,也可以将样本数据多取一位小数分组.
④列频率分布表:登记频数,计算频率,列出频率分布表.
将样本数据分成若干个小组,每个小组内的样本个数称作
频数,频数与样本容量的比值叫做这一小组的频率.频率反映各
个数据在每组所占比例的大小.
⑤绘制频率分布直方图:把横轴分成若干段,每一段对应
一个组距,然后以线段为底作一小长方形,它的高等于该组的
,这样得到一系列的长方形,每个长方形的面积恰好是该
组上的频率.这些矩形就构成了频率分布直方图,各个长方形的
面积总和等于______.
1
(2)频率分布折线图和总体密度曲线.
①频率分布折线图:连接频率分布直方图中各长方形上端
的中点,就得频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组
数增加,组距减小,相应的频率分布折线图就会越来越接近于
一条光滑的曲线,在统计中称之为总体密度曲线.
(3)茎叶图.
当样本数据较少时,用茎叶图表示数据的效果较好,它不
但可以保留所有信息,而且可以随时记录信息,给数据的记录
和表示都带来方便.
3.用样本的数字特征估计总体的数字特征
(1)众数、中位数、平均数.
①众数:在一组数据中,出现次数最多的数据叫做这组数
据的众数.
②中位数:将一组数据按大小依次排列,把处在________
位置的一个数据(或最中间两个数据的平均数)叫做这组数据的
中位数.
③平均数:样本数据的算术平均数,
在频率分布直方图中,中位数左边和右边的直方图的面积
应该相等.
最中间
即=(x1+x2+…+xn).
(2)样本方差、标准差.
②标准差是反映总体波动大小的特征数,样本方差是标准
差的平方.通常用样本方差估计总体方差,当样本容量接近总体
容量时,样本方差接近总体方差.
平均数
①标准差s=
(其中xn是样本数据的第n项,n是样本容量,是_______).
1.(2017 年江西南昌二模)图9-10-1 是一样本的频率分布直方
)
图.若样本容量为 100,则样本数据在[15,20]内的频数是(
图 9-10-1
A.50
B.40
C.30
D.14
C
2.(2015 年重庆)重庆市2013 年各月的平均气温(单位:℃)
)
B
数据的茎叶图如图 9-10-2,则这组数据中的中位数是(
图 9-10-2
A.19
B.20
C.21.5
D.23
3.(2015 年广东)已知样本数据x1,x2,…,xn的均值 x =5,
则样本数据2x1+1,2x2+1,…,2xn+1的均值为_______.
4.(2016 年上海)某次体检,6 位同学的身高(单位:米)分别
为 1.72,1.78,1.75,1.80,1.69,1.77,则这组数据的中位数是______
(单位:米).
11
1.76
考点 1
样本的数字特征
例 1:(1)(2017 年新课标Ⅰ)为评估一种农作物的种植效果,
选了 n 块地作试验田.这 n 块地的亩产量(单位:kg)分别为x1,
x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量
稳定程度的是(
)
A.x1,x2,…,xn的平均数 B.x1,x2,…,xn的标准差
C.x1,x2,…,xn的最大值 D.x1,x2,…,xn的中位数
解析:刻画评估这种农作物亩产量稳定程度的指标是标准
差.故选 B.
答案:B
(2)(2018 年新课标Ⅰ)某地区经过一年的新农村建设,农村
的经济收入增加了一倍,实现翻番,为更好地了解该地区农村
的经济收入变化情况,统计了该地区新农村建设前后农村的经
济收入构成比例,得到如图 9-10-3 所示的饼图:
图 9-10-3
则下面结论中不正确的是(
)
A.新农村建设后,种植收入减少