内容正文:
用样本估计总体
1总体取值规律的估计
① 频率直方图
(1) 画频率直方图的步骤
求极差--决定组距与组数--将数据分组--列频率分布表--画频率分布直方图.
(2) 小长方形的面积=频率
(3) 在直方图中,各小长方形的面积之和等于.
2 总体百分位数的估计
① 第百分位数的概念
一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.
② 计算一组个数据的第百分位数
第一步:按从小到大排列原始数据;
第二步:计算;
第三步:若不是整数,而大于的比邻整数为,则第百分位数为第项数据;若是整数,则第百分位数为第项与第项数据的平均数.
③ 四分位数的概念
四分位数:包含第百分位数,第百分位数,第百分位数.
中位数相当于第百分位数,第百分位数也称为第一四分位数或下四分位数,第百分位数也称为第三四分位数或上四分位数.
3 总体集中趋势的估计
一般来说,对一个单峰的频率分布直方图来说,如果直方图的形状是对称的,那么平均数和中位数应该大体上差不多;如果直方图在右边“拖尾”,那么平均数大于中位数;如果直方图在左边“拖尾”,那么平均数小于中位数.
一般地,对数值型数据(如用水量,身高,收入,产量等)集中趋势的描述,可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述,可以用众数.
4 总体离散程度的估计
① 方差,标准差的概念
(1)假设一组数据是,用
这组数据的方差,为了计算方便也可以用
标准差是
② 方差,标准差的意义
方差越大,表明数据波动越大,越不稳定;方差越小,表明数据波动越小,越稳定.
【题型一】常见统计数据
【典题1】 某地一年之内12个月的月降水量从小到大分别为:46,51, 48,53,56, 53,56,64,58,56,66,71,则该地区的月降水量20%分位数和75%分位数为( )
A.51,58 B.51,61 C.52,58 D.52,61
【解析】该组数据从小到大排列为:46,48,51,53,53,56,56,56,58,64,66,71
因为,计算结果不是整数,
所以分位数为第项数据,即;
因为,计算结果是整数,
所以分位数为第9项和第10项数据的平均数,即.
【点拨】计算一组个数据的第百分位数的步骤:
(1)按从小到大排列原始数据;
(2)计算;
(3)若不是整数,而大于的比邻整数为,则第百分位数为第项数据;
若是整数,则第百分位数为第项与第项数据的平均数.
【典题2】甲、乙两人在相同条件下各打靶10次,每次打靶的成绩情况如图所示:下列说法错误的是( )
A.从平均数和方差相结合看,甲波动比较大,乙相对比较稳定
B.从折线统计图上两人射击命中环数走势看,甲更有潜力
C.从平均数和命中9环及9环以上的次数相结合看,甲成绩较好
D.从平均数和中位数相结合看,乙成绩较好
【解析】由图可知,甲打靶的成绩为2,4,6,8,7,7,8,9,9,10,
所以甲的平均数为,
甲方差;
乙打靶的成绩分别为9,5,7,8,7,6,8,6,7,7,
乙的平均数为,
乙方差;
所以,从平均数和方差相结合看,甲波动比较大,乙波动比较小,故正确,
(不求方差,看图也可知道甲的波动比乙的要打些)
从折线统计图看,在后半部分,甲呈上升趋势,而乙呈下降趋势,甲更有潜力,故正确,
甲打靶的成绩为2,4,6,7,7,8,8,9,9,10,中位数为7.5,
乙打靶的成绩为5,6,6,7,7,7,7,8,8,9,中位数为7,
甲9环以及9环以上的次数为3次,乙9环以及9环以上的次数为1次,
而二人的平均数相同,故甲成绩更好点,故正确,
甲乙的平均数相同,而甲的中位数大于乙的中位数,故甲的成绩比较好,故错误,
故选:.
【典题3】 已知的平均数为,标准差为,则的平均数和标准差分别为 .
【解析】的平均数为,标准差为,
的平均数为,标准差为:
【点拨】若原有的数据平均数为,方差为,在原数据基础上进行线性变化,则新的平均数为,新的方差为.
【典题4】为了解本市居民的生活成本,甲、乙、内三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),甲、乙、丙所调查数据的标准差分别为,则它们的大小关系为( )
【解析】根据三个频率分步直方图知,
甲数据的两端数字较多,绝大部分数字都处在两端数据偏离平均数远,最分散,其方差、标准差最大;
丙数据是单峰的每一个小长方形的差别比较小,数字分布均匀,数据不如第一组偏离平均数大,方差比第一组中数据中的方差、标准差小,
而乙数据绝大部分数字都在平均数左右,数据最集中,故其方差、标准差最小,
总上可知