内容正文:
§5 用样本估计总体
5.1 估计总体的分布
5.2 估计总体的数字特征
学 习 目 标
核 心 素 养
1.理解并会运用样本的频率分布估计总体的分布,通过实例体会分布的意义和作用.(重点)
2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图及频率折线图.(难点)
3.能根据给出的频率分布直方图解决具体问题.(难点)
1.通过运用样本的频率分布估计总体分布,体会分布的意义和作用,提升数学抽象素养.
2.通过列频率分布表,画频率分布直方图及折线图提升数据分析素养.
一、基本概念
1.频率分布表和频率分布直方图
(1)频率分布表编制的方法步骤:
(2)
2.频率分布折线图
(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.
(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
二、用样本的平均数、方差与标准差估计总体的数字特征
利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.
n个样本数据x1,x2,…,xn的平均数
=(x1+x2+…+xn),则有n=x1+x2+…+xn.
设样本的元素为x1,x2,…,xn,样本的平均数为,则样本的方差s2=[(x1-)2+(x2-)2+…+(xn-)2] .
样本方差的算术平方根即为样本的标准差,即s=
.
思考:在频率分布直方图中,如何求众数、中位数、平均数?
[提示] ①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
1.当收集到的数据量很大时,比较合适的统计图是( )
A.茎叶图 B.频率分布直方图
C.频率折线图 D.频率分布表
B [当收集到的数据量很大时,一般用频率分布直方图.]
2.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在该组上的频率为m,该组上的直方图的高为h,则|a-b|=( )
A.hm B. C. D.h+m
B [=h,故|a-b|=组距==.]
3.频率分布直方图中,小矩形的面积等于( )
A.组距 B.频率
C.组数 D.频数
B [根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.]
4.某中学举办电脑知识竞赛,满分为100分,80分以上为优秀(含80分).现将高一两个班参赛学生的成绩进行整理后分成5组,绘制成频率分布直方图如图所示.
已知图中从左到右的第一、三、四、五小组的频率分别为0.30、0.15、0.10、0.05,而第二小组的频数是40,则参赛的人数是________,成绩优秀的频率是________.
100 0.15 [设参赛的人数为n,第二小组的频率为1-(0.30+0.15+0.10+0.05)=0.4,
依题意=0.4,
∴n=100,优秀的频率是0.10+0.05=0.15.]
画频率分布直方图、折线图
【例1】 已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.
(1)列出样本的频率分布表;
(2)画出频率分布直方图和频率折线图;
(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少.
[解] (1)计算极差:30-21=9.
决定组距和组数:取组距为2.
∵=4,∴共分5组.
决定分点,使分点比数据多一位小数.
并把第1小组的分点减小0.5,即分成如下5组:
[20.5,22.5),[22.5,24.5),[24.5,26.5),
[26.5,28.5),[28.5,30.5].
列出频率分布表如下:
分组
频数
频率
频率/组距
[20.5,22.5)
2
0.1
0.05
[22.5,24.5)
3
0.15
0.075
[24.5,26.5)
8
0.4
0.2
[26.5,28.5)
4
0.2
0.1
[28.5,30.5]
3
0.15