内容正文:
2.2 用样本估计总体
2.2.1 用样本的频率分布估计总体分布
学 习 目 标
核 心 素 养
1.会用频率分布表,画频率分布直方图表示样本数据.(难点)
2.能通过频率分布表和频率分布直方图对数据做出总体统计.(重点)
3.理解茎叶图的概念,会画茎叶图.(重点)
1.通过频率分布直方图和茎叶图的学习,培养数据分析素养.
2.借助图表中的数据运算,提升数学运算素养.
1.频率分布直方图的画法
2.频率分布折线图和总体密度曲线
(1)频率分布折线图:
连接频率分布直方图中各小长方形上端的中点,就得到了频率分布折线图.
(2)总体密度曲线:
随着样本容量的增加,作图时所分的组数也在增加,组距减小,相应的频率分布折线图就会越来越接近于一条光滑曲线,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
3.茎叶图
(1)茎叶图的制作方法(以两位数据为例):
将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出.
(2)茎叶图的优缺点
在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占据一个空间,如果数据很多,枝叶就会很长.
思考:通过抽样获取的原始数据有何缺点?
[提示] 因为通过抽样获得的原始数据多而且杂乱,无法直接从中理解它们的含义,并提取信息,也不便于我们用它来传递信息.
1.下列关于茎叶图的叙述正确的是( )
A.将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面
B.茎叶图只可以分析单组数据,不能对两组数据进行比较
C.茎叶图更不能表示三位数以上的数据
D.画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出
A [由茎叶图的概念可得.]
2.一个容量为80的样本中,数据的最大值为152,最小值为60,组距为10,应将样本数据分为( )
A.10组 B.9组
C.8组 D.7组
A [由题意知,=9.2,
故应分成10组.]
3.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有( )
A.30辆 B.40辆
C.60辆 D.80辆
C [由直方图知,时速在[50,60)内的频率为0.03×10=0.3,故此段内汽车有200×0.3=60辆.]
4.如图是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是________,最低分是________.
4% 51 [由茎叶图知,样本容量为25,90分以上有1人,故优秀率为×100%=4%,最低分为51分.]
频率分布直方图的绘制
[探究问题]
1.要做频率分布表,需要对原始数据做哪些工作?
[提示] 分组、频数累计、计算频数和频率.
2.画频率分布直方图时,如何决定组数与组距?
[提示] 若为整数,则=组数.
若不为整数,则+1=组数.
注意:[x]表示不大于x的最大整数.
3.同一组数据,如果组距不同,得到的频率分布直方图也会不同吗?
[提示] 不同.对于同一组数据分析时,要选好组距和组数,不同的组距与组数对结果有一定的影响.
【例1】 某中学从高一年级随机抽取50名学生进行智力测验,其得分如下(单位:分):
48 64 52 86 71 48 64 41 86 79
71 68 82 84 68 64 62 68 81 57
90 52 74 73 56 78 47 66 55 64
56 88 69 40 73 97 68 56 67 59
70 52 79 44 55 69 62 58 32 58
根据上面的数据,回答下列问题:
(1)这次测验成绩的最高分和最低分分别是多少?
(2)将区间[30,100]平均分成7个小区间,试列出这50名学生智力测验成绩的频率分布表,进而画出频率分布直方图;
(3)分析频率分布直方图,你能得出什么结论?
思路点拨:按画频率分布直方图的步骤进行绘制.
[解] (1)这次测验成绩的最低分是32分,最高分是97分.
(2)根据题意,列出样本的频率分布表如下:
分组
频数
频率
[30,40)
1
0.02
[40,50)
6
0.12
[50,60)
12
0.24
[60,70)
14
0.28
[70,80)
9
0.18
[80,90)
6
0.12
[90,100]
2
0.04
合计
50
1.00
频率分布直方图如图所示.
(3)从频率分布直方图可以看出,这50名学生的智力测验成绩大体上呈两头小、中间大,