内容正文:
5.1 统计
5.1.3 数据的直观表示
第五章 统计与概率
[学习目标] 1.能根据所给数据和需要作出统计图.能根据统计图提供的信息,解决实际问题. 2.了解频数与频率的关系.会列频数、频率分布表,会画频数分布直方图、频率分布直方图及其折线图. 3.能利用直方图估计数据的数字特征.
知识点1 柱形图、折线图、扇形图
内容索引
知识点2 茎叶图
课时作业 巩固提升
知识点3 频率分布直方图
课堂达标·素养提升
3
知识点1 柱形图、折线图、扇形图
1.柱形图(也称为条形图)
作用 形象地比较各种数据之间的数量关系
特征 (1)一条轴上显示的是所关注的数据 ,另一条轴上对应的是 、 或者
(2)每一矩形都是
类型
数量
个数
比例
等宽的
2.折线图
作用 形象地表示数据的变化趋势
特征 一条轴上显示的通常是时间,另一条轴上是对应的数据
3.扇形图(也称为饼图、饼形图)
作用 形象地表示出各部分数据在全部数据中所占的
特征 每一个扇形的圆心角以及弧长,都与这一部分表示的数据大小成
比例
正比
某市为了了解学生的视力变化情况,从全市九年级随机抽取了1 500名学生,统计了每个人连续三年视力检查的结果,根据视力在4.9以下的人数变化制成折线统计图,并对视力下降的主要因素进行调查,制成扇形统计图.
例1
解答下列问题:
(1)图中D所在扇形的圆心角度数为 .
[分析] (1)由扇形统计图中的数据求出D占的百分比,乘以360°即可得到结果;
[解] (1)根据题意得360°×(1-40%-25%-20%)=54°.
(2)若2020年全市共有30 000名九年级学生,请你估计视力在4.9以下的学生约有多少名?
[分析] (2)由样本中视力在4.9以下的人数占的百分比,乘以30 000即可得到结果;
[解] (2)根据题意得30 000×=16 000(名),则估计视力在4.9以下的学生约有16 000名.
(3)根据扇形统计图信息,你觉得中学生应该如何保护视力?
[分析] (3)根据扇形统计图中影响视力的因素,提出合理化建议即可.
[解] (3)建议中学生应少看电视、少玩游戏、少看手机,才能保护视力.
扇形统计图、条形统计图、折线统计图的特点
1.扇形统计图的特点
(1)用扇形的面积表示部分在总体中所占的百分比.
(2)易于显示每组数据相对于总数的大小.
2.条形统计图的特点
(1)条形统计图能清楚地表示出每个项目中的具体数目.
(2)易于比较数据之间的差别.
思维提升
3.折线统计图的特点
(1)能清楚地反映事物的变化情况.
(2)显示数据变化趋势.
1.某校公布了该校反映各年级学生体育达标情况的两张统计图(如图),该校七、八、九三个年级共有学生800人,甲、乙、丙三个同学看了这两张统计图后,甲说:“七年级的体育达标率最高.”乙说:“八年级共有学生264人.”丙说:“九年级的体育达标率最高.”甲、乙、丙三个同学中,说法正确的是( )
A.甲和乙 B.乙和丙
C.甲和丙 D.甲、乙和丙
跟踪训练
B
由扇形统计图可以看出八年级共有学生800×33%=264人;
七年级的达标率为×100%≈87.8%;
九年级的达标率为×100%≈97.9%;
八年级的达标率为×100%≈94.7%.
则九年级的达标率最高.则乙、丙的说法是正确的.
知识点2 茎叶图
茎叶图
作用 (1)如果每一行的数都是按从大到小(或从小到大)顺序排列,则从中可以方便地看出这组数的 、 等数字特征;
(2)可以看出一组数的分布情况,可能可以得到一些额外的信息;
(3)比较两组数据的集中或分散程度
特征 所有的茎都竖直排列,而叶沿水平方向排列
最值
中位数
某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:
甲:95,81,75,91,86,89,71,65,76,88,94,110,107;
乙:83,86,93,99,88,103,98,114,98,79,78,106,101.
画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.
例2
[解] 甲、乙两人数学成绩的茎叶图如图所示.
从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,叶主要集中在8,9,10的茎上;甲同学的得分情况也是大致对称,叶主要集中在7,8,9的茎上.乙同学的成绩总体情况比甲同学好.
1.绘制茎叶图关键是分清茎和叶.一般地说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”.解题时要根据数据的特点合理地选择茎和叶.
2.应用茎叶图可以对两组数据进行比较,画图时,要找到两组数据共同的茎,分析时要从数据分布的对称性、中位数、稳定性等方面比较.
3.茎叶图的优点是保留了原始信息,并可以随时记录数据,但当样本容量较大时就不适合了.
思维提升
2.如图茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,若乙的平均分是89,则污损的数字是 .
跟踪训练
3
设污损的叶对应的数字为x,由茎叶图可得,89×5=83+83+87+x+90+99,∴x=3.故污损的数字是3.
知识点3 频率分布直方图
1.频数
在一组数据中,数据出现的次数称为频数,某个区间内的数据的个数称为区间对应的频数.
2.频率
在一组数据中,数据的频数与这组数据总个数的比值称为频率,区间对应的频数与这组数据总个数的比值称为区间对应的频率.
3.频数分布直方图与频率分布直方图的绘制步骤
(1)找出最值,计算极差;
(2)合理分组,确定区间;
(3)整理数据;
(4)作出有关图示.
频数分布
直方图 纵坐标是 ,每一组数对应的矩形高度与频数成正比
频率分布
直方图 纵坐标是 ,每一组数对应的矩形高度与频率成正比,每个矩形的面积等于这一组数对应的频率,所有矩形的面积之和为
频数
1
4.频数分布折线图和频率分布折线图
把频数分布直方图和频率分布直方图中每个矩形上面一边的
用线段连接起来,且画成与横轴相交.
中点
从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分):
[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.
(1)列出样本的频率分布表;
例3
[解] (1)频率分布表如表所示.
成绩分组 频数 频率
[40,50) 2 0.04
[50,60) 3 0.06
[60,70) 10 0.2
[70,80) 15 0.3
[80,90) 12 0.24
[90,100] 8 0.16
合计 50 1.00
(2)画出频率分布直方图;
[解] (2)由题意知组距为10,取小矩形的高为,计算得到数据表:
成绩分组 频率 小矩形的高
[40,50) 0.04 0.004
[50,60) 0.06 0.006
[60,70) 0.2 0.02
[70,80) 0.3 0.03
[80,90) 0.24 0.024
[90,100] 0.16 0.016
合计 1.00
根据表格画出频率分布直方图:
(3)估计成绩在[70,80)的学生占总体的百分比.
[解] (3)由频率分布直方图可知成绩在[70,80)分的学生所占总体的百分比是0.03×10=0.3=30%.
1.在列频率分布表时,极差、组距、组数有如下关系
(1)若为整数,则=组数;
(2)若不为整数,则的整数部分+1=组数.
思维提升
2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.
3.有一容量为200的样本,数据的分组以及各组的频数如下:
[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.
(1)列出样本的频率分布表;
跟踪训练
解:(1)频率分布表如表所示.
分组 频数 频率
[-20,-15) 7 0.035
[-15,-10) 11 0.055
[-10,-5) 15 0.075
[-5,0) 40 0.200
[0,5) 49 0.245
[5,10) 41 0.205
[10,15) 20 0.100
[15,20] 17 0.085
合计 200 1.000
(2)画出频率分布直方图和频率分布折线图;
解: (2)频率分布直方图和频率分布折线图如图所示.
(3)求样本数据不足0的频率.
解: (3)样本数据不足0的频率为0.035+0.055+0.075+0.200=0.365.
〈课堂达标·素养提升〉
1.如果想用统计图来反映各数据的变化趋势,比较合适的统计图是( )
A.条形图 B.折线图 C.扇形图 D.其他图形
能反映各数据变化趋势的统计图是折线图.
B
2.(多选)下列关于茎叶图的叙述错误的是( )
A.将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面
B.茎叶图只可以分析单组数据,不能对两组数据进行比较
C.茎叶图更不能表示三位数以上的数据
D.画图时茎要按照从小到大的顺序从下向上列出,共茎的叶可随意同行列出
BCD
由茎叶图的概念知,只有A选项正确.
3.某校100名学生的数学测试成绩频率分布直方图如图所示,分数不低于a即为优秀,如果优秀的人数为20,则a的估计值是 (填整数).
133
由已知可以判断a∈[130,140),所以[(140-a)×0.015+0.01×10]×100=20,解得a≈133.
课时作业 巩固提升
[A组 必备知识练]
1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是( )
1
2
3
4
5
6
7
8
9
10
11
12
D
13
用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是柱形统计图.注意B选项中的图不能称为统计图.
1
2
3
4
5
6
7
8
9
10
11
12
13
2.端午节期间,某市一周每天最高气温(单位:℃)情况如图所示,则这组表示最高气温数据的中位数是( )
A.22 B.24 C.25 D.27
1
2
3
4
5
6
7
8
9
10
11
12
B
13
中位数是一组数据从小到大(或从大到小)重新排列后,最中间的那个数(最中间两个数的平均数).由此将这组数据重新排序为20,22,22,24,25,26,27,∴中位数是按从小到大排列后第4个数为24.
1
2
3
4
5
6
7
8
9
10
11
12
13
3.甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )
A.甲同学比乙同学发挥稳定,且平均成绩也比乙同学高
B.甲同学比乙同学发挥稳定,但平均成绩比乙同学低
C.乙同学比甲同学发挥稳定,且平均成绩也比甲同学高
D.乙同学比甲同学发挥稳定,但平均成绩比甲同学低
1
2
3
4
5
6
7
8
9
10
11
12
C
13
由茎叶图的性质可知乙同学比甲同学发挥稳定,且平均成绩比甲同学高.
1
2
3
4
5
6
7
8
9
10
11
12
13
4.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用分层抽样法,则50岁以上年龄段应抽取 人.
由图可知,50岁以上的职工所占的百分比为20%,按分层抽样法应抽取的人数为40×20%=8.
1
2
3
4
5
6
7
8
9
10
11
12
8
13
5.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成频率分布表:
1
2
3
4
5
6
7
8
9
10
11
12
分组 频数 频率
[80,90) ① ②
[90,100) 0.050
[100,110) 0.200
[110,120) 36 0.300
[120,130) 0.275
[130,140) 12 ③
[140,150] 0.050
合计 ④
13
根据上面的频率分布表,可知①处的数值为 ,②处的数值为 .
由位于[110,120)的频数为36,频率为=0.300,得样本容量n=120,所以[130,140)的频率为=0.100,故②处应为1-0.050-0.200-0.300-0.275-0.100-0.050=0.025,①处应为0.025×120=3.
1
2
3
4
5
6
7
8
9
10
11
12
3
0.025
13
6.如图是某手机店根据某手机销售的相关数据绘制的统计图的一部分.请根据图①、图②解答下列问题:
1
2
3
4
5
6
7
8
9
10
11
12
13
(1)来自该店财务部的数据报告表明,该手机店1~4月的手机销售总额一共是290万元,请将图①中的统计图补充完整.
1
2
3
4
5
6
7
8
9
10
11
12
13
解:(1)290-(85+80+65)=60(万元),补图如图.
1
2
3
4
5
6
7
8
9
10
11
12
13
(2)该店1月份音乐手机的销售额为多少万元?
解: (2)85×23%=19.55(万元),所以该店1月份音乐手机的销售额为19.55万元.
1
2
3
4
5
6
7
8
9
10
11
12
13
(3)小刚观察图②后,认为4月份音乐手机的销售额比3月份减少了,你同意他的看法吗?请说明理由.
1
2
3
4
5
6
7
8
9
10
11
12
13
解: (3)不同意.理由如下:3月份音乐手机的销售额是60×18%=10.8(万元),4月份音乐手机的销售额是65×17%=11.05(万元).而10.8<11.05,因此4月份音乐手机的销售额比3月份的销售额增多了.
1
2
3
4
5
6
7
8
9
10
11
12
13
7.某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].
1
2
3
4
5
6
7
8
9
10
11
12
13
(1)求出x的值;
解:(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,且频率之和等于1,
∴0.050×2+0.100×2+0.125×2+0.150×2+x×2=1,∴x=0.075.
1
2
3
4
5
6
7
8
9
10
11
12
13
(2)已知样本中身高小于100厘米的人数是36,求出样本总量N的数值;
解: (2)样本中身高小于100厘米的频率为(0.050+0.100)×2=0.3.
∴样本容量N==120.
1
2
3
4
5
6
7
8
9
10
11
12
13
(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.
解: (3)样本中身高大于或等于98厘米并且小于104厘米的频率为(0.100+0.150+0.125)×2=0.75.∴学生数为120×0.75=90(人).
1
2
3
4
5
6
7
8
9
10
11
12
13
[B组 关键能力练]
8.如图是今年某市青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有( )
A.a1>a2
B.a2>a1
C.a1=a2
D.a1,a2的大小与m的值有关
1
2
3
4
5
6
7
8
9
10
11
12
B
13
由茎叶图,去掉一个最高分和一个最低分后,甲的平均分a1==84,乙的平均分a2==85,故a1<a2.
1
2
3
4
5
6
7
8
9
10
11
12
13
9.某教育机构随机抽查某校20个班级,调查各班关注“汉字听写大赛”的学生人数,根据所得数据的茎叶图,以5为组距将数据分组成[0,5),[5,10),[10,15),[15,20),[20,25),[25,30),[30,35),[35,40]时,所作的频率分布直方图如图所示,则原始的茎叶图可能是( )
1
2
3
4
5
6
7
8
9
10
11
12
A
13
由频率分布直方图知,各组频数统计如下表:
结合各选项茎叶图中的数据可知选项A正确.
1
2
3
4
5
6
7
8
9
10
11
12
分组 [0,5) [5,10) [10,15) [15,20)
频数 1 1 4 2
分组 [20,25) [25,30) [30,35) [35,40]
频数 4 3 3 2
13
10.某高二(1)班一次阶段考试数学成绩的茎叶图和频率分布直方图的可见部分如图所示,根据图中的信息,可确定被抽测的人数为 ,分数在[90,100]内的人数为 .
1
2
3
4
5
6
7
8
9
10
11
12
25
2
13
由频率分布直方图知,分数在[90,100]内的频率和[50,60)内的频率相同,所以分数在[90,100]内的人数为2人,总人数为=25(人).
1
2
3
4
5
6
7
8
9
10
11
12
13
11.某班50名学生在一次百米测试中,成绩全部介于13 s与19 s之间.将测试结果按如下方式分成6组:第一组,成绩大于等于13 s且小于14 s;第二组,成绩大于等于14 s且小于15 s;…;第六组,成绩大于等于18 s且小于等于19 s.如图是按上述分组方法得到的频率分布直方图.设成绩小于17 s的学生人数占全班总人数的百分比为x,成绩大于等于15 s且小于17 s的学生人数为y,则从频率分布直方图中可以分析出x和y分别为 .
1
2
3
4
5
6
7
8
9
10
11
12
0.9,35
13
从频率分布直方图可以得到,成绩小于17 s的学生的频率,也就是成绩小于17 s的学生所占的百分比是0.02+0.18+0.34+0.36=0.9;成绩大于等于15 s且小于17 s的学生的人数为(0.34+0.36)×50=35.
1
2
3
4
5
6
7
8
9
10
11
12
13
12.某高中有高一新生500名,分成水平相同的A,B两类进行教学实验,为对比教学效果,现用分层抽样的方法从A,B两类学生中分别抽取了40人,60人进行测试.
(1)求该学校高一新生中A,B两类学生各多少人?
1
2
3
4
5
6
7
8
9
10
11
12
13
解:(1)由题意知A类学生有500×=200(人),
则B类学生有500-200=300(人).
(2)经过测试,得到三个数据图表:
图1:75分及以上A,B两类学生参加测试的成绩的茎叶图
1
2
3
4
5
6
7
8
9
10
11
12
13
图2:100名学生测试成绩的频率分布直方图
1
2
3
4
5
6
7
8
9
10
11
12
13
图3:100名学生成绩的频率分布表
1
2
3
4
5
6
7
8
9
10
11
12
组号 分组 频数 频率
1 [55,60) 5 0.05
2 [60,65) 20 0.20
3 [65,70)
4 [70,75) 35 0.35
5 [75,80)
6 [80,85]
合计 100 1.00
13
先填写频率分布表中的六个空格,然后将频率分布直方图补充完整.
1
2
3
4
5
6
7
8
9
10
11
12
13
解: (2)表格:
1
2
3
4
5
6
7
8
9
10
11
12
组号 分组 频数 频率
1 [55,60) 5 0.05
2 [60,65) 20 0.20
3 [65,70) 25 0.25
4 [70,75) 35 0.35
5 [75,80) 10 0.10
6 [80,85] 5 0.05
合计 100 1.00
13
1
2
3
4
5
6
7
8
9
10
11
12
图2:
13
1
2
3
4
5
6
7
8
9
10
11
12
[C组 素养培优练]
13.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图:
分组 频数 频率
一组 0≤t<5 0 0
二组 5≤t<10 10 0.10
三组 10≤t<15 10 ②
四组 15≤t<20 ① 0.50
五组 20≤t≤25 30 0.30
合计 100 1.00
13
1
2
3
4
5
6
7
8
9
10
11
12
解答下列问题:
(1)这次抽样的样本容量是多少?
解:(1)样本容量是100.
13
1
2
3
4
5
6
7
8
9
10
11
12
(2)在表中填写出缺失的数据并补全频率分布直方图.
13
1
2
3
4
5
6
7
8
9
10
11
12
解: (2)①50,②0.10.
所补频率分布直方图如图中的阴影部分:
13
1
2
3
4
5
6
7
8
9
10
11
12
(3)旅客购票用时的平均数可能落在哪一组?
13
1
2
3
4
5
6
7
8
9
10
11
12
解: (3)设旅客平均购票用时为t min,则有
≤t
<,即15≤t<20.所以旅客购票用时的平均数可能落在第四组.
13
$$