内容正文:
专题1.3 统计图表
教学目标
通过实例分析,体会统计图表的作图步骤,特点和适用范围。
教学重难点
1.了解频率分布直方表和频率分布直方图,茎叶图,散点图的特点(重点)
2.学会读统计图表(重点)
知识点01 频率分布表和频率分布直方图
1.频率分布表的定义
为了直观地表示样本的频率分布情况,通常将样本容量,样本中该事件出现的次数以及相应的频率列在一张表中,这样的表格就叫做频率分布表
一组数据的最大值与最小值的差称为极差,又称全距
每个小组的区间端点之间的距离称为组距.
2.频率分布表的五个特征
(1)样本容量确定组数的取值情况
(2)频率分布表中的分组数据与组数有关,组数的变化可引起频率分布结构的变化
(3)随机性:频率分布表由样本决定,因此会随着样本的改变而改变、
(4)规律性:根据频率趋近于概率的原理,若固定分组数据随着样本容量的增加,频率分布表中的各个频率会稳定于总体分布在相应分组的概率
(5)频率和等于 1.
3.频率分布直方图的画法步骤
(1)求极差
(2)确定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距并且组距应力求“取整”
(3)统计每组的频数及频率
(4)绘制频率分布表.计算各小组的频率,第i组的频率是,作出频率分布表.
(5)画频率分布直方图.其中横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小矩形的高度,它反映了各组样本观测数据的疏密程度
4.绘制频率分布折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.这两个组的频率取值为0,然后从所加的左边的区间的中点(称为组中值)开始,从左至右依次连接各矩形上底边的中点,直至右边所加区间的中点,再将矩形的边去除就可以得到一条折线,称为频率分布折线图,简称频率折线图
知识点02 茎叶图
1.茎叶图的特点和适用范围
(1)特点
①保留原始数据信息:茎叶图能够保留原始数据的所有信息,不会造成数据的丢失
②便于记录和表示:茎叶图可以随时记录和添加数据,方便数据的更新和展示
③直观展示数据分布:茎叶图能够直观地展示数据的分布情况,包括数据的集中趋势和离散程度④适用于两位有效数字的数据:茎叶图最适合表示具有两位有效数字的数据
(2)适用范围
①小样本数据:当样本数据较少时,茎叶图的效果较好,②数据分析:茎叶图是一种有效的探索性数据分析工具,特别适用于初步数据分析阶段
③比较两组数据:茎叶图非常适合用来比较两组数据,
④教学和演示:由于其直观性和简单性,茎叶图在教学和演示中也非常有用.
2 制作茎叶图的步骤
①将数据分为“茎”“叶”两部分;②将最大茎与最小茎之间的数字按由小到大、从上往下写成一列,并画上竖线作为分隔线;③将各个数据的“叶”在分隔线的一侧对应茎处同行列出.
知识点03 散点图
1.散点图的特点和适用范围
(1)特点
①展示相关性:散点图可以直观地呈现两个变量之间的关系
②反映数据分布:通过观察数据点的聚集程度和分布范围,能够对数据的整体特征有初步的了解
③发现异常值:散点图能够快速识别出与其他数据点显著不同的数据点,即异常值,
④灵活性高:在数据可视化方面具有较高的灵活性,可以通过改变数据点的颜色、大小、形状等属性来表示额外的信息或区分不同的数据类别,
⑤适用范围广:既适用于小规模的数据集,以便快速直观地展示数据之间的关系;又能对大规模的数据集很好地发挥作用,帮助人们从海量数据中发现潜在的规律和趋势
(2)适用范围
物理学:散点图可以帮助物理学家直观地观察数据的分布和趋势,从而验证物理定律或发现新的物理现象生物学:可以用散点图来分析生物样本的多个指标之间的关系。
气象学:用于分析气象数据中的变量关系市场营销:企业可以利用散点图分析市场调研数据金融投资:散点图可用于分析股票的收益率与市场指数的关系、投资组合中不同资产的风险和收益关系等人力资源管理:可以用来分析员工的绩效与工作经验、培训时
间等因素之间的关系
临床诊断:在临床诊断中,医生可以利用散点图分析患者的各项生理指标之间的关系,辅助诊断和治疗疾病
2.制作散点图的步骤
在考虑两组数据时,为了对两组数据之间的关系形成大致的了解,通常将这两组数据所对应的点描在平面直角坐标系内,这些点组成的统计图称为散点图
题型01频率分布表和频率分布直方图
【典例1】1.某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
【答案】A
【分析】利用频率和为1求参数,再估计身高低于170cm的人数.
【详解】由图可得,得,
所以估计这100名学生中身高低于170cm的人数为.
故选:A
【变式1】某大品牌家电公司从销售员工中随机抽出50名调查销售情况,销售额都在区间(单位:百万元)内,将其分成5组:,,,,,并整理得到如右的频率分布直方图,据此估计销售员工销售额的平均值为 (百万元),(同一组中的数据用该组区间的中点值为代表).
【答案】14.52
【分析】根据频率和为1求得,再由频率直方图求平均值即可.
【详解】由题设,可得,
所以平均值为.
故答案为:
【变式2】某校高二年级半期考试后,为了解本次考试的情况,在整个年级中随机抽取了200名学生的数学成绩,将成绩分为,共6组,得到如图所示的频率分布直方图.
(1)求实数的值.
(2)在样本中,采取按比例分层抽样的方法从成绩在内的学生中抽取13名,问其中成绩在的学生有几名?
(3)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,试估计本次考试的平均分.
【答案】(1)
(2)2
(3)98
【分析】(1)根据频率和为1求的值.
(2)根据分层抽样的方法求解.
(3)利用频率分布直方图估计平均数即可.
【详解】(1)由频率分布直方图知:
,
解得.
(2)采取分层抽样,[130,150]的学生个数为:,
即成绩在的学生有2名.
(3)由频率分布直方图知:平均数为:
(1)频率分布直方图中每一组数对应的矩形高度是,而不是。
(2)频率分布直方图优缺点:
频率分布直方图能够很容易地表示大量的数据,非常直观地表明数据分布的状况.但是从频率分布直方图本身得不出原始的数据内容,也就是说,把数据表示成频率分布直方图后,原来的数据信息被抹掉了.
(3)在绘制统计图时还应注意以下几点:
①标题:统计图一般要有标题,用以说明统计图的内容.如果可能的话,列出数据来源;
②坐标的刻度和名称:一般纵轴和横轴也需要有名称,纵轴应清楚地标明刻度,横轴应标明类别或刻度;
③标注:如果要在一张图中呈现多元数据,应使用一些标注来识别单个数据.
题型02茎叶图
【典例2】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数分别是 ( )
A.45,45 B.45,46
C.46,45 D.47,45
【答案】C
【分析】直接根据茎叶图知识求出中位数和众数即可.
【详解】根据题意,有30个数据,所以中位数为排序后第15和16个数的平均值:
,众数为出现最多的数,为45.
故选:C.
【变式2】已知甲、乙两组数据分别为两组学生射击移动靶时的命中率,其茎叶图如图所示.其中,.若这两组数据的中位数相等,平均数也相等,则 .
【答案】
【分析】根据给定的茎叶图,由中位数求出,由平均数求出即得.
【详解】由乙组数据的中位数为,则甲组数据的中位数为33,即,
由两组数据的平均数相等,得,解得,
所以.
故答案为:24
【变式2】空气质量指数PM2.5(单位:)表示每立方米空气中可吸入肺颗粒物的含量,这个值越高,就代表空气污染越严重:
PM2.5日均浓度
0~35
35~75
75~115
115~150
150~250
250
空气质量级别
一级
二级
三级
四级
五级
六级
空气质量类别
优
良
轻度污染
中度污染
重度污染
严重污染
甲、乙两城市2013年2月份中的15天对空气质量指数PM2.5进行监测,获得PM2.5日均浓度指数数据如茎叶图所示:
(1)根据你所学的统计知识估计甲、乙两城市15天内哪个城市空气质量总体较好?并说明理由.
(2)在15天内任取1天,估计甲、乙两城市空气质量类别均为优或良的概率;
【答案】(1)甲;
(2).
【分析】(1)根据茎叶图,由中位数和数据的集中程度判断;
(2)利用古典概型,分别求得甲、乙两城市空气质量类别为优或良的概率,再利用独立事件的概率求解.
【详解】(1)由茎叶图知:甲城市的中位数为:61,乙城市的中位数为79,
并且甲的大多集中在65以下,乙的大多集中在76以上,
所以甲城市空气质量总体较好;
(2)甲城市空气质量类别为优或良的有10天,
所以甲城市空气质量类别优或良的概率为,
乙城市空气质量类别为优或良的有5天,
所以乙城市空气质量类别优或良的概率为,
所以甲、乙两城市空气质量类别均为优或良的概率为.
茎叶图将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位数作为一个主干(茎),将变化大的位数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主千后面有几个数,每个数具体是多少。茎叶图其实是“侧躺”的直方图!“茎”相当于频数分布表中的分组,“茎”上“叶”的数目相当于频数分布表中指定区间组的频数茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的,茎叶图由所有样本数据构成,没有损失任何样本信息,可以边抽样边记录,适合用于数据量较少的情形;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在抽样完成后才能制作,由于茎叶图记录了所有的样本数据,因此通过茎叶图可以制作频率分布表和频率分布直方图,反之则不可以.
题型03散点图
【典例3】三名工人种植同一种果树,他们在一天中的工作情况如图所示,其中点的横、纵坐标分别为第名工人上午的工作时间和种植的果树数,点的横、纵坐标分别为第名工人下午的工作时间和种植的果树数,.记为第名工人在这一天中平均每小时种植的果树数,则( )
A.,,中最大的是 B.,,中最大的是
C.,,中最大的是 D.,,中最小的是
【答案】B
【分析】若为第名工人在这一天中平均每小时种植的果树数,则为中点与原点连线的斜率;进而得到答案.
【详解】若为第名工人在这一天中平均每小时种植的果树数,
则为线段中点与原点连线的斜率,
故中最大的是.
故选:B.
【变式1】观察下列图形,其中两个变量x、y具有相关关系的图是 .(写出所有满足条件的图形序号)
【答案】③④
【分析】根据若样本点成带状分布,则两个变量具有相关关系,结合散点图即得.
【详解】根据散点图可知在③④中,样本点成带状分布,则两个变量具有相关关系,
所以两个变量x、y具有相关关系的图是③④.
故答案为:③④.
【变式2】某校高三(1)班的学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间有表格所示的数据.
x/h
24
15
23
19
16
11
20
16
17
13
y/分
92
79
97
89
64
47
83
68
71
59
(1)画出散点图;
(2)判断数学学习的时间与数学平均成绩的关系.
【答案】(1)作图见解析
(2)数学平均成绩与数学学习时间呈现正相关关系.
【分析】(1)直接根据表中数据在坐标系中描点;
(2)从点的分布趋势是左下到右上即可判断是正相关关系.
【详解】(1)根据表中的数据画出散点图如图所示:
(2)从散点图看,数学平均成绩与数学学习时间呈现正相关关系.
一、单选题
1.已知5对数据的散点图如图,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强
C.残差平方和变大 D.样本相关系数r变大
【答案】B
【分析】根据散点图的识别辨析、相关性、相关系数、残差平方和等概念对选项逐一判断即可.
【详解】由散点图可知,去掉点后,与的线性相关性加强,且为负相关,所以B正确,A错误;
由于与的线性相关性加强,所以残差平方和变小,所以C错误,
由于与的线性相关性加强,且为负相关,所以相关系数的绝对值变大,
而相关系数为负的,所以样本相关系数变小,所以D错误.
故选:B.
2.某中学四位同学利用假期到一贫困村参加社会实践活动,感受年该村精准扶贫及新农村建设的变化.经过实地调查显示,该村年的经济收入增加了一倍.实现翻番,精准扶贫取得惊人成果.为更好地了解该村的经济收入变化情况,为后期精准扶贫方向提供决策参考,四位同学统计了该地区新农村建设前后农村的经济收入构成比例.得到饼图:
四位同学依据上述饼图,分别得出以下四个结论,其中结论中错误的是( )
A.精准扶贫及新农村建设后,种植收入减少
B.精准扶贫及新农村建设后,其他收入增加了一倍以上
C.精准扶贫及新农村建设后,养殖收入增加了一倍
D.精准扶贫及新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
【答案】A
【分析】设精准扶贫及新农村建设前和后的经济收入分别为和,根据饼状图依次验证各项收入是否满足选项中的要求,由此可得结论.
【详解】设精准扶贫及新农村建设前,经济收入为,则精准扶贫及新农村建设后,经济收入为;
对于A,精准扶贫及新农村建设前,种植收入为;
精准扶贫及新农村建设后,种植收入为;
,精准扶贫及新农村建设后,种植收入增加,A错误;
对于B,精准扶贫及新农村建设前,其他收入为;
精准扶贫及新农村建设后,其他收入为;
,精准扶贫及新农村建设后,其他收入增加了一倍以上,B正确;
对于C,精准扶贫及新农村建设前,养殖收入为;
精准扶贫及新农村建设后,养殖收入为;
,精准扶贫及新农村建设后,养殖收入增加了一倍,C正确;
对于D,精准扶贫及新农村建设后,养殖收入与第三产业收入之和的占比为,超过了总收入的一半,D正确.
故选:A.
3.某中学举行了一次“网络信息安全”知识竞赛,将参赛的500名学生成绩分为6组,绘制了如图所示的频率分布直方图,则成绩在区间内的学生有( )
A.80名 B.100名 C.120名 D.140名
【答案】B
【分析】先根据频率分布直方图的性质,求得的值,再根据样本中成绩在区间内的频率参赛的人数即可.
【详解】由频率分布直方图可知,解得,
所以成绩在区间内的学生有名.
故选:B.
4.已知甲、乙两名同学在高二的6次数学周测的成绩(单位:分)统计如图,则下列说法不正确的是( )
A.甲成绩的中位数小于乙成绩的中位数
B.若甲、乙成绩的平均数分别为,,则
C.甲成绩的极差小于乙成绩的极差
D.甲成绩比乙成绩稳定
【答案】A
【分析】由折线图甲乙同学成绩的分布情况结合统计相关知识即可作出判断.
【详解】对于A:由折线图可知,甲的中位数大于90,乙同学的中位数小于90,
所以甲的中位数大于乙的中位数,故A错误;
对于B,由折线图可知,甲同学的平均成绩高于乙同学的平均成绩,B正确;
对于C,由折线图可知,甲成绩的极差小于乙成绩的极差,C正确;
对于D,由折线图可知,甲成绩波动性小于乙成绩的波动性,
所以甲成绩比乙成绩稳定,D正确.
故选:A.
二、填空题
5.数据21,19,31,25,28,18,30的极差是 .
【答案】13
【分析】利用极差的定义求解即可.
【详解】数据21,19,31,25,28,18,30的极差是.
故答案为:.
6.某校从参加语言测试的学生中随机抽取了100名,记录了他们的分数,将数据分成6组:,,,,,,并整理得到如下频率分布直方图.若样本中分数低于60分的有15人,则图中数据 .
【答案】
【分析】根据题干先确定分数低于60分的频率,涉及的区间包括两个部分,通过观察直方图列方程组,即可求解.
【详解】样本中分数低于60分的有15人,属于区间,,由于学生中随机抽取了100名,
因此分数在,的频数为,因此这两个区间内的频率和为,
设区间的频率为,则,解得.
故答案为:.
7.某学校组建了演讲,舞蹈,航模,合唱,机器人五个社团,全校所有学生每人都参加且只参加其中一个社团,校团委将统计结果绘制成如下两个不完整的统计图,则合唱社团的人数占全体学生人数的百分比为 .
【答案】
【分析】根据直方图和饼图中数据求总人数,再由合唱社团人数求其百分比即可.
【详解】由统计图知,演讲社团共有50人,占比,则总人数为人,
又合唱社团共有200人,占比为.
故答案为:
8.已知抽样统计甲、乙两位同学8次数学成绩,绘制成如图所示的茎叶图,则成绩更稳定的那位同学成绩的方差为 .
【答案】
【分析】根据题意,由茎叶图分析读出甲乙的成绩,再由方差公式分别计算甲、乙的方差,结合方差的意义分析可得答案.
【详解】根据题意,甲同学的8次成绩依次为:76、77、77、87、89、90、91、93,
其平均数为,
其方差为
乙同学的8次成绩依次为:78、79、88、89、90、91、92、93,
.
则乙同学的成绩较稳定,其方差为.
故答案是:.
9.下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有 (填写序号).
【答案】①②
【分析】本题需要依次判断四个关于统计概念的说法的正误,从而确定错误说法的个数.
【详解】对于①,例如:3,3,3,3,4,4,4,4,1,2,5,有两个众数,故①错误;
对于②,一组数据的方差不一定是正数,也可能为0,故②错误;
对于③,对于方差,一组数据中的每一个数据都加上或减去同一常数后,方差恒不变,故③正确;
对于④,小长方形的长为组距,高为,所以小长方形的面积为:组距频率,故④正确.
故答案为:①②.
10.从某网络平台推荐的影视作品中抽取200部,统计其评分数据,将所得200个评分数据分为6组:,,,,,,并整理得到如下的频率分布直方图:
则评分在区间内的影视作品数量是 部.
【答案】85
【分析】利用频率分布直方图可计算出评分在区间内的频率,进而得到影视作品数量.
【详解】评分在区间内的影视作品数量是部.
故答案为:85.
三、解答题
11.甲、乙两工厂为某公司生产同一款衬衫,质检员在两个工厂各抽查六次进行质检.每次随机抽取件,获得数据后绘制成如图统计图并对数据统计如表,公司规定合格率大于等于视作本次质检通过.
工厂
通过次数(次)
平均数(件)
中位数(件)
众数(件)
甲工厂
乙工厂
(1)求、、、的值.
(2)公司打算从甲、乙两工厂中选择一个继续生产.请你以质检员的身份向公司推荐一家工厂,从多个角度分析数据,简述推荐理由.
【答案】(1),,,
(2)推荐甲工厂,理由见解析
【分析】(1)先由折线图找出甲、乙工厂通过的次数,然后利用平均数的计算方法求出平均数,再对乙工厂的数值进行排列,找到居于中间的两个数求出中位数即可;
(2)根据折线图的走势和中位数、平均数作比较即可进行决策.
【详解】(1)由折线图可以得到甲工厂大于等于的有次,乙工厂大于等于的有次,所以,
甲工厂的平均数为:,所以,
乙工厂排列后居于中间的两个数为、,所以,
因此,,,,.
(2)推荐甲工厂,虽然甲工厂的质检通过次数比乙少一次,但是平均数与乙相同,
中位数、众数均大于乙,并且从折线统计图看,甲工厂在质检中衬衫的合格数量越来越多,而乙越来越少.
12.某校从参加高一年级期末考试的学生中抽出名学生,将其成绩(均为整数)分成六段后,画出如图所示部分频率分布直方图.观察图形,回答下列问题:
(1)求第四小组的频率,并补全这个频率分布直方图;
(2)估计这次考试成绩的中位数(结果取整数值);
【答案】(1)0.3,图象见解析;
(2).
【分析】(1)根据频率分布直方图性质以及矩形面积之和为1计算即可;
(2)利用频率分布直方图求中位数的方法计算可得结果.
【详解】(1)因为各组的频率和等于1,
故第四组的频率:
直方图如右所示.
(2)成绩在的频率为
成绩在的频率为:,
中位数在内,设中位数为,
中位数要平分直方图的面积,
,解得,
即中位数为.
13.为响应国家“体重管理年”三年行动的号召,某单位开展健步走活动,现统计该单位400名员工5月4日至5月10日的步数信息.其中甲、乙两位员工这7天的步数折线图如图1所示:
(1)求从这7天中随机选取一天,该天甲比乙的步数多的概率;
(2)整理这400名员工7天的健步走数据,得到频率分布直方图如图2所示.现将该单位员工每天的步数从多到少进行排名,已知某天甲与乙的步数排名分别为第283名和第130名,试判断这是哪一天的数据,并说明理由.
【答案】(1)
(2)这一天是5月6日的数据
【分析】(1)根据折线图观察,甲比乙的步数多的天数,再根据古典概型概率公式,即可求解;
(2)首先根据频率分布直方图计算每一组的人数,再根据名次判断甲和乙所在的组,根据折线图确定日期.
【详解】(1)由折线图可知,只有第5日和第9日,甲比乙的步数多,
所以从这7天中随机选取一天,该天甲比乙的步数多的概率为;
(2)由频率分布直方图可知,
步数在的有人,
步数在的有人,
步数在的有人,
步数在的有人,
步数在的有人,
步数在的有人,
因为这一天甲的步数的排名是283名,乙的步数排名是130名,
所以甲的步数在区间,乙的步数在区间,
根据折线图可知, 5月6日的数据符合,所以这一天是5月6日.
14.一次体能测试中,体育老师随机抽名学生的成绩(满分100分)进行统计分析,按照,,,,,的分组作出频率分布直方图和频数分布表.
分组
频数
6
6
(1)求的值.
(2)在选取的样本中,从低于60分的学生中随机抽两名学生,问这两名学生的成绩都在内的概率是多少?
(3)若成绩在前20%的学生可获得“体能达人”的称号,问成绩至少要达到多少分才可以获得“体能达人”的称号?
【答案】(1),,
(2)
(3)85分
【分析】(1)利用频率分布直方图的性质得到,进而求出,即可.
(2)结合题意求出基本事件和符合条件的事件,利用古典概型概率公式求解即可.
(3)先确定的所在区间,再结合题意建立方程求解即可.
【详解】(1)因为小长方形面积和为1,
所以,解得,
因为,所以,
所以.
(2)由频数分布表可知,
成绩在,两组中的学生人数分别为3,6,
将成绩在组中的学生记为,
成绩在组中的学生记为,
从这两组学生中随机抽两名学生的情形有,,,,,
,,,,,,
,,,,,
,,,,,
,,,,,,
,,,,,,
,,共36个基本事件,
其中两名学生的成绩都在内的情形有,,,,
,,,,,,,
,,,,共15个基本事件,
即这两名学生的成绩都在内的概率为.
(3)设成绩至少要达到分才可以获得“体能达人”的称号.
因为成绩在内的频率为0.1,
成绩在内的频率为0.2,所以在内,
由,得,
即成绩至少要达到85分才可以获得“体能达人”的称号.
15.某校为了提高学生的反诈骗意识,举办了反诈骗知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值与样本成绩的平均数;
(2)用分层随机抽样的方法从,两个区间共抽取出8名学生,再从这8名学生中随机抽取2名依次进行交流分享,求第二个交流分享的学生成绩在区间的概率;
(3)学校决定从知识竞赛中抽出成绩最好的两个同学甲乙进行现场知识抢答赛,比赛共设三个项目,每个项目胜方得1分,负方得0分,没有平局,三个项目比赛结束后,总得分高的人获得冠军.已知甲在三个项目中获胜的概率分别为,,,各项目的比赛结果相互独立,甲至少得1分的概率是,甲乙两人谁获得最终胜利的可能性大?并说明理由.
【答案】(1),74
(2)
(3)乙最终获胜的可能性大,理由见解析
【分析】(1)由频率之和为1,结合频率分布直方图可得;根据频率分布直方图的平均数的计算公式求解样本成绩的平均数;
(2)根据分层抽样的方法确定从,中抽取的人数,结合古典概型的概率计算公式求解;
(3)根据题意求得,分别求得甲,乙得到2分和3分的概率,即可得到答案.
【详解】(1)由频率之和为1,结合频率分布直方图可得
,解得,
样本成绩的平均数约为.
(2)由频率分布直方图知,样本答卷成绩在,的学生比为,
用分层抽样的方法从在的学生中抽取(人),
从的学生中抽取(人).
从这8名学生中随机抽取2名依次进行交流分享,有种情形,
第一个和第二个交流分享的学生成绩均在区间,有种情形,
第一个交流分享的学生成绩在区间,第二个交流分享的学生成绩在区间,有种情形,
故所求概率为.
(3)乙最终获胜的可能性大.理由如下:
由题意,甲至少得1分的概率是,
可得,其中,解得,
则甲得2分或3分的概率为:
.
所以乙得分为2分或3分的概率为,乙最终获胜的可能性大.
2 / 37
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题1.3 统计图表
教学目标
通过实例分析,体会统计图表的作图步骤,特点和适用范围。
教学重难点
1.了解频率分布直方表和频率分布直方图,茎叶图,散点图的特点(重点)
2.学会读统计图表(重点)
知识点01 频率分布表和频率分布直方图
1.频率分布表的定义
为了直观地表示样本的频率分布情况,通常将样本容量,样本中该事件出现的次数以及相应的频率列在一张表中,这样的表格就叫做频率分布表
一组数据的最大值与最小值的差称为极差,又称全距
每个小组的区间端点之间的距离称为组距.
2.频率分布表的五个特征
(1)样本容量确定组数的取值情况
(2)频率分布表中的分组数据与组数有关,组数的变化可引起频率分布结构的变化
(3)随机性:频率分布表由样本决定,因此会随着样本的改变而改变、
(4)规律性:根据频率趋近于概率的原理,若固定分组数据随着样本容量的增加,频率分布表中的各个频率会稳定于总体分布在相应分组的概率
(5)频率和等于 1.
3.频率分布直方图的画法步骤
(1)求极差
(2)确定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距并且组距应力求“取整”
(3)统计每组的频数及频率
(4)绘制频率分布表.计算各小组的频率,第i组的频率是,作出频率分布表.
(5)画频率分布直方图.其中横轴表示分组,纵轴表示,实际上就是频率分布直方图中各小矩形的高度,它反映了各组样本观测数据的疏密程度
4.绘制频率分布折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.这两个组的频率取值为0,然后从所加的左边的区间的中点(称为组中值)开始,从左至右依次连接各矩形上底边的中点,直至右边所加区间的中点,再将矩形的边去除就可以得到一条折线,称为频率分布折线图,简称频率折线图
知识点02 茎叶图
1.茎叶图的特点和适用范围
(1)特点
①保留原始数据信息:茎叶图能够保留原始数据的所有信息,不会造成数据的丢失
②便于记录和表示:茎叶图可以随时记录和添加数据,方便数据的更新和展示
③直观展示数据分布:茎叶图能够直观地展示数据的分布情况,包括数据的集中趋势和离散程度④适用于两位有效数字的数据:茎叶图最适合表示具有两位有效数字的数据
(2)适用范围
①小样本数据:当样本数据较少时,茎叶图的效果较好,②数据分析:茎叶图是一种有效的探索性数据分析工具,特别适用于初步数据分析阶段
③比较两组数据:茎叶图非常适合用来比较两组数据,
④教学和演示:由于其直观性和简单性,茎叶图在教学和演示中也非常有用.
2 制作茎叶图的步骤
①将数据分为“茎”“叶”两部分;②将最大茎与最小茎之间的数字按由小到大、从上往下写成一列,并画上竖线作为分隔线;③将各个数据的“叶”在分隔线的一侧对应茎处同行列出.
知识点03 散点图
1.散点图的特点和适用范围
(1)特点
①展示相关性:散点图可以直观地呈现两个变量之间的关系
②反映数据分布:通过观察数据点的聚集程度和分布范围,能够对数据的整体特征有初步的了解
③发现异常值:散点图能够快速识别出与其他数据点显著不同的数据点,即异常值,
④灵活性高:在数据可视化方面具有较高的灵活性,可以通过改变数据点的颜色、大小、形状等属性来表示额外的信息或区分不同的数据类别,
⑤适用范围广:既适用于小规模的数据集,以便快速直观地展示数据之间的关系;又能对大规模的数据集很好地发挥作用,帮助人们从海量数据中发现潜在的规律和趋势
(2)适用范围
物理学:散点图可以帮助物理学家直观地观察数据的分布和趋势,从而验证物理定律或发现新的物理现象生物学:可以用散点图来分析生物样本的多个指标之间的关系。
气象学:用于分析气象数据中的变量关系市场营销:企业可以利用散点图分析市场调研数据金融投资:散点图可用于分析股票的收益率与市场指数的关系、投资组合中不同资产的风险和收益关系等人力资源管理:可以用来分析员工的绩效与工作经验、培训时
间等因素之间的关系
临床诊断:在临床诊断中,医生可以利用散点图分析患者的各项生理指标之间的关系,辅助诊断和治疗疾病
2.制作散点图的步骤
在考虑两组数据时,为了对两组数据之间的关系形成大致的了解,通常将这两组数据所对应的点描在平面直角坐标系内,这些点组成的统计图称为散点图
题型01频率分布表和频率分布直方图
【典例1】1.某校学生会随机抽查了本校100名学生的身高(单位:cm),将得到的数据按分为4组,画出如图所示的频率分布直方图,则估计这100名学生中身高低于170cm的人数为( )
A.56 B.52 C.48 D.44
【变式1】某大品牌家电公司从销售员工中随机抽出50名调查销售情况,销售额都在区间(单位:百万元)内,将其分成5组:,,,,,并整理得到如右的频率分布直方图,据此估计销售员工销售额的平均值为 (百万元),(同一组中的数据用该组区间的中点值为代表).
【变式2】某校高二年级半期考试后,为了解本次考试的情况,在整个年级中随机抽取了200名学生的数学成绩,将成绩分为,共6组,得到如图所示的频率分布直方图.
(1)求实数的值.
(2)在样本中,采取按比例分层抽样的方法从成绩在内的学生中抽取13名,问其中成绩在的学生有几名?
(3)根据图中的样本数据,假设同组中每个数据用该组区间的中点值代替,试估计本次考试的平均分.
(1)频率分布直方图中每一组数对应的矩形高度是,而不是。
(2)频率分布直方图优缺点:
频率分布直方图能够很容易地表示大量的数据,非常直观地表明数据分布的状况.但是从频率分布直方图本身得不出原始的数据内容,也就是说,把数据表示成频率分布直方图后,原来的数据信息被抹掉了.
(3)在绘制统计图时还应注意以下几点:
①标题:统计图一般要有标题,用以说明统计图的内容.如果可能的话,列出数据来源;
②坐标的刻度和名称:一般纵轴和横轴也需要有名称,纵轴应清楚地标明刻度,横轴应标明类别或刻度;
③标注:如果要在一张图中呈现多元数据,应使用一些标注来识别单个数据.
题型02茎叶图
【典例2】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数分别是 ( )
A.45,45 B.45,46
C.46,45 D.47,45
【变式2】已知甲、乙两组数据分别为两组学生射击移动靶时的命中率,其茎叶图如图所示.其中,.若这两组数据的中位数相等,平均数也相等,则 .
【变式2】空气质量指数PM2.5(单位:)表示每立方米空气中可吸入肺颗粒物的含量,这个值越高,就代表空气污染越严重:
PM2.5日均浓度
0~35
35~75
75~115
115~150
150~250
250
空气质量级别
一级
二级
三级
四级
五级
六级
空气质量类别
优
良
轻度污染
中度污染
重度污染
严重污染
甲、乙两城市2013年2月份中的15天对空气质量指数PM2.5进行监测,获得PM2.5日均浓度指数数据如茎叶图所示:
(1)根据你所学的统计知识估计甲、乙两城市15天内哪个城市空气质量总体较好?并说明理由.
(2)在15天内任取1天,估计甲、乙两城市空气质量类别均为优或良的概率;
茎叶图将数组中的数按位数进行比较,将数的大小基本不变或变化不大的位数作为一个主干(茎),将变化大的位数作为分枝(叶),列在主干的后面,这样就可以清楚地看到每个主千后面有几个数,每个数具体是多少。茎叶图其实是“侧躺”的直方图!“茎”相当于频数分布表中的分组,“茎”上“叶”的数目相当于频数分布表中指定区间组的频数茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的,茎叶图由所有样本数据构成,没有损失任何样本信息,可以边抽样边记录,适合用于数据量较少的情形;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在抽样完成后才能制作,由于茎叶图记录了所有的样本数据,因此通过茎叶图可以制作频率分布表和频率分布直方图,反之则不可以.
题型03散点图
【典例3】三名工人种植同一种果树,他们在一天中的工作情况如图所示,其中点的横、纵坐标分别为第名工人上午的工作时间和种植的果树数,点的横、纵坐标分别为第名工人下午的工作时间和种植的果树数,.记为第名工人在这一天中平均每小时种植的果树数,则( )
A.,,中最大的是 B.,,中最大的是
C.,,中最大的是 D.,,中最小的是
【变式1】观察下列图形,其中两个变量x、y具有相关关系的图是 .(写出所有满足条件的图形序号)
【变式2】某校高三(1)班的学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间有表格所示的数据.
x/h
24
15
23
19
16
11
20
16
17
13
y/分
92
79
97
89
64
47
83
68
71
59
(1)画出散点图;
(2)判断数学学习的时间与数学平均成绩的关系.
一、单选题
1.已知5对数据的散点图如图,若去掉点,则下列说法正确的是( )
A.变量x与变量y呈正相关 B.变量x与变量y的相关性变强
C.残差平方和变大 D.样本相关系数r变大
2.某中学四位同学利用假期到一贫困村参加社会实践活动,感受年该村精准扶贫及新农村建设的变化.经过实地调查显示,该村年的经济收入增加了一倍.实现翻番,精准扶贫取得惊人成果.为更好地了解该村的经济收入变化情况,为后期精准扶贫方向提供决策参考,四位同学统计了该地区新农村建设前后农村的经济收入构成比例.得到饼图:
四位同学依据上述饼图,分别得出以下四个结论,其中结论中错误的是( )
A.精准扶贫及新农村建设后,种植收入减少
B.精准扶贫及新农村建设后,其他收入增加了一倍以上
C.精准扶贫及新农村建设后,养殖收入增加了一倍
D.精准扶贫及新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
3.某中学举行了一次“网络信息安全”知识竞赛,将参赛的500名学生成绩分为6组,绘制了如图所示的频率分布直方图,则成绩在区间内的学生有( )
A.80名 B.100名 C.120名 D.140名
4.已知甲、乙两名同学在高二的6次数学周测的成绩(单位:分)统计如图,则下列说法不正确的是( )
A.甲成绩的中位数小于乙成绩的中位数
B.若甲、乙成绩的平均数分别为,,则
C.甲成绩的极差小于乙成绩的极差
D.甲成绩比乙成绩稳定
二、填空题
5.数据21,19,31,25,28,18,30的极差是 .
6.某校从参加语言测试的学生中随机抽取了100名,记录了他们的分数,将数据分成6组:,,,,,,并整理得到如下频率分布直方图.若样本中分数低于60分的有15人,则图中数据 .
7.某学校组建了演讲,舞蹈,航模,合唱,机器人五个社团,全校所有学生每人都参加且只参加其中一个社团,校团委将统计结果绘制成如下两个不完整的统计图,则合唱社团的人数占全体学生人数的百分比为 .
8.已知抽样统计甲、乙两位同学8次数学成绩,绘制成如图所示的茎叶图,则成绩更稳定的那位同学成绩的方差为 .
9.下列说法:①一组数据不可能有两个众数;②一组数据的方差必须是正数;③将一组数据中的每一个数据都加上或减去同一常数后,方差恒不变;④在频率分布直方图中,每个小长方形的面积等于相应小组的频率.其中错误的有 (填写序号).
10.从某网络平台推荐的影视作品中抽取200部,统计其评分数据,将所得200个评分数据分为6组:,,,,,,并整理得到如下的频率分布直方图:
则评分在区间内的影视作品数量是 部.
三、解答题
11.甲、乙两工厂为某公司生产同一款衬衫,质检员在两个工厂各抽查六次进行质检.每次随机抽取件,获得数据后绘制成如图统计图并对数据统计如表,公司规定合格率大于等于视作本次质检通过.
工厂
通过次数(次)
平均数(件)
中位数(件)
众数(件)
甲工厂
乙工厂
(1)求、、、的值.
(2)公司打算从甲、乙两工厂中选择一个继续生产.请你以质检员的身份向公司推荐一家工厂,从多个角度分析数据,简述推荐理由.
12.某校从参加高一年级期末考试的学生中抽出名学生,将其成绩(均为整数)分成六段后,画出如图所示部分频率分布直方图.观察图形,回答下列问题:
(1)求第四小组的频率,并补全这个频率分布直方图;
(2)估计这次考试成绩的中位数(结果取整数值);
13.为响应国家“体重管理年”三年行动的号召,某单位开展健步走活动,现统计该单位400名员工5月4日至5月10日的步数信息.其中甲、乙两位员工这7天的步数折线图如图1所示:
(1)求从这7天中随机选取一天,该天甲比乙的步数多的概率;
(2)整理这400名员工7天的健步走数据,得到频率分布直方图如图2所示.现将该单位员工每天的步数从多到少进行排名,已知某天甲与乙的步数排名分别为第283名和第130名,试判断这是哪一天的数据,并说明理由.
14.一次体能测试中,体育老师随机抽名学生的成绩(满分100分)进行统计分析,按照,,,,,的分组作出频率分布直方图和频数分布表.
分组
频数
6
6
(1)求的值.
(2)在选取的样本中,从低于60分的学生中随机抽两名学生,问这两名学生的成绩都在内的概率是多少?
(3)若成绩在前20%的学生可获得“体能达人”的称号,问成绩至少要达到多少分才可以获得“体能达人”的称号?
15.某校为了提高学生的反诈骗意识,举办了反诈骗知识竞赛,从所有答卷中随机抽取100份作为样本,将样本的成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,,,,,得到如图所示的频率分布直方图.
(1)求频率分布直方图中的值与样本成绩的平均数;
(2)用分层随机抽样的方法从,两个区间共抽取出8名学生,再从这8名学生中随机抽取2名依次进行交流分享,求第二个交流分享的学生成绩在区间的概率;
(3)学校决定从知识竞赛中抽出成绩最好的两个同学甲乙进行现场知识抢答赛,比赛共设三个项目,每个项目胜方得1分,负方得0分,没有平局,三个项目比赛结束后,总得分高的人获得冠军.已知甲在三个项目中获胜的概率分别为,,,各项目的比赛结果相互独立,甲至少得1分的概率是,甲乙两人谁获得最终胜利的可能性大?并说明理由.
2 / 37
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$