内容正文:
专题9.3 统计案例 公司员工的肥胖情况调查分析
教学目标
1.掌握统计案例分析的完整流程,明确统计分析报告的核心组成部分(标题、前言、主体、结尾),理解分层随机抽样在实际调查中的应用逻辑。
2.能根据BMI数据特征,选择合适的统计图表(频率分布直方图为主)进行数据可视化描述,熟练计算样本的平均数、中位数、方差、标准差等数字特征。
3.理解分层随机抽样下总体平均数与方差的合成公式,能通过样本数据估计总体的肥胖分布规律,区分偏瘦、正常、偏胖、肥胖的BMI分类标准。
教学重难点
1.重点
分层随机抽样的特点及总体平均数、方差的合成计算,能通过样本数据合理推断总体情况。2.难点
将统计分析结果转化为具有可行性的建议,实现“数据分析—结论推断—实践指导”的闭环,提升知识应用的深度与实用性。
知识点 统计报告的主要组成部分
1、标题.
2、前言:简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.
3、主题:展示数据分析的全过程;首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图标描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体.
4、结尾:对主题部分的内容进行概括,结合控制体重的一般方法,提出控制公司员工体重的建议.
【即学即练】
1.对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.
分组
频数
频率
10
0.25
24
n
m
p
2
0.05
合计
M
1
(1)求表中M、p及图中a的值;
(2)若该校高三年级学生有240人,试估计该校高三年级学生参加社区服务的次数在区间上的人数;
(3)估计这次学生参加社区服务次数的众数、中位数以及平均数.(结果精确到0.01)
【答案】(1),,
(2)60
(3)众,数17.50,中位17.08,平均数17.25
【分析】(1)由分组上的频数是10,频率是0.25,求得,根据频数之和为,求得和的值,进而求得的值;
(2)因为该校高三年级学生有人,在上的频率是,即可求得该校高三年级学生参加社区服务的次数在此区间上的人数;
(3)根据众数、中位数和平均数的计算方法,即可求解.
【详解】(1)解:由分组上的频数是,频率是,可得,解得,
因为频数之和为,所以,解得,所以.
因为a是对应分组的频率与组距的商,所以.
(2)解:因为该校高三年级学生有人,在上的频率是,
所以估计该校高三年级学生参加社区服务的次数在此区间上的人数力.
(3)解:估计这次学生参加社区服务次数的众数是.
因为,又且,所以中位数在区间上.
因为中位数及前面的数的频率之和为0.5,设样本中位数为x,
则,解得.
估计这次学生参加社区服务次数的中位数是17.08.
样本平均数是,
估计这次学生参加社区服务次数的平均数是17.25.
2.某装修公司为了解客户对照明系统的需求,对照明系统的两种设计方案在稳固性、创新性、外观造型、做工用料以及成本五个方面的满意度评分进行统计,根据统计结果绘制出如图所示的雷达图,则下列说法错误的是( )
A.客户对两种设计方案在外观造型上没有分歧
B.客户对设计一的满意度的总得分高于设计二的满意度的总得分
C.客户对设计二在创新性方面的满意度高于设计一在创新性方面的满意度
D.客户对两种设计方案在稳固性和做工用料方面的满意度相同
【答案】ACD
【分析】通过阅读雷达图,找到其对应的数据,转化成熟悉的表格即可.
【详解】根据雷达图可列表如下:
评分类别
稳固性
创新性
外观造型
做工用料
成本
设计一得分
分
分
分
分
分
设计二得分
分
分
分
分
分
根据表格分析可得A、C、D错误,选项B正确.
故选:ACD.
题型 由统计信息解决实际问题
【典例1】某单位工会有500位会员,利用“健步行”开展全员参与的“健步走奖励”活动.假设通过简单随机抽样,获得了50位会员5月10日的走步数据如下:(单位:万步)
1.1 1.4 1.3 1.6 0.3 1.6 0.9 1.4 1.4 0.9
1.4 1.2 1.5 1.6 0.9 1.2 1.2 0.5 0.8 1.0
1.4 0.6 1.0 1.1 0.6 0.8 0.9 0.8 1.1 0.4
0.8 1.4 1.6 1.2 1.0 0.6 1.5 1.6 0.90.7
1.3 1.1 0.8 1.0 1.2 0.6 0.5 0.2 0.8 1.4
频率分布表:
分组
频数
频率
2
0.04
0.06
5
0.10
11
0.22
8
0.16
7
0.14
合计
50
1.00
频率分布直方图:
(1)写出,,的值;
(2)①绘制频率分布直方图;
②假设同一组中的每个数据可用该组区间的中点值代替,试估计该单位所有会员当日步数的平均值;
(3)根据以上50个样本数据,估计这组数据的第70百分位数.你认为如果定1.3万步为健步走获奖标准,一定能保证该单位至少的工会会员当日走步获得奖励吗?说明理由.
【答案】(1),,;(2)①答案见解析;②1.088万步;(3)能,答案见解析.
【分析】(1)根据频率之和为,由题中条件列出方程求解,即可得出,由样本容量及对应区间的频率,即可得出,;
(2)①由题中数据,直接完善频率分布直方图;
②由每组的中间值乘以该组的频率,再求和,即可得出平均数;
(3)根据题中条件,可直接得出分位数;进而可得出万时,能满足题意.
【详解】(1)因为,
∴,
∴,
因为样本中共50 人,
∴,,
∴,,.
(2)①频率分布直方图如下图所示
②设平均值为,则有
,
则该单位所有会员当日步数的平均值为1.088万步.
(3)∵,∴分位数为第35和36个数的平均数,
∵共有14人,且1.3有2个,∴ 第35和第36个数均为1.3,∴分位数为1.3,
设为会员步数,则万时,人数不少于,∴ 能保证的工会会员获得奖励.
用样本的标准差、方差估计总体的方法
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
(2)标准差、方差的取值范围是.
(3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
【变式1】某初级中学正在开展“文明城市创建人人参与,志愿服务我当先行”的创文活动.为了了解该校志愿者参与服务的情况,现对该校全体志愿者进行随机抽样调查.根据调查数据绘制了不完整统计图(如图),条形统计图中七年级、八年级、九年级、教师分别指七年级、八年级、九年级、教师志愿者中被抽到的志愿者,扇形统计图中的百分数指的是该年级被抽到的志愿者人数与样本容量的百分比.
(1)请补全条形统计图.
(2)请你求出扇形统计图中教师所对应的扇形的圆心角的度数.
(3)若该校共有志愿者人,则该校七年级大约有多少名志愿者?
【答案】(1)条形统计图见解析;(2);(3)名.
【分析】(1)本题首先可根据题意求出样本容量、八年级志愿者被抽到的人数以及九年级志愿者被抽到的人数,然后补全条形统计图即可;
(2)可根据教师志愿者被抽到的人数所占百分比求出对应的圆心角的度数;
(3)可通过总人数以及七年级志愿者所占比例得出结果.
【详解】(1)由题意知样本容量为,则八年级志愿者被抽到的人数为,
九年级志愿者被抽到的人数为,
补全条形统计图如下:
(2)
因为教师志愿者被抽到的人数所占百分比为,
所以对应的扇形的圆心角的度数为.
(3)(名),该校七年级大约有240名志愿者.
【变式2】某校为了解全校高中学生五一假期参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示.
(1)求这100名学生中参加实践活动时间在6~10小时的人数;
(2)估计这100名学生参加实践活动时间的众数、中位数和平均数.
【答案】(1)58;(2)众数7,中位数7.2,平均数7.16
【解析】(1)求出参加实践活动时间在6~10小时的人所占的频率,再求解人数即可.
(2)根据最高矩形底边中点的横坐标计算众数,利用中位数左右两边的频率均为0.5以及平均数的算法求解即可.
【详解】(1),即这100名学生中参加实践活动时间在6~10小时的人数为58.
(2)由频率分布直方图可以看出,最高矩形底边中点的横坐标为7,故这100名学生参加实践活动时间的众数的估计值为7小时.; ,中位数t满足.由,得 ,即这100名学生参加实践活动时间的中位数的估计值为2小时.
由,解得 .
这100名学生参加实践活动时间的平均数的估计值为
(小时)
【变式3】2018年北京市进行人口抽样调查,随机抽取了某区居民13289人,记录他们的年龄(单位:岁),将数据分成10组:, , ,…,,并整理得到如下频率分布直方图:
(1)估计该区居民年龄的中位数(精确到0.1);
(2)假设同组中的每个数据用该组区间的中点值代替,估计该区居民的平均年龄.
【答案】(1)43.6(2)44岁
【解析】(1)年龄在的累计频率为,由此能估计该区居民年龄的中位数.
(2)利用频率分布直方图能求出该区居民的平均年龄.
【详解】解: (1)年龄在的频率为,
,所以估计中位数为.
(2)估计该区居民的平均年龄为
(岁)
1.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
【答案】(1)众数为,中位数为; (2).
【分析】(1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,即可得出众数,利用中位数的两边频率相等,即可求得中位数;
(2)利用各小组底边的中点值乘以对应的频率求和,即可求得成绩的平均值.
【详解】(1)用频率分布直方图中最高矩形所在的区间的中点值作为众数的近似值,得出众数为,
又因为第一个小矩形的面积为,
设第二个小矩形底边的一部分长为,则,解得,所以中位数为.
(2)依题意,利用平均数的计算公式,
可得平均成绩为:,
所以参赛学生的平均成绩为分.
2.如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是
A.12.5;12.5 B.13;13 C.13;12.5 D.12.5;13
【答案】D
【详解】分析:根据频率分布直方图中众数与中位数的定义和计算方法,即可求解频率分布直方图的众数与中位数的值.
详解:由题意,频率分布直方图中最高矩形的底边的中点的横坐标为数据的众数,
所以中间一个矩形最该,故数据的众数为,
而中位数是把频率分布直方图分成两个面积相等部分的平行于轴的直线横坐标,
第一个矩形的面积为,第二个矩形的面积为,故将第二个矩形分成即可,
所以中位数是,故选D.
点睛:本题主要考查了频率分布直方图的中位数与众数的求解,其中频率分布直方图中小矩形的面积等于对应的概率,且各个小矩形的面积之和为1是解答的关键,着重考查了推理与计算能力.
3.一个样本a,3,4,5,6的平均数是b,且不等式x2-6x+c<0的解集为(a,b),则这个样本的标准差是( )
A.1 B.
C. D.2
【答案】B
【详解】由题意得a+3+4+5+6=5b,a+b=6,
解得a=2,b=4,所以样本方差s2=[(2-4)2+(3-4)2+(4-4)2+(5-4)2+(6-4)2]=2,所以标准差为 .
故答案为B.
4.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a,中位数为b,众数为c,则a、b、c从小到大的关系依次是
【答案】.
【详解】分析:将数据由小到大排列好,根据众数,中位数,平均数的概念得到相应的数据即可.
详解:根据提干得到中位数为b=15,众数为c=17,平均数为=a.
故 .
故答案为.
5.甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表,某同学根据表中数据分析得出的结论正确的是( )
班级
参加人数
中位数
方差
平均数
甲
55
149
191
135
乙
55
151
110
135
A.甲、乙两班学生成绩的平均数相同
B.甲班的成绩波动比乙班的成绩波动大
C.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
D.甲班成绩的众数小于乙班成绩的众数
【答案】ABC
【解析】根据图表直接计算平均数、方差和众数与甲、乙两班学生每分钟输入汉字数≥150个的人数分析即可.
【详解】甲、乙两班学生成绩的平均数都是35,故两班成绩的平均数相同,A正确;,甲班成绩不如乙班稳定,即甲班的成绩波动较大,B正确.
甲、乙两班人数相同,但甲班的中位数为149,乙班的中位数为151,从而易知乙班不少于150个的人数要多于甲班,C正确;由题表看不出两班学生成绩的众数,D错误.
故选:ABC
2 / 20
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$
专题9.3 统计案例 公司员工的肥胖情况调查分析
教学目标
1.掌握统计案例分析的完整流程,明确统计分析报告的核心组成部分(标题、前言、主体、结尾),理解分层随机抽样在实际调查中的应用逻辑。
2.能根据BMI数据特征,选择合适的统计图表(频率分布直方图为主)进行数据可视化描述,熟练计算样本的平均数、中位数、方差、标准差等数字特征。
3.理解分层随机抽样下总体平均数与方差的合成公式,能通过样本数据估计总体的肥胖分布规律,区分偏瘦、正常、偏胖、肥胖的BMI分类标准。
教学重难点
1.重点
分层随机抽样的特点及总体平均数、方差的合成计算,能通过样本数据合理推断总体情况。2.难点
将统计分析结果转化为具有可行性的建议,实现“数据分析—结论推断—实践指导”的闭环,提升知识应用的深度与实用性。
知识点 统计报告的主要组成部分
1、标题.
2、前言:简单交代调查的目的、方法、范围等背景情况,使读者了解调查的基本情况.
3、主题:展示数据分析的全过程;首先要明确所关心的问题是什么,说明数据蕴含的信息;根据数据分析的需要,说明如何选择合适的图标描述和表达数据;从样本数据中提取能刻画其特征的量,如均值、方差等,用于比较男、女员工在肥胖状况上的差异;通过样本估计总体的统计规律,分析公司员工胖瘦程度的整体.
4、结尾:对主题部分的内容进行概括,结合控制体重的一般方法,提出控制公司员工体重的建议.
【即学即练】
1.对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.
分组
频数
频率
10
0.25
24
n
m
p
2
0.05
合计
M
1
(1)求表中M、p及图中a的值;
(2)若该校高三年级学生有240人,试估计该校高三年级学生参加社区服务的次数在区间上的人数;
(3)估计这次学生参加社区服务次数的众数、中位数以及平均数.(结果精确到0.01)
2.某装修公司为了解客户对照明系统的需求,对照明系统的两种设计方案在稳固性、创新性、外观造型、做工用料以及成本五个方面的满意度评分进行统计,根据统计结果绘制出如图所示的雷达图,则下列说法错误的是( )
A.客户对两种设计方案在外观造型上没有分歧
B.客户对设计一的满意度的总得分高于设计二的满意度的总得分
C.客户对设计二在创新性方面的满意度高于设计一在创新性方面的满意度
D.客户对两种设计方案在稳固性和做工用料方面的满意度相同
题型 由统计信息解决实际问题
【典例1】某单位工会有500位会员,利用“健步行”开展全员参与的“健步走奖励”活动.假设通过简单随机抽样,获得了50位会员5月10日的走步数据如下:(单位:万步)
1.1 1.4 1.3 1.6 0.3 1.6 0.9 1.4 1.4 0.9
1.4 1.2 1.5 1.6 0.9 1.2 1.2 0.5 0.8 1.0
1.4 0.6 1.0 1.1 0.6 0.8 0.9 0.8 1.1 0.4
0.8 1.4 1.6 1.2 1.0 0.6 1.5 1.6 0.90.7
1.3 1.1 0.8 1.0 1.2 0.6 0.5 0.2 0.8 1.4
频率分布表:
分组
频数
频率
2
0.04
0.06
5
0.10
11
0.22
8
0.16
7
0.14
合计
50
1.00
频率分布直方图:
(1)写出,,的值;
(2)①绘制频率分布直方图;
②假设同一组中的每个数据可用该组区间的中点值代替,试估计该单位所有会员当日步数的平均值;
(3)根据以上50个样本数据,估计这组数据的第70百分位数.你认为如果定1.3万步为健步走获奖标准,一定能保证该单位至少的工会会员当日走步获得奖励吗?说明理由.
用样本的标准差、方差估计总体的方法
(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据的平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.
(2)标准差、方差的取值范围是.
(3)因为标准差与原始数据的单位相同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.
【变式1】某初级中学正在开展“文明城市创建人人参与,志愿服务我当先行”的创文活动.为了了解该校志愿者参与服务的情况,现对该校全体志愿者进行随机抽样调查.根据调查数据绘制了不完整统计图(如图),条形统计图中七年级、八年级、九年级、教师分别指七年级、八年级、九年级、教师志愿者中被抽到的志愿者,扇形统计图中的百分数指的是该年级被抽到的志愿者人数与样本容量的百分比.
(1)请补全条形统计图.
(2)请你求出扇形统计图中教师所对应的扇形的圆心角的度数.
(3)若该校共有志愿者人,则该校七年级大约有多少名志愿者?
【变式2】某校为了解全校高中学生五一假期参加实践活动的情况,抽查了100名学生,统计他们假期参加实践活动的时间,绘成的频率分布直方图如图所示.
(1)求这100名学生中参加实践活动时间在6~10小时的人数;
(2)估计这100名学生参加实践活动时间的众数、中位数和平均数.
【变式3】2018年北京市进行人口抽样调查,随机抽取了某区居民13289人,记录他们的年龄(单位:岁),将数据分成10组:, , ,…,,并整理得到如下频率分布直方图:
(1)估计该区居民年龄的中位数(精确到0.1);
(2)假设同组中的每个数据用该组区间的中点值代替,估计该区居民的平均年龄.
1.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30,0.40,0.15,0.10,0.05.
求:(1)高一参赛学生的成绩的众数、中位数;
(2)高一参赛学生的平均成绩.
2.如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是
A.12.5;12.5 B.13;13 C.13;12.5 D.12.5;13
3.一个样本a,3,4,5,6的平均数是b,且不等式x2-6x+c<0的解集为(a,b),则这个样本的标准差是( )
A.1 B.
C. D.2
4.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a,中位数为b,众数为c,则a、b、c从小到大的关系依次是
5.甲、乙两班举行电脑汉字录入比赛,参赛学生每分钟录入汉字的个数经统计计算后填入下表,某同学根据表中数据分析得出的结论正确的是( )
班级
参加人数
中位数
方差
平均数
甲
55
149
191
135
乙
55
151
110
135
A.甲、乙两班学生成绩的平均数相同
B.甲班的成绩波动比乙班的成绩波动大
C.乙班优秀的人数多于甲班优秀的人数(每分钟输入汉字数≥150个为优秀)
D.甲班成绩的众数小于乙班成绩的众数
2 / 20
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$