内容正文:
3. 2 分布式计算
第三章
数据初步分析
章节导读
3.1平均数
3.2 中位数与众数
3.3离差平方和与方差
3.4四分位数与箱线图
中位数与众数
离差平方和与方差
四分位数
箱线图
算术平均数与加权平均数
分布式计算
离差平方和的应用
学 习 目 标
1
2
3
知道计算加权平均数的分布式计算方法;
知道样本与总体的关系,会用样本平均数来估计总体平均数;
进一步了解算术平均数与加权平均数的实际应用.
复习回顾
算术平均数与加权平均数的计算方法:
算术平均数: ;
加权平均数:
回顾训练
4
新知探究
为了解初中生的数学学习情况,对甲、乙、丙三所学校八年级学生的数学学习情况进行抽样调查,调查问卷内容分“问题解决能力”和“数学学习兴趣”两部分。汇总三所学校上报的数据后,制作了如下的统计表3-2,表3-3表中有部分数据空缺)。
合作学习
5
新知探究
问题(1)抽取的所有学生中,“问题解决能力”的平均得分是多少?能根据三所样本学校上报的数据得到吗?如果能,请说明计算方法,并将算得的结果填入表中
合作学习
解:(1).
85
应该用加权平均数来计算样本全体的平均得分。可以将甲、乙、丙的样本人数看成平均得分的权(即该分数出现的次数)
6
新知探究
问题(2)抽取的所有学生中,能根据三所学校上报的数据求得“数学学习兴趣”低、较低、较高、高的百分比吗?如果能,请说明计算方法,并将算得的结果填入表中
合作学习
解:
应该用加权平均数来计算,先算出各兴趣等级的总人数,再计算样本全体的百分比
解:
7
新知探究
问题(2)抽取的所有学生中,能根据三所学校上报的数据求得“数学学习兴趣”低、较低、较高、高的百分比吗?如果能,请说明计算方法,并将算得的结果填入表中
合作学习
解:
解:
14.17%
8
归纳总结
分布式计算
将一个大的计算任务分解成若干个小的计算任务分别计算,再将结果汇总处理得到最终结果,这样的计算方式称为分布式计算。
生活实际中,当样本容量较大时,我们可以把样本分成若干个子样本,分别统计出平均数,然后运用计算加权平均数的方法,求出整个样本数据的平均数。
优点:(1)可以节约整体计算时间,提高计算效率;
(2)可以减少大量数据传输和存储带来的时间、经济成本。在大数据处理中有广泛应用。
典例分析
例1 某教育咨询公司有两个网站,3月份这两个网站的日均活跃人数分别为人和人,日人均活跃时间分别为1.8小时和2小时。这两个网站所有用户的日人均活跃时间为 小时。(P65)
解::计算总活跃时长
分布式计算
:计算总活跃人数
:计算人均活跃时间
10
典例分析
例2 电视台开展最喜爱的节目评选活动,观众通过移动端和PC端两个途径参与投票,其中一个节目在移动端的得票率为85%,在PC端的得票率为90%。已知参与移动端和PC端投票的观众分别为15000人和25000人,那么该节目在本次评选活动中的总得票率是多少? (P65)
解::计算移动端和PC端的总得票数
分布式计算
:计算总投票人数
:计算总得票率
11
新知探究
身体质量指数(BMI)是国际常用的衡量人体胖瘦程度以及是否健康的一个指标。中国人正常的 BMI 范围是18.5~24,小于18.5 为体重过低,大于等于24且小于 28为超重,大于等于28为肥胖。陈老师组织同学开展本校八年级学生身体质量指数调研,分 6 组进行抽样调查,各组获得BMI数据如下:
第一组:16.26,18.20,18.94,19.29,20.22,21.01,22.39,24.64。
第二组:17.28,19.45,19.84,20.26,21.36,22.89,24.66。
第三组:18.20,19.59,20.01,20.22,20.26,20.81,21.54,22.11,25.35。
第四组:18.82,19.12,20.28,21.03,21.41,21.49,21.55,21.70,23.59,26.23。
分布式计算的应用
12
新知探究
第五组:18.70,19.79,20.79,21.52,22.05,22.67,23.11,23.24,23.84,24.33。
第六组:18.96,19.60,20.42,21.58,23.63,24.29。
(1)分别求各组 BMI数据的平均数,以及体重过低、体重正常、体重超重和肥胖的人数所占的百分比。
(2)利用(1)中获得的结果,计算所抽取样本的 BMI数据的平均数、不同BMI范围的人数所占的百分比(精确到1%),并对该校八年级学生的胖瘦情况作简要分析。
分布式计算的应用
13
新知探究
(1)分别求各组 BMI数据的平均数,以及体重过低、体重正常、体重超重和肥胖的人数所占的百分比。
分布式计算的应用
解:各组数据的平均数、不同BMI范围的人数所占的百分比如下表:
组别 数据个数 BMI平均数 不同BMI范围的人数所占的百分比
<18.5 18.5~24 24~28 ≥28
第一组 8 20.12 25% 62.5% 12.5% 0
第二组 7 20.82 14.3% 71.4% 14.3% 0
第三组 9 20.90 11.1% 77.8% 11.1% 0
第四组 10 21.52 0 90% 10% 0
第五组 10 22.00 0 90% 10% 0
第六组 6 21.41 0 83.3% 16.7% 0
用“~”表示的范围中,含前一边界值,不含后一边界值。如
14
新知探究
(2)利用(1)中获得的结果,计算所抽取样本的BMI 数据的平均数、不 同 BMI 范围的人数所占的百分比(精确到1%),并对该校八年级学生的胖瘦 情况作简要分析。
分布式计算的应用
解:6个小组共50个数据,利用平均数的分布式计算,可得: BMI的平均数为
BMI小于18.5的百分比为
BMI 在18.5~24的百分比为
BMI 在24~28的百分比为
BMI 大于等于28的百分比为0。
15
新知探究
身体质量指数(BMI)是国际常用的衡量人体胖瘦程度以及是否健康的一个指标。中国人正常的 BMI 范围是18.5~24,小于18.5 为体重过低,大于等于24且小于 28为超重,大于等于28为肥胖。
分布式计算的应用
该校八年级学生BMI 的平均数约为21.17,所以该校八年级学生的平均 BMI 在正常范围内.
约有80%的学生体重正常,没有肥胖学生;但约有 8%的学生体重过低,约12%的学生超重。
16
随堂练习
基础过关(P67)
1.一连锁超市有甲、乙、丙三家分店,某天的销售记录显示,甲店名顾客中,手机支付占88%;乙店名顾客中,手机支付占85%;丙店名顾客中,手机支付占92%。该连锁超市这一天的顾客中,手机支付的比例是 。
解::计算各店手机支付的总数
:计算总顾客数
:计算手机支付比例
随堂练习
基础过关(P67)
2.在某次网上阅卷任务中,系统自动分发试卷给三名老师,并实时动态显示各老师已阅试卷的份数和平均得分。某题满分10分,在某一时刻,三名老师已阅试卷分数和该题的平均得分如右表。在该时刻,已阅试卷中这道题的平均得分为 。
解::计算总得分
:计算总阅卷份数
:计算平均得分
随堂练习
能力提升
3.某中学举办跳绳比赛,七、八两个年级的学生参加,平均成绩分别为138次/分、142次/分.若七、八年级参加比赛的学生人数分别为40,30,则所有参赛学生的平均成绩约为 ( C )
A. 139次/分 B. 142次/分
C. 140次/分 D. 138次/分
C
随堂练习
能力提升
4.某社区组织垃圾分类知识竞赛活动,A,B两个小区的居民参与,A小区的平均成绩为88分,B小区的平均成绩为95分.若A,B两个小区参与活动的居民人数之比为5∶4,则所有参与竞赛的居民的平均成绩约为( A )
A. 91分
B. 92分
C. 89分
D. 93.5分
A
课堂小结
分布式计算
利用分布式计算平均数
利用分布式计算所占百分比
感谢聆听!
$