内容正文:
4.3大数据典型应用(教学设计)
年级
高一
授课时间
课题
4.3大数据典型应用
教学
目标
1.了解大数据典型应用智能交通和电子商务
(学科核心素养:信息意识)
2. 能够对获取的大数据采用恰当的数据处理技术进行分析
(学科核心素养:信息意识、计算思维)
3.能够灵活运用数据分析的结果进行科学的决策,提升利用数字化工具解决实际问题的能力。(学科核心素养:信息意识、数字化学习与创新)
教学
重难点
重点:能够对获取的大数据采用恰当的数据处理技术进行分析
难点:能够灵活运用数据分析的结果进行科学的决策,提升利用数字化工具解决实际问题的能力。
教学
准备
多媒体网络教室 ppt教学课件 学习资源包、学习任务单
教学过程
教师活动
学生活动
新
课
导
入
情景导入:播放视频生活中的大数据的典型应用
同学们,结合视频和我们实际的生活可以发现大数据广泛应用于金融、交通、环境、医疗、能源、农业等行业,极大地促进了各行业的发展。本节以智能交通和电子商务为例进行分析。
新 知 讲 授
任务一:了解智能交通
1. 了解智能交通
小组为单位,上网查阅近30年间火车票样式及购票方式的变化。
火车票样式变化:
从上世纪50年代到90年代,在将近四十年的时间里,买票的途径主要是火车站的售票窗口。
在没有计算机、没有网络的年代,买票就必须到车站售票窗口。
排队那是一定的,至于排队时间长短,那要看运气了,如果赶上春运或节假日,通常运气就不起作用了。
90年代开始,计算机和局域网开始在铁路系统应用,铁路售票技术上得以提升。1996年开始,铁路部门在各主要干线大站开始建设电子售票网,也就是今天中国铁路客票发售与预订系统的前身。
1998年5月,原铁道部发布《铁路客运售票代理试行办法》,决定改革售票管理体制,通过计算机网络开展客运售票代理试点。
至此开始,火车代售点出现了,一时间遍布城市大街小巷。
代售点买票加收5元手续费,还有发票,再无其他额外收费。
12306,开启互联网售票时代2010年1月20日,12306开始试运行,试点通过互联网进行售票。2011年的春运首日正式运营,开启了网络售票的新时代。
现如今,铁路部门推出的网络订购火车票服务,让人们通过个人计算机、智能手机就能随时随地查看火车车次和购票;民航提供的网络订票、在线值机等服务,让出行者可以便捷地查看航班动态、购票值机;智能公交系统,让人们没出家门就知道即将乘坐的公交车到哪儿了、何时进站。人们的日常出行越来越离不开导航系统、打车软件。
2. 了解智能交通背后的工作原理
智能交通将数据通信传输技术、电子控制技术、计算机处理技术等应用于交通运输行业,通过对交通数据的实时采集、传输和处理,借助各种科技手段和设备,对交通情况进行协调和处理,从而使交通设施得以充分利用,提高交通效率和安全性,最终使交通运输服务和管理智能化。
智能交通整合了物联网、大数据、云计算、人工智能等技术,其基本架构如图4.3.1 所示。GPS、卡口、视频检测、浮动车、地感线圈等产生的交通流监测数据、视频监控数
据、系统数据、服务数据等构筑了交通大数据。交通数据采集的广度、深度和数据量随着 智能交通的发展不断扩大,数据贯穿在智能交通的感知、处理、应用等各个环节。交通大
数据是智能交通中“智能”的基础。
云计算使千亿数据的检索实现了秒级返回,为大数据的分析应用提供了速度保障。基 于深度学习的智能分析算法,为大数据的分析应用提供了有力的支撑。交通大数据的分
析,为交通管理、规划、决策、服务和主动安全防范等提供了更加有效的支持。 智能交通主要通过交通信息服务、交通管理、公共交通、车辆控制、货运管理、电子 收费、紧急救援等服务子系统为用户提供服务。以下简要介绍其中的三个子系统。
(1)交通信息服务系统
交通信息服务系统建立在完善的信息采集、处理和传输系统上。交通参与者通过安
装在道路、车上、换乘站、停车场以及气象中心等地的传感器和传输设备,向交通信息
中心提供各地的实时交通数据。交通信息服务系统获得这些数据,经过处理后,实时向
交通参与者提供道路交通、公共交通、换乘、交通气象、停车场等出行相关信息,并能
根据车辆目的地、行驶习惯、路面情况推荐行驶路线。出行者可以根据这些信息确定出
行方式和路线。
(2)交通管理系统
交通管理系统主要提供给交通管理者使用,用于检测、控制和管理公路交通,在道
路、车辆和驾驶员之间提供通信联系。它与交通信息服务系统共用信息采集、处理和传输
系统。交通管理系统对道路系统中的交通状况、交通事故、气象状况和交通环境等进行监
视,获得实时交通数据,利用大数据技术辅以智能研判,对交通进行优化调控,如优化红绿灯配时,实时发布诱导信息,及时进行道路管制、事故处理与救援等。
(3)电子收费系统
电子收费系统通过安装在车辆挡风玻璃上的车载器与收费站电子收费系统车道上的微波天线之间的微波专用短程通信,利用计算机联网技术与银行进行后台结算处理,使车辆通过路桥收费站时不需要停车即可交费。同时所交纳的费用经过后台处理后直接清分给相关的收益业主。在现有的车道上安装电子收费系统,可以使车道的通行能力大大提高。
3.以小组为单位讨论智能交通为人们的出行提供了哪些便利并进行班级分享?
(1)在出行规划方面,通过智能交通系统提供的实时路况信息,人们能提前了解道路拥堵情况,从而合理规划出行路线,选择畅通的道路,节省出行时间。
(2)对于公共交通出行者,智能公交系统可实时告知公交的位置、预计到站时间等,让乘客能精准掌握乘车时机,减少等待焦虑。而且智能交通有助于优化公共交通线路布局,使其更加科学合理,提升出行效率。
(3)在停车方面,智能停车引导系统能帮助车主快速找到附近的空闲停车位,避免盲目寻找车位而浪费大量时间,尤其在城市繁华地段,这一优势更为明显。
总之,智能交通利用先进的技术手段,全方位提升了人们出行的便捷性、舒适性和时效性。
任务二:了解电子商务
1. 了解电子商务
电子商务企业利用电子设备和网络技术进行商务活动。大型电商企业拥有大量用户数据,同时,在交易、营销、供应链、仓储、配送和售后等环节也产生了大量数据。这些数据通过电商企业的数据平台,为其电子商务平台上的商户和客户提供精准营销、供应链管理、智能网站等多种数据服务。
(1)精准营销
精准营销基于用户购买行为的大数据,使用推荐算法深度挖掘出用户的行为偏好,智能地向用户展示符合其兴趣偏好和购买意图的商品,实现个性化推荐,帮助用户快速地找到所需商品,提高网购效率。精准营销的主要方式是网站推荐、短信等。
(2)供应链管理
在仓储管理中,根据商品的销售情况和市场预期数据,依靠预测模型,在库存量达到某一个阈值时自动生成订单发给供货商,实现了商品自动补货。在物流配送领域,供应链管理通过分析物流人员、仓库以及用户之间的地理关系数据,为物流人员提供最优配送路径,提高配送速度,提升用户体验。
(3)智能网站
基于大数据挖掘和分析,网站变得越来越智慧。例如,牙膏等商品具有被重复购买的特点,购买之后会在可预期的一段时间内用完。通过分析用户两次购买此类商品的平均时间,在下一次购买时间到来之前,推荐系统向用户推介相应的商品,提升用户的体验,提高商品的转化率。
2. 以小组为单位思考如何实现出租车轨迹可视化分析?
实践内容:对采集到的出租车轨迹数据进行可视化分析。
python 代码:
import matplotlib.pyplot as plt
def plot_file(file):
#绘制每个文件的GPS坐标轨迹
jd = []
#经度
wd = []
#纬度
for line in open(file):
#切分行数据
splitline = line.split(',')
#取轨迹坐标
x = float(splitline[4])
y = float(splitline[5])
jd.append(x)
wd.append(y)
plt.plot(jd,wd)
#画点
filename = 'xyz.txt'
plot_file(filename)
plt.show()
备注:文件路径根据实际进行调整。
3. 自主利用网络资源,列举3种以上智能交通中用于采集交通数据的设备,指出它们可以采集的数据。
设备
采集的数据
交通监控摄像头
车辆行驶状态数据:能够实时捕捉道路上车辆的行驶速度、行驶方向等信息、车流量数据、交通事件数据:如交通事故、道路施工等情况。
电子不停车收费系统(ETC)
车辆身份信息、车辆通行时间和地点数据
车载终端设备(如行车记录仪、车载 OBD 设备等)
车辆自身运行数据:车载 OBD 设备可以实时获取车辆的发动机转速、车速、油耗、故障码等信息,反映车辆自身的运行状况。驾驶行为数据,可以推断出驾驶员的一些驾驶行为,如急加速、急刹车、长时间怠速等情况。
任务三:综合实践
现有50亿个32位正整数存储在文本文件intfile.txt中,每行1个数字。 若内存限制为4GB,如何采用分治思想找出这些数的中位数?写出你的思路。
整体思路:
由于内存有限,无法一次性将所有数据读入内存进行排序然后直接获取中位数。所以采用分治策略,将数据分成多个小部分,分别处理这些小部分,然后逐步合并信息以确定中位数。
具体步骤:
1. 数据分组:将 50 亿个 32 位正整数的文本文件 intfile.txt 按照一定的行数划分成多个小文件。设将其分成 N 个小文件,分别记为 file1.txt, file2.txt, …, fileN.txt。
2. 对每个小文件排序
依次读取每个小文件(如 file1.txt)到内存中(因为经过分组后每个小文件的数据量在内存可处理范围内),使用合适的排序算法(如快速排序、归并排序等)对其内部的整数进行排序。排序完成后,将排序后的结果覆盖写回原小文件。
3. 确定每个小文件的中位数:对于已经排序好的每个小文件(如 file1.txt),其数据是有序的,根据中位数的定义,如果小文件中有 M 个数字,当 M 为奇数时,中位数就是第 (M + 1) / 2 个数字;当 M 为偶数时,中位数是第 M / 2 个数字与第 (M / 2 + 1) 个数字的平均值。分别计算出每个小文件的中位数,记为 median1, median2, …, medianN。
4. 找出所有小文件中位数的中位数:将 N 个小文件的中位(median1, median2, …, medianN)收集起来,再次使用合适的排序算法对这些中位数进行排序,然后找出排序后的中位数,记为 global_median。
5. 基于全局中位数划分数据
再次遍历原始的大文本文件 intfile.txt,将每个数字与 global_median 进行比较:如果数字小于 global_median,则将其放入一个新的临时文件 less_than_median.txt 中。如果数字大于 global_median,则将其放入另一个新的临时文件 greater_than_median.txt 中。
6. 确定最终中位数所在范围:统计 less_than_median.txt 和 greater_than_median.txt 中数字的个数,分别记为 count_less 和 count_greater。如果 count_less 等于 count_greater,那么 global_median 就是这 50 亿个数字的中位数。如果 count_less 大于 count_greater,说明中位数在 less_than_median.txt 中,并且我们知道了中位数在该文件中的大致位置(因为前面已经确定了整体数字与 global_median 的大小关系划分),此时可对 less_than_median.txt 重复上述步骤(分组、排序、找中位数等),进一步缩小范围找到最终的中位数。反之,如果 count_greater 大于 count_less,则中位数在 greater_than_median.txt 中,同样对 greater_than_median.txt 重复上述步骤来确定最终的中位数。
通过这样不断地分治、比较和缩小范围,最终可以在内存限制为 4GB 的情况下找出 50 亿个 32 位正整数的中位数。
课
堂
练
习
1.下列关于大数据在教育领域的应用,正确的是( )。
A. 仅用于统计学生的考试成绩
B. 可以通过分析学生的学习行为数据,提供个性化学习方案
C. 用于改变学校教学楼的建筑外观设计
D. 主要用来计算教师的教学课时数
答案:B
解析:大数据在教育领域的应用远不止于统计学生的考试成绩,还包括对学生学习过程中诸多行为数据的分析等更广泛的应用。通过收集和分析学生的在线学习记录、课堂表现、作业完成情况等大量学习行为数据,可以深入了解每个学生的学习特点和需求,从而为其提供个性化学习方案,这是大数据在教育领域很重要的应用之一。改变学校教学楼的建筑外观设计主要涉及建筑设计专业知识和审美等方面,与大数据对教育相关数据的分析应用毫无关系。计算教师的教学课时数是一个较为简单的管理任务,通常依据学校的教学安排和考勤记录等即可完成,并非大数据在教育领域的典型应用。
(2)大数据在能源领域的典型应用不包括( )
A. 能源消费预测以优化能源分配
B. 电网故障诊断与预测维护
C. 设计新型能源开采设备的外形
D. 分析能源使用效率以制定节能策略
答案:C
解析:设计新型能源开采设备的外形主要涉及机械设计、工业设计等专业领域的知识和技能,重点在于设备的物理结构、外观造型等方面,与大数据对能源相关数据的分析处理应用没有直接关系,所以不属于大数据在能源领域的典型应用。
课
堂
小
结
1. 学生思考并总结分享本节课收获,各同学之间互相补充。
2.教师出示本节课思维导图,回顾本节课所学知识
本节课思维导图如下:
作
业
设
计
1.完成分层作业。
2.尝试简述数据可视化的作用,并通过实例进行说明,形成报告。
反
思
评
价
在本次教学中,在讲解大数据典型应用时,我引入了众多来自不同领域的实际案例,如金融领域、医疗领域、交通领域的流量监测与拥堵预测等。注重知识关联,尽管案例丰富,但对于一些复杂的大数据应用案例,在讲解过程中可能只是停留在表面,没有深入剖析其背后所涉及的算法、模型以及数据处理流程等核心技术细节。
原创精品资源学科网独家享有版权,侵权必究!
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$