内容正文:
2019沪教版高中信息技术——选择性必修3《数据管理与分析》
项目六 分析城市交通拥堵状况
——了解常用的数据分析方法(二)
学习目标:
· 掌握常用的数据分析方法。
· 了解不同数据分析方法的区别。
· 根据具体问题选用合适的方法进行数据分析。
教学重点难点:
重点:常用的数据分析方法,包括平均分析法、分组分析法、对比分析法及相关分析法。
难点:分组分析法中分组的确定,相关分析法中的相关系数的计算。
教学准备:
软硬件环境:计算机教室、Anaconda
教学素材:某市交通轨迹点数据,网上书店数据集。
教学过程:
教学环节
导案
学案
设计意图
新课导入
思考:
上节课我们学习了平均分析法和分组分析法,这两种方法的概念是什么?除了这两种方法还有什么别的分析方法?
引入对比分析法。
倾听、思考、回答
了解项目任务。
了解城市道路交通拥堵状况
3、对比分析法
对比分析法也称比较分析法,是自然科学、社会科学及日常用的分析方法之一。特点:通过准确、量化数据,直观地反映实物某方面的变化或差距。
两种形式:横向比较和纵向比较
横向比较是同一时期对不同实物机型比较。
纵向分析是在不同时期对同一事物进行比较。
4、相关分析法
相关分析是研究现象之间相关关系的规律,并据此进行预测和控制的方法。
各因素之间的相关性可以分为三种类型:
单相关:指两个因素之间的相关关系,即研究时只涉及一个自变量和一个因变量。
复相关:指三个或三个以上因素的相关关系,即研究时涉及两个及两个以上的自变量和因变量。
偏相关,指在某一现象与多种现象相关的场合,当嘉定其他变量不变时,其中两个变量之间的相关关系。
相关系数用来描述两个因素之间的相关性程度,常用字母“r”表示。常用的有pearson相关系数,计算方式为:
相关系数的取值范围在﹣1和1之间,即﹣1≤ r ≤1。其中:
●若0< r ≤1,表明变量之间存在正相关关系,即两个变量的变动方向相同;
●若﹣1≤ r <0,表明变量之间存在负相关关系,即两个变量的变动方向相反;
●若lrl=1,其中一个变量的取值完全取决于另一个变量,两者为函数关系;当 r =时,表明变量之间完全正相关;当 r =﹣时,表明变量之间完全负相关;
●若 r =0,表明变量之间不存在线性相关关系,但并不排除变量之间存在非线性相关关系。
运行程序,用平均分析法分析车辆行驶情况。
根据经验,可将变量之间的相关程度分为以下儿种情况:
●若以≥0.8,视为高度相关;
●若0.5≤ Irl <0.8,视为中度相关;
●若0.3≤ H <0.5,视为低度相关;
●若 I <0.3,表明变量之间的相关程度极弱,可视为不相关。
掌握数据分析的概念,以及平均分析法、分组分析法的使用。
思考与讨论
组织学生交流如何使用定位数据即使算两个或多个连续点之间的车辆形式速度,分析TSI对交通出行的意义。
完成教材P58的思考与讨论。
1、行驶速度=距离/时间
时间可以使用时间戳之差计算,已知经纬度求两地距。高可以使用 geopy 库的方法,示例程序如下:
from geopy . distance import geodesic
newport _ ri =(41.49008,-71.312796)
cleveland _ oh =(41.499498,-81.695391)
print ( geodesic ( newport _ ri , cleveland _ oh ). km )
纬度取值[-90,90]
2、TSI (交通状态指数)基本计算模型以道路行驶速度为核心计算参数,取值介于0至100之间。若 TSI 计算结果小于0,则 TSI 取0。数值越大,表示道路交通状态越差(越拥堵);数值越小,表示道路交通状态越好(越畅通)。
(1) TSI 表征了当前车速偏离自由流车速的相对程度,是一种相对感受指标。(2) TSI 值的大小体现了道路对象的整体拥挤程度或舒适程度。
(3) TSI 消除了快速路、地面道路因道路等级因素带来的绝对车速差异影响,买现了对不同路网对象的统一评价。
(4) TSI 概念简单,便于各类人群理解和接受。人们可以选择 TS 小的道路出行。
培养学生的思考问题与解决问题的能力。
完成活动6.1或6.2
引导学生完成活动6.1:
利用配套资源提供的某市交通轨迹点数据采集,使用平均分析法与分组分析法,分析静安寺商圈在某一周末不同时间段的车辆数量变化情况。
引导学生完成活动6.2:
利用配套资源提供的网上书店数据集,使用分组分析法,探讨不同地区人群的读书习惯。
编写程序,分析某一周末不同时间段的车辆数量变化情况。
编写程序,分析网上书店不同地区人群的读书习惯。
培养学生的动手实践能力,进一步掌握平均分析法