内容正文:
4.1常用表格数据的处理(教学设计)
年级
高一
授课时间
课题
4.1常用表格数据的处理
教学
目标
1.了解数据整理的必要性(学科核心素养:信息意识)
2.能够利用exlce电子表格对数据进行简单处理(学科核心素养:信息意识、计算思维)
3.能够根据实际问题,选择恰当的数据处理和统计分析工具整理数据,提升利用数字化工具解决实际问题的能力,进而提升信息技术学科素养。(学科核心素养:信息意识、数字化学习与创新)
教学
重难点
重点:掌握常用数据处理和统计分析工具的常见使用方法。
难点:能够根据实际问题,选择恰当的数据处理和统计分析工具整理数据,提升利用数字化工具解决实际问题的能力。
教学
准备
多媒体网络教室 ppt教学课件 学习资源包、学习任务单
教学过程
教师活动
学生活动
新
课
导
入
情景导入:图片展示生活中常见的电子表格
师:这些基于表格的数据常常需要进行计算、排序、筛选、图表呈现等处理。
数据处理的核心是数据,数据的质量直接影响数据分析的结果。但获取的数据并不都是优质的,常常存在缺失、重复、错误、数量级不同等问题。因此,在数据分析和数据挖掘前,通常先对数据进行整理。
新 知 讲 授
任务一: 了解数据整理
数据整理的目的是检测和修正错漏的数据、整合数据资源、规整数据格式、提高数据质量。
1. 结合案例分析常见的数据问题有哪些?
案例1:
在这个电子表格中,不同的订单记录出现了不同字段的数据缺失情况。比如订单 2001 票价缺失,订单 2002 出发地缺失,订单 2003 购票日期缺失,订单 2004 座位类型缺失,订单 2005 票价缺失。
案例2:
客户 A 在 2024 年 10 月 1 日购买产品 X 的记录出现了重复,客户 B 在 2024 年 10 月 2 日购买产品 Y 的记录也出现了重复。这种重复可能是由于数据录入错误或者系统故障等原因导致的。
案例3:
在这个电子表格中,日期和出发地、目的地的格式都不统一。日期有不同的表示方法,出发地和目的地也有大小写不一致的情况。这种格式不统一可能会给数据的处理和分析带来困难。
总结:常见的数据问题有数据缺失、数据重复、数据异常,还有逻辑错误、格式不一致等。
2.自主思考如何处理不同类型的数据问题,并填写下表。
常见数据问题
数据问题
处理方法
数据缺失
根据数据间的关联性估计较准确的缺失值,并通过合适的方法对缺失值进行填充。通常采用平均值、中间值或概率统计值来填充缺失值。
数据重复
对于重复数据,可以在进一步审核的基础上进行合并或删除等处理。
数据异常
格式不一
不同来源的数据可能存在格式不一致的情况,这就需要进行数据转换,以便形成一个适合后续分析和挖掘的描述形式。数据转换通常包括属性数据类型的转换、根据已有属性集构造新属性的转换、将不同来源的相同属性的定义及其值进行统一标准化表达的转换等。
3.以小组为单位,讨论分析两个不同来源的数据集A、B如图4.1.1、4.1.2所示。若要合并这两个数据集以对比分析两个球员的技术情况,将遇到哪些问题?该如何处理?
遇到的问题:字段不一致;
解决方法:对照两个表格,保持其中一个表格一个,更改其中一个字段,然后更改一致即可
任务二:了解常见的数据处理和统计分析工具详细内容见图1
1. 自主借助网络资源,上网查询总结常见的数据处理和统计分析工具,并班内分享。
spss
SPSS是IBM公司推出的一款统计分析软件,具备数据收集、准备、分析、描述、解释和展现的功能。SPSS提供丰富的统计算法,并且操作简便、功能强大、扩展性强,但需要使用人员具备一定的数理统计学知识背景,比较适合专业分析、研究等人员使用。
sas
SAS是SAS软件研究所开发的一套大型集成应用软件系统,共有三十多个功能模块,具
有数据访问、数据管理、数据分析、数据呈现等功能。SAS系统从大型机上的系统发展而来,
其操作以编程为主。系统地学习和掌握SAS,需要花费一定的精力,比较适合统计专业人员
使用。
MATLAB
MATLAB是MathWorks公司推出的一种科学计算语言和编程环境,主要应用于数据分
析、无线通信、深度学习、计算机视觉、量化金融与风险管理等领域。MATLAB 将适合迭代
分析和设计过程的桌面环境与直接表达矩阵和数组运算的编程语言相结合,为分析数据、开
发算法和创建模型等提供了便于探索和发现的环境,深受工程师和科学家的青睐。
EXCLE
Excel软件是微软公司推出的Microsoft Office系列套装软件中的组成部分,是一个简单易
用的电子表格软件,可以进行数据的处理、统计分析和辅助决策操作,广泛应用于文秘办公、
财务管理、市场营销、行政管理和协同办公等。
2. 新知讲授——excle中数据计算方法。
数据计算方法:在Excel软件中,可以应用公式进行数据的计算。公式是以“=”开头,由常数、函数、单元格引用和运算符组成的式子。公式不仅用于计算,更重要的是构建计算模型。
单元格引用是指对工作表中的单元格或单元格区域的引用。默认情况下,单元格引用是相对的,如A1 ;单元格绝对引用,如$A$1 ;连续的单元格区域引用,如A2:D5 ;不连续的单元格区域引用,如A2:A5,D2:D5。
算术运算符有^、%、*、/、+、-,用于进行基本的数学运算。比较运算符有=、>、<、>=、<=、<>,用于比较两个值,结果为逻辑值TRUE 或 FALSE。文本连接运算符“&”,可以连接一个或多个文本字符串,生成一段文本。
函数是预定义的公式,通过使用参数按特定顺序或结构进行计算。求和、平均值、最大值、最小值的函数语法如下:
SUM(number1,[number2],...) 求参数的和
AVERAGE(number1,[number2],...) 求参数的平均值
MIN(number1,[number2],...) 返回参数列表中的最小值
MAX(number1,[number2],...) 返回参数列表中的最大值
3.以小组为单位,使用使用Excel软件进行数据计算
已知某球员的各赛季数据如图4.1.3所示,使用Excel软件统计其各赛季场均情况。
分析图表:
(1)数据采用电子表格格式组织和存储,表中数据包含了赛季、球队、出场、投篮、三分等数据。各项场均与各项总计、出场次数的关系为:各项场均=各项总计/出场次数。
(2)
计算各赛季场均篮板、助攻、抢断、盖帽、得分
①在O3单元格中输入公式 =G3/$C3。
②拖曳“填充柄”自动填充公式到R16单元格,完成各赛季场均篮板、助攻、抢断、盖帽的计算。
③在S3单元格中输入公式=M3/C3,自动填充至S16单元格,完成各赛季场均得分的计算。查看、分析计算结果,观察数据表中的数据,重点检查各赛季场均数据的计算是否正确、完整。通过分析各赛季比赛的场均数据,可以了解该球员在各赛季比赛中的技术发挥和表现情况。
4.思考:在公式填充过程中,公式中的相对引用和绝对引用有何区别?
相对引用在公式复制时会随位置变化而改变,如 A1。绝对引用则无论公式复制到何处都保持不变,用$A$1 表示。相对引用适用于规律变化的数据处理,绝对引用常用于固定引用特定单元格值,正确选择可提高数据处理效率和准确性。
5.小试牛刀:根据上面关于excle中数据计算的方法,尝试完成下面的练习。
(1)在 Excel 中,以下哪个不是公式的组成部分?
A. 运算符
B. 函数
C. 图表
D. 单元格引用
答案:C。
解析:Excel 公式由运算符、函数、单元格引用等组成。图表是一种数据可视化的方式,不是公式的组成部分。
(2)在 Excel 中,A1 单元格的值为 5,B1 单元格的公式为 =A1*2,将 B1 单元格的公式复制到 B2 单元格,此时 B2 单元格的公式变为( )。
A. =A2*2
B. =A1*2
C. =B1*2
D. =$A$1*2
答案:A。
解析:因为 B1 单元格的公式是相对引用,复制到 B2 单元格后,会根据相对位置自动调整为引用 A2 单元格,所以公式变为 =A2*2。
任务三:了解不同类型的图表
(1) 自主利用数字化工具,获取生活中常见的图表及特点、适用范围,并填写下表,班内分享。
常见的图表
柱形图
特点:可以直观地比较不同类别数据的大小。柱子的高度清晰地展示了数值的差异,适合用于展示数据的分布和对比情况。适用场景:常用于比较不同项目的数值大小,如不同月份的销售额、不同部门的业绩等。
折线图
特点:主要用于展示数据随时间或其他连续变量的变化趋势。通过线条的连接,能够清晰地看出数据的连续变化情况,对于观察数据的波动和趋势非常有效。适用场景:适合展示股票价格走势、销售业绩随时间的变化等。
饼图
特点:能够直观地显示各部分数据在总体中所占的比例关系。整个圆形代表总体,各个扇形部分代表不同的分类,扇形的大小与该分类所占比例相对应。适用场景:常用于展示市场份额、预算分配等占比情况。
散点图
特点:用于展示两个变量之间的关系。每个数据点在图表中的位置由两个变量的值决定,可以通过观察数据点的分布来判断变量之间的相关性。适用场景:例如研究身高与体重的关系、广告投入与销售额的关系等。
雷达图
特点:可以同时展示多个变量的数据,将各个变量的值绘制在从同一个中心点出发的轴线上,形成一个多边形。通过比较不同多边形的形状和大小,可以直观地看出不同对象在多个变量上的表现。适用场景:常用于综合评估多个指标,如对不同运动员的各项能力进行评估。
气泡图
特点:在散点图的基础上增加了第三个变量,用气泡的大小来表示。可以同时展示三个变量之间的关系,使数据更加直观和丰富。适用场景:例如分析不同产品的销售数量、价格和利润之间的关系。
(2) 实践出真知:以小组为单位,讨论分析并解决下面问题:
2012~2016年部分省(区、市)国内生产总值的数据(单位:亿元)如图4.1.4所示,使用Excel软件创建图表,分析和展现2012~2016年北京市、天津市、上海市三地国内生产总值的变化情况。
具体分析步骤:
(1)分析数据,数据以电子表格的形式进行组织和存储,其中,2012~2016年北京市、天津市、上海市三地国内生产总值的数据包含时间趋势和大小比较的两层关系,因此图表类型可以选用折线图。
(2)创建图表
①选择要在图表中展示的数据区域A2:F4,A10:F10。
②单击“插入”选项卡上的“插入折线图或面积图”按钮,选择“折线图”,生成的折线图如图4.1.5所示
③使用图表右上角附近的“图表元素”按钮,可添加坐标轴标题和数据标签等图表元素,使用“图表样式”按钮可自定义图表的外观,使用“图表筛选器”按钮可更改图表中显示的数据。另外,选中图表,使用“设计”和“格式”选项卡可自定义图表的外观,美化图表.
检查图表:查看图表中数据的展现是否完整,将鼠标移到折线相应的数据点上,查看数据卡显示的数据与表格中的数据是否一致。观察折线的走势,发现北京市、天津市、上海市三地国内生产总值在2012~2016年间一直呈上升趋势。
总结:不同情况使用的图表各不相同,要具体情况具体分析。
课
堂
练
习
(1)公式 “=SUM (A1:A5)” 中的 SUM 是( )
A. 运算符
B. 单元格引用
C. 函数
D. 常量
答案:C。
解析:SUM 是 Excel 中的一个函数,用于对指定范围内的数值进行求和。
(2)以下图表中,能够同时展示三个变量关系的是?
A. 漏斗图
B. 三维柱状图
C. 散点图
D. 箱线图
答案:C。
解析:散点图可以通过两个坐标轴展示两个变量,再通过点的大小、颜色等属性展示第三个变量,从而能够同时展示三个变量的关系。漏斗图主要用于展示业务流程中的转化情况;三维柱状图主要是在三维空间展示数据,但不太容易同时展示三个变量;箱线图主要用于展示数据的分布情况。
课
堂
小
结
1. 学生思考并总结分享本节课收获,各同学之间互相补充。
2.教师出示本节课思维导图,回顾本节课所学知识
本节课思维导图如下:
作
业
设
计
1.完成分层作业。
2.浏览各省(区、市)统计局、国家统计局、国家数据等网站的数据,收集你感兴趣的数据,使用Excel软件进行分析。(分析建议可参考课本121页表格内容)
反
思
评
价
在本次教学中,基本达成了预设的教学目标。学生们掌握了表格数据的输入、编辑、格式化等基本操作,能够运用公式和函数进行简单的数据计算,也学会了对表格数据进行排序和筛选等常见处理方法。通过实际案例的操作练习,学生们在实践中加深了对知识的理解和掌握,提高了实际应用能力。大部分学生能够独立完成给定的任务,并在过程中积极思考、主动探索,表现出了较强的学习积极性和主动性。
原创精品资源学科网独家享有版权,侵权必究!
学科网(北京)股份有限公司
学科网(北京)股份有限公司
$$