3.2.2数据整理 课件 2021—2022人教中图版(2019)高中信息技术必修1

2021-12-30
| 23页
| 1757人阅读
| 543人下载
普通

资源信息

学段 高中
学科 信息技术
教材版本 高中信息技术人教/中图版必修1 数据与计算
年级 高一
章节 3.2.2 数据整理
类型 课件
知识点 -
使用场景 同步教学
学年 2021-2022
地区(省份) 全国
地区(市) -
地区(区县) -
文件格式 PPTX
文件大小 2.88 MB
发布时间 2021-12-30
更新时间 2021-12-30
作者 xkw_057035942
品牌系列 -
审核时间 2021-12-30
下载链接 https://m.zxxk.com/soft/31996030.html
价格 0.00储值(1储值=1元)
来源 学科网

内容正文:

1 3.2.2 数据整理 3.2.2 数据整理 @ 导入 上节课我们已经知道怎么利用网络爬虫采集网上的数据了,本节课是对所采集的数据做进一步整理。 首先我们回顾一下网络爬虫的使用。思考:我们得到的数据怎么使用?是直接使用还是加工后使用? 3.2.2 数据整理 @ 数据整理 1.数据整理含义及基本保存格式 2.pandas简介与安装 3.pandas实例操作 4.数据保存方式 数据整理含义及基本保存格式 3.2.2 数据整理 @ 数据整理含义 数据整理的目的是对数据进行校验和标准化。采集到的数据可能是非标准化的、不完整或重复的。通常,将这样的数据形象地称作“脏数据”。而用于分析的数据必须保证数据质量,即保证数据的完整性、统一性和准确性。完整性是指数据不能有缺失,统一性要求数据符合统一的标准,准确性即数据不能有错误。 数据整理就是通过去重、补漏和勘误等方法,删除重复数据、补全缺失数据和校正错误数据,并对数据进行统一性和标准化处理,以确保数据是相关和准确的,从而将“脏数据”变为“清洁数据”。 3.2.2 数据整理 @ 数据整理基本保存格式 采集到的数据通常保存为文本文件、CSV 文件、Excel 文件或其他类型的文件。其中,CSV 文件将数据表格存储为纯文本,每一行代表一条数据,每条数据包含了一个或由逗号分隔的多个值。 pandas简介与安装 3.2.2 数据整理 @ pandas简介 pandas 是Python的一个数据分析库。 pandas最初是被作为金融数据分析工具而开发出来的,它提供了许多高效易用的数据分析工具和适合科学计算的数据结构,使得处理更加简洁,同时在处理速度上也做了不少优化。 调用pandas库可实现数据查找、删除、排序和索引等功能。 3.2.2 数据整理 @ Series: 一维数组,与Numpy中的一维数组类似,与Python中的基本数据结构list也很相近。它能保存不同数据类型的数据,包括字符串、布尔值和数字等。 TimeSeries: 以时间为索引的Series。 DataFrame: 二维表格型数据结构,可以将DataFrame理解为Series的容器。 Panel : 三维数组,可以理解为DataFrame的容器。 pandas数据结构 3.2

资源预览图

3.2.2数据整理 课件 2021—2022人教中图版(2019)高中信息技术必修1
1
3.2.2数据整理 课件 2021—2022人教中图版(2019)高中信息技术必修1
2
3.2.2数据整理 课件 2021—2022人教中图版(2019)高中信息技术必修1
3
3.2.2数据整理 课件 2021—2022人教中图版(2019)高中信息技术必修1
4
3.2.2数据整理 课件 2021—2022人教中图版(2019)高中信息技术必修1
5
3.2.2数据整理 课件 2021—2022人教中图版(2019)高中信息技术必修1
6
相关资源
由于学科网是一个信息分享及获取的平台,不确保部分用户上传资料的 来源及知识产权归属。如您发现相关资料侵犯您的合法权益,请联系学科网,我们核实后将及时进行处理。