内容正文:
第四章
数据处理与应用
1、常用表格数据的处理
2、大数据处理
3、大数据典型应用
人生苦短
我用python
学习目标:
1、了解Python常用扩展模块的功能。
2、掌握pandas模块的调用方法、数据结构等基本知识。
3、能使用pandas模块对数据进行编辑、计算和统计分析,并能从中提取有用信息形成结论。
4、掌握matplotlib模块的调用方法和使用matplotlib模块对数据进行可视化的基本方法。
还记得吗?
python模块的导入——import
一个程序中已出现的一个或多个函数或模块,引入到另一个python代码中,从而实现代码的复用。语法如下:
import 模块名
模块名.函数名
from 模块名 import 函数名
python模块的小名儿
import 还有更多详细的用法,主要有以下两种:导入整个模块时,也可以为模块指定别名。
import 模块名1 [as 别名1]…
例如:import sys as s
print(s.argv[0])
from 模块名 import 成员名1 [as 别名1],…
例如:from sys import argv as v
print(v[0])
pandas处理数据
数据处理可以使用现成的软件或平台,也可以通过编写程序实现。Python语言丰富的标准模块和扩展库提供了许多高效灵活的函数,可以帮助我们较好地进行数据整理。
pandas数据结构
1. Series(序列)
Series类似于一维数组,由一个数组的数据和一个与数据关联的索引(index),索引值默认是从0起递增的整数。
from pandas import Series #导入pandas库中Series模块
pds1 = Series([1, 2, 3, 4])
pds1
0 1
1 2
2 3
3 4
左列:index
右列:values
pandas数据结构
通过指定索引的方式
pds2 = Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd'])
pds2
a 1
b 2
c 3
d 4
pandas数据结构