pandas学习

发布时间 2023-11-28 19:15:15作者: 乐池

1. Series类型

Series类型由一组数据及与之相关的数据索引组成

也可以自定义索引:

1.1 初始化

从标量创建:

从字典创建:

从ndarray类型创建:

1.2 基本操作

Series类型包括index和values两部分。

Series类型的操作类似ndarray类型

Series类型的操作类似Python字典类型
可以使用inget等方法

1.3 对齐操作

Series类型在运算中会自动对产不同索引的数据。当多个series对象之间进行运算的时候,如果不同series之间具有不同的索引值,那么运算会自动对齐不同索引值的数据,如果某个series没有某个索引值,那么最终结果会赋值为NaN。

1.4 name属性

Series对象和索引都可以有一个名字,存储在属性.name中

1.5 修改

Series对象可以随时修改并即刻生效

2. DataFrame类型

DataFrame类型由共用相同索引的一组列组成
DataFrame是一个表格型的数据类型,每列值类型可以不同
DataFrame既有行索引、也有列索引
DataFrame常用于表达二维数据,但可以表达多维数据。

2.1 初始化

从二维ndarray对象创建

从一维ndarray对象字典创建

从列表类型的字典创建

例:

上例中,若要取出某行某列

3. 数据类型操作

3.1 重新索引

.reindex()能够改变或重排Series和DataFrame索引

.reindex(index=None,columns=None,...)的参数

例如新增一列:

3.2 索引类型

索引类型的常用方法

例:删除一列,添加一行c0,且由c1填充而来

3.3 删除指定索引对象

.drop()能够删除Series和DataFrame指定行或列索引
默认修改0轴元素,如果有要求可使用axis=某数