修改Pandas数据表的列名

发布时间 2023-05-06 11:30:24作者: 木凌云

一、修改列名

1. 全部修改

  • 直接以属性赋值的方式,一次将全部的列名进行重新定义
data.columns = ['city','name','post','pay','request','number']

df.columns的附加用法

df.columns = df.columns.str.strip()
df.columns = df.columns.str.replace(str1, str2)
  • 另一种全部修改的方式
df=df.set_axis(['股票代码','收盘价','成交量','日期'],axis='columns')

这个数据框本来的四列名称就会变为你的上面的列表,当然要按照顺序传入。

2. 针对性修改

  • 用rename()方法进行修改
data.rename(columns={'城市': 'city','公司名称': 'name'}, inplace=True)

二、换顺序

有时候我的数据框名称都是对的,可是他们顺序不是我想要的顺序怎么办。在excel里面我们选中这一列然后拖动就行,pandas里面可以这样:

df=df.reindex(columns=['股票代码','日期','收盘价','成交量'])

这样就把日期这一列从最后移到了第2列上了。

三、指定位置插入列

指定位置插入就在后面一列点一个右键然后插入一列就行,pandas里面可以这样:

df.insert(1,'时间',df_month['月份']) 

上述代码表示我对df这个数据框的第1列(从第0列开始)插入了一个名称为‘时间’的一列数据,数据值为df_month['月份']这一列,当然也可以传入列表或者np数组。

目前感觉对列名称的操作常用的是这些方法。 还有其他的方法欢迎补充