一、修改列名
1. 全部修改
- 直接以属性赋值的方式,一次将全部的列名进行重新定义
data.columns = ['city','name','post','pay','request','number']
df.columns的附加用法
df.columns = df.columns.str.strip()
df.columns = df.columns.str.replace(str1, str2)
- 另一种全部修改的方式
df=df.set_axis(['股票代码','收盘价','成交量','日期'],axis='columns')
这个数据框本来的四列名称就会变为你的上面的列表,当然要按照顺序传入。
2. 针对性修改
- 用rename()方法进行修改
data.rename(columns={'城市': 'city','公司名称': 'name'}, inplace=True)
二、换顺序
有时候我的数据框名称都是对的,可是他们顺序不是我想要的顺序怎么办。在excel里面我们选中这一列然后拖动就行,pandas里面可以这样:
df=df.reindex(columns=['股票代码','日期','收盘价','成交量'])
这样就把日期这一列从最后移到了第2列上了。
三、指定位置插入列
指定位置插入就在后面一列点一个右键然后插入一列就行,pandas里面可以这样:
df.insert(1,'时间',df_month['月份'])
上述代码表示我对df这个数据框的第1列(从第0列开始)插入了一个名称为‘时间’的一列数据,数据值为df_month['月份']这一列,当然也可以传入列表或者np数组。
目前感觉对列名称的操作常用的是这些方法。 还有其他的方法欢迎补充