pandas刷题梳理-526互联

drop_duplicates(subset=None, keep='first', inplace=False)
- subset:用来指定特定的列，默认所有列
- keep:删除重复项并默认保留first出现的项
sort_values(by=[],ascending=[])
- by:按照特定列排序
- ascending:默认False降序。True为升序。
head(n),tail(n)
- head:取前n行
- tail:取倒数n行
rename(columns={'':''})给列重命名
rank(method='', ascending=[])默认降序排列，排名连续12345
- method:可取值为‘average’,'first','min','max','dense'
  - first: 两值相同，谁先出现谁序号在前
  - min: 两值相同，取顺序排名中最小的排名作为该值排名12245
  - dense: 相同值序号相同12245
DataFrame.index取索引列的值
len(DataFrame)取表的行数
DataFrame.get(i)取第i行的值
pd.DataFrame({'columnName':colName})创建df
groupby后agg、lambda、transform、apply(https://blog.csdn.net/shijie97/article/details/100203634)
- transform:返回与原表等长的列向量
Dateoffset(1): 日期偏移函数，代表日期加1天
nunique()和unique()
- nunique()返回不同值的个数
- unique()去重返回