pandas刷题梳理

发布时间 2023-11-14 22:12:26作者: dretrtg
  • drop_duplicates(subset=None, keep='first', inplace=False)
    • subset:用来指定特定的列,默认所有列
    • keep:删除重复项并默认保留first出现的项
  • sort_values(by=[],ascending=[])
    • by:按照特定列排序
    • ascending:默认False降序。True为升序。
  • head(n),tail(n)
    • head:取前n行
    • tail:取倒数n行
  • rename(columns={'':''})给列重命名
  • rank(method='', ascending=[])默认降序排列,排名连续12345
    • method:可取值为‘average’,'first','min','max','dense'
      • first: 两值相同,谁先出现谁序号在前
      • min: 两值相同,取顺序排名中最小的排名作为该值排名12245
      • dense: 相同值序号相同12245
  • DataFrame.index取索引列的值
  • len(DataFrame)取表的行数
  • DataFrame.get(i)取第i行的值
  • pd.DataFrame({'columnName':colName})创建df
  • groupby后agg、lambda、transform、apply(https://blog.csdn.net/shijie97/article/details/100203634)
    • transform:返回与原表等长的列向量
  • Dateoffset(1): 日期偏移函数,代表日期加1天
  • nunique()和unique()
    • nunique()返回不同值的个数
    • unique()去重返回