20230805 Datawhale第一次直播笔记

发布时间 2023-08-05 20:06:23作者: zzqDeco

机器学习上分技巧

内容解析

subtask是并列的,并且取最优,那么只需要针对最优进行优化

转化为回归问题是否会更加准确

数据分析和特征工程是非常关键的部分

数据探索性分析(EDA):

  1. 数据集大小,字段类型
  2. 缺失值情况
  3. 特征是否冗余
  4. 是否存在时间信息
  5. 标签的分布
  6. 训练集测试集的分布
  7. 单变量/多变量分布

特征工程

  1. 过滤法
  2. 封装法
  3. 嵌入法

模型融合

交叉

权重选择