【MT】Data anlysis

发布时间 2023-08-27 11:03:42作者: TangBao~

1 Pretreatment

  • 缺失&异常
  • 散点图

2 Anlaysis

  2.1 Normal test

    2.2.1 描述性统计/图示

    直方/Quantile-quantile plot

    2.2.2 code

gg <- ggplot(data = smp, mapping = aes(sample = norm)) +
    stat_qq_band() +
    stat_qq_line() +
    stat_qq_point() +
    labs(x = "Theoretical Quantiles", y = "Sample Quantiles")
gg

 

  2.2 Regression

    2.2.1 一元

    $x,y$必须连续,$y$或其残差必须服从正态分布

    2.2.2 多元

    $x,y$必须连续,$y$或其残差必须服从正态分布

3 Model

  3.1 分类

    分类模型:决策树,朴素贝叶斯分类,支持向量机(SVM),最近领分类(KNN)
    聚类模型:K-Means
    关联分析:Apriori
    连接模型:PageRank  

  3.2 评价

    层次分析法、灰色关联度分析、神经网络综合评价法

  3.3 预测

    朴素估计、简单平均、滑动平均、简单指数平滑