3.1分类算法之sklean转换器和预估器

发布时间 2023-06-10 13:57:44作者: 哎呦哎(iui)

1.转换器

**想一下之前做的特征工程的步骤?
1、实例化 (实例化的是一个转换器类(Transformer))
2、调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)
**

标准化:
(x-mean)/std
fit_transform()
	fit()  计算每一列的平均值
	transform() (x-mean)/std 进行最终的转换

我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式
fit_transform
fit
transform

2.估计器

在sklearn中,估计器(estimator)是一个重要的角色,是一类实现了算法的API
1、用于分类的估计器:
sklearn.neighbors k-近邻算法
sklearn.naive_bayes 贝叶斯
sklearn.linear_model.LogisticRegression 逻辑回归
sklearn.tree 决策树与随机森林
2、用于回归的估计器:
sklearn.linear_model.LinearRegression 线性回归
sklearn.linear_model.Ridge 岭回归
3、用于无监督学习的估计器
sklearn.cluster.KMeans 聚类

通用流程:


预估器(estimator)
1.实例化一个estimator
2.estimator.fit(x_train,y_train) 计算
   --调用完毕,模型生成
3.模型评估:
   1)直接比对真实值和预测值
     y_predict=estimator.predict(x_test)#测试集
     y_test== y_predict
   2)计算准确率
     accuracy=estimator.score(x_test,y_test)