scikit-526互联

【scikit-learn基础】--『监督学习』之支持向量机分类

支持向量机也是一种既可以处理分类问题，也可以处理回归问题的算法。关于支持向量机在回归问题上的应用，请参考：TODO 支持向量机分类广泛应用于图像识别、文本分类、生物信息学（例如基因分类）、手写数字识别等领域。 1. 算法概述支持向量机的主要思想是找到一个超平面，将不同类别的样本最大化地分隔开。超平 ......

向量 scikit-learn 基础 scikit learn更新时间 2024-01-12

【scikit-learn基础】--『监督学习』之随机森林分类

随机森林分类算法是一种基于集成学习（ensemble learning）的机器学习算法，它的基本原理是通过对多个决策树的预测结果进行平均或投票，以产生最终的分类结果。随机森林算法可用于回归和分类问题。关于随机森林算法在回归问题上的应用可参考：TODO 随机森林分类算法可以应用于各种需要进行分类或预 ......

scikit-learn 森林基础 scikit learn更新时间 2024-01-10

【scikit-learn基础】--『监督学习』之决策树分类

决策树分类算法是一种监督学习算法，它的基本原理是将数据集通过一系列的问题进行拆分，这些问题被视为决策树的叶子节点和内部节点。决策树的每个分支代表一个可能的决策结果，而每个叶子节点代表一个最终的分类结果。决策树分类算法的历史可以追溯到1980年代初，当时研究者开始探索用机器学习来解决分类问题。在19 ......

scikit-learn 基础 scikit learn更新时间 2024-01-09

【scikit-learn基础】--『监督学习』之贝叶斯分类

贝叶斯分类是一种统计学分类方法，基于贝叶斯定理，对给定的数据集进行分类。它的历史可以追溯到18世纪，当时英国统计学家托马斯·贝叶斯发展了贝叶斯定理，这个定理为统计决策提供了理论基础。不过，贝叶斯分类在实际应用中的广泛使用是在20世纪80年代，当时计算机技术的进步使得大规模数据处理成为可能。 1. ......

scikit-learn 基础 scikit learn更新时间 2024-01-08

【scikit-learn基础】--『监督学习』之逻辑回归分类

逻辑回归这个算法的名称有一定的误导性。虽然它的名称中有“回归”，当它在机器学习中不是回归算法，而是分类算法。因为采用了与回归类似的思想来解决分类问题，所以它的名称才会是逻辑回归。逻辑回归的思想可以追溯到19世纪，由英国统计学家Francis Galton在研究豌豆遗传问题时首次提出。然而，真正将逻 ......

scikit-learn 逻辑基础 scikit learn更新时间 2024-01-05

【scikit-learn基础】--『监督学习』之 K-近邻分类

KNN（K-近邻），全称K-Nearest Neighbors，是一种常用的分类算法。KNN算法的历史可以追溯到1957年，当时Cover和Hart提出了“最近邻分类”的概念。但是，这个算法真正得到广泛认知和应用是在1992年，由Altman发表的一篇名为“K-Nearest Neighbors”的 ......

近邻 scikit-learn 基础 scikit learn更新时间 2024-01-04

【scikit-learn基础】--『监督学习』之随机森林回归

随机森林回归（Random Forest Regression）是一种在机器学习领域广泛应用的算法，由美国科学家 Leo Breiman 在2001年提出。它是一种集成学习方法，通过整合多个决策树的预测结果来提高预测精度和稳定性。随机森林回归适用于各种需要预测连续数值输出的问题，如金融领域的股票价 ......

scikit-learn 森林基础 scikit learn更新时间 2024-01-03

【scikit-learn基础】--『监督学习』之决策树回归

决策树算法是一种既可以用于分类，也可以用于回归的算法。决策树回归是通过对输入特征的不断划分来建立一棵决策树，每一步划分都基于当前数据集的最优划分特征。它的目标是最小化总体误差或最大化预测精度，其构建通常采用自上而下的贪心搜索方式，通过比较不同划分标准来选择最优划分。决策树回归广泛应用于各种回归问 ......

scikit-learn 基础 scikit learn更新时间 2024-01-02

【scikit-learn基础】--『监督学习』之支持向量机回归

在机器学习中，支持向量机（Support Vector Machine）算法既可以用于回归问题，也可以用于分类问题。支持向量机（SVM）算法的历史可以追溯到1963年，当时前苏联统计学家弗拉基米尔·瓦普尼克（Vladimir N. Vapnik）和他的同事阿列克谢·切尔沃宁基斯（Alexey Ya ......

向量 scikit-learn 基础 scikit learn更新时间 2023-12-31

【scikit-learn基础】--『监督学习』之 LASSO回归

LASSO（Least Absolute Shrinkage and Selection Operator）回归模型一般都是用英文缩写表示，硬要翻译的话，可翻译为最小绝对收缩和选择算子。它是一种线性回归模型的扩展，其主要目标是解决高维数据中的特征选择和正则化问题。 1. 概述在LASSO中，通 ......

scikit-learn 基础 scikit learn LASSO更新时间 2023-12-28

【scikit-learn基础】--『监督学习』之岭回归

岭回归（Ridge Regression）是一种用于处理共线性数据的线性回归改进方法。和上一篇用基于最小二乘法的线性回归相比，它通过放弃最小二乘的无偏性，以损失部分信息、降低精度为代价来获得更实际和可靠性更强的回归系数。 1. 概述岭回归的模型对于存在大量相关特征（这些特征之间存在很高的相关性）的 ......

scikit-learn 基础 scikit learn更新时间 2023-12-26

【scikit-learn基础】--『监督学习』之线性回归

线性回归是一种用于连续型分布预测的机器学习算法。其基本思想是通过拟合一个线性函数来最小化样本数据和预测函数之间的误差。 1. 概述常见的线性回归模型就是：\(f(x) = w_0+w_1x_1+w_2x_2+...+w_nx_n\)这样的一个函数。其中 \((w_1,w_2,...w_n)\)是模 ......

线性 scikit-learn 基础 scikit learn更新时间 2023-12-25