scikit

【scikit-learn基础】--『监督学习』之 支持向量机分类

支持向量机也是一种既可以处理分类问题,也可以处理回归问题的算法。关于支持向量机在回归问题上的应用,请参考:TODO 支持向量机分类广泛应用于图像识别、文本分类、生物信息学(例如基因分类)、手写数字识别等领域。 1. 算法概述 支持向量机的主要思想是找到一个超平面,将不同类别的样本最大化地分隔开。超平 ......
向量 scikit-learn 基础 scikit learn

【scikit-learn基础】--『监督学习』之 随机森林分类

随机森林分类算法是一种基于集成学习(ensemble learning)的机器学习算法,它的基本原理是通过对多个决策树的预测结果进行平均或投票,以产生最终的分类结果。 随机森林算法可用于回归和分类问题。关于随机森林算法在回归问题上的应用可参考:TODO 随机森林分类算法可以应用于各种需要进行分类或预 ......
scikit-learn 森林 基础 scikit learn

【scikit-learn基础】--『监督学习』之 决策树分类

决策树分类算法是一种监督学习算法,它的基本原理是将数据集通过一系列的问题进行拆分,这些问题被视为决策树的叶子节点和内部节点。决策树的每个分支代表一个可能的决策结果,而每个叶子节点代表一个最终的分类结果。 决策树分类算法的历史可以追溯到1980年代初,当时研究者开始探索用机器学习来解决分类问题。在19 ......
scikit-learn 基础 scikit learn

【scikit-learn基础】--『监督学习』之 贝叶斯分类

贝叶斯分类是一种统计学分类方法,基于贝叶斯定理,对给定的数据集进行分类。它的历史可以追溯到18世纪,当时英国统计学家托马斯·贝叶斯发展了贝叶斯定理,这个定理为统计决策提供了理论基础。 不过,贝叶斯分类在实际应用中的广泛使用是在20世纪80年代,当时计算机技术的进步使得大规模数据处理成为可能。 1. ......
scikit-learn 基础 scikit learn

【scikit-learn基础】--『监督学习』之 逻辑回归分类

逻辑回归这个算法的名称有一定的误导性。虽然它的名称中有“回归”,当它在机器学习中不是回归算法,而是分类算法。因为采用了与回归类似的思想来解决分类问题,所以它的名称才会是逻辑回归。 逻辑回归的思想可以追溯到19世纪,由英国统计学家Francis Galton在研究豌豆遗传问题时首次提出。然而,真正将逻 ......
scikit-learn 逻辑 基础 scikit learn

【scikit-learn基础】--『监督学习』之 K-近邻分类

KNN(K-近邻),全称K-Nearest Neighbors,是一种常用的分类算法。KNN算法的历史可以追溯到1957年,当时Cover和Hart提出了“最近邻分类”的概念。但是,这个算法真正得到广泛认知和应用是在1992年,由Altman发表的一篇名为“K-Nearest Neighbors”的 ......
近邻 scikit-learn 基础 scikit learn

【scikit-learn基础】--『监督学习』之 随机森林回归

随机森林回归(Random Forest Regression)是一种在机器学习领域广泛应用的算法,由美国科学家 Leo Breiman 在2001年提出。它是一种集成学习方法,通过整合多个决策树的预测结果来提高预测精度和稳定性。 随机森林回归适用于各种需要预测连续数值输出的问题,如金融领域的股票价 ......
scikit-learn 森林 基础 scikit learn

【scikit-learn基础】--『监督学习』之 决策树回归

决策树算法是一种既可以用于分类,也可以用于回归的算法。 决策树回归是通过对输入特征的不断划分来建立一棵决策树,每一步划分都基于当前数据集的最优划分特征。它的目标是最小化总体误差或最大化预测精度,其构建通常采用自上而下的贪心搜索方式,通过比较不同划分标准来选择最优划分。 决策树回归广泛应用于各种回归问 ......
scikit-learn 基础 scikit learn

【scikit-learn基础】--『监督学习』之 支持向量机回归

在机器学习中,支持向量机(Support Vector Machine)算法既可以用于回归问题,也可以用于分类问题。 支持向量机(SVM)算法的历史可以追溯到1963年,当时前苏联统计学家弗拉基米尔·瓦普尼克(Vladimir N. Vapnik)和他的同事阿列克谢·切尔沃宁基斯(Alexey Ya ......
向量 scikit-learn 基础 scikit learn

【scikit-learn基础】--『监督学习』之 LASSO回归

LASSO(Least Absolute Shrinkage and Selection Operator)回归模型一般都是用英文缩写表示,硬要翻译的话,可翻译为 最小绝对收缩和选择算子。 它是一种线性回归模型的扩展,其主要目标是解决高维数据中的特征选择和正则化问题。 1. 概述 在LASSO中,通 ......
scikit-learn 基础 scikit learn LASSO

【scikit-learn基础】--『监督学习』之 岭回归

岭回归(Ridge Regression)是一种用于处理共线性数据的线性回归改进方法。和上一篇用基于最小二乘法的线性回归相比,它通过放弃最小二乘的无偏性,以损失部分信息、降低精度为代价来获得更实际和可靠性更强的回归系数。 1. 概述 岭回归的模型对于存在大量相关特征(这些特征之间存在很高的相关性)的 ......
scikit-learn 基础 scikit learn

【scikit-learn基础】--『监督学习』之 线性回归

线性回归是一种用于连续型分布预测的机器学习算法。其基本思想是通过拟合一个线性函数来最小化样本数据和预测函数之间的误差。 1. 概述 常见的线性回归模型就是:\(f(x) = w_0+w_1x_1+w_2x_2+...+w_nx_n\)这样的一个函数。其中 \((w_1,w_2,...w_n)\)是模 ......
线性 scikit-learn 基础 scikit learn

【scikit-learn基础】--『预处理』之 缺失值处理

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
缺失 scikit-learn 基础 scikit learn

【scikit-learn基础】--『预处理』之 离散化

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
scikit-learn 基础 scikit learn

【scikit-learn基础】--『预处理』之 分类编码

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
scikit-learn 编码 基础 scikit learn

【scikit-learn基础】--『预处理』之 正则化

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
正则 scikit-learn 基础 scikit learn

【scikit-learn基础】--『预处理』之 数据缩放

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
scikit-learn 基础 数据 scikit learn

【scikit-learn基础】--『预处理』之 标准化

数据的预处理是数据分析,或者机器学习训练前的重要步骤。通过数据预处理,可以 提高数据质量,处理数据的缺失值、异常值和重复值等问题,增加数据的准确性和可靠性 整合不同数据,数据的来源和结构可能多种多样,分析和训练前要整合成一个数据集 提高数据性能,对数据的值进行变换,规约等(比如无量纲化),让算法更加 ......
scikit-learn 基础 标准 scikit learn

【scikit-learn基础】--『数据加载』之外部数据集

这是scikit-learn数据加载系列的最后一篇,本篇介绍如何加载外部的数据集。 外部数据集不像之前介绍的几种类型的数据集那样,针对每种数据提供对应的接口,每个接口加载的数据都是固定的。而外部数据集加载之后,数据的字段和类型是不确定的。 简单来说,我们在实际的数据分析工作中,用到的是外部数据集加载 ......
数据 scikit-learn 基础 scikit learn

【scikit-learn基础】--『数据加载』之样本生成器

除了内置的数据集,scikit-learn还提供了随机样本的生成器。通过这些生成器函数,可以生成具有特定特性和分布的随机数据集,以帮助进行机器学习算法的研究、测试和比较。 目前,scikit-learn库(v1.3.0版)中有20个不同的生成样本的函数。本篇重点介绍其中几个具有代表性的函数。 1. ......
生成器 样本 scikit-learn 基础 数据

【scikit-learn基础】--『数据加载』之真实数据集

上一篇介绍了scikit-learn中的几个玩具数据集,本篇介绍scikit-learn提供的一些真实的数据集。玩具数据集:scikit-learn 基础(01)--『数据加载』之玩具数据集 1. 获取数据集 与玩具数据集不同,真实的数据集的数据不仅数据特征多,而且数据量也比较大,所以没有直接包含在 ......
数据 scikit-learn 基础 scikit learn

【scikit-learn基础】--『数据加载』之玩具数据集

机器学习的第一步是准备数据,好的数据能帮助我们加深对机器学习算法的理解。 不管是在学习还是实际工作中,准备数据永远是一个枯燥乏味的步骤。scikit-learn库显然看到了这个痛点,才在它的数据加载子模块中为我们准备了直接可用的数据集。 在它的数据加载子模块中,提供了6种直接可用来学习算法的经典数据 ......
数据 scikit-learn 玩具 基础 scikit

【scikit-learn基础】--概述

Scikit-learn是一个基于Python的开源机器学习库,它提供了大量的机器学习算法和工具,方便用户进行数据挖掘、分析和预测。 Scikit-learn是基于另外两个知名的库 Scipy 和 Numpy的,关于 Scipy 和 Numpy 等库,之前的系列文章中有介绍: Scipy 基础系列 ......
scikit-learn 基础 scikit learn

Scikit-learn 的 preprocessing.LabelEncoder函数:标签编码

参考文档:https://pythonjishu.com/sklearn-preprocessing-labelencoder/ 转换类别数据为整数:LabelEncoder 可以将字符串或其他类别型数据转换为整数。例如,如果你有一个特征包含类别 "红色"、"绿色" 和 "蓝色",LabelEnco ......

scikit-learn

sklearn是Python的一个第三方机器学习库,全称为scikit-learn。它提供了多种机器学习方法,如分类、回归和聚类算法等,包括支持向量机、随机森林、梯度提升、k均值和DBSCAN等。用户可以通过调用sklearn库中的模块来执行大多数机器学习任务,而无需自己实现算法。在安装和使用skl ......
scikit-learn scikit learn

Machine Learning for Beginners(scikit-learn module)

Machine Learning Common Lifycycle Import the Data Clean the Data Split the Data into Training/Test Sets Create a Model Train the Model Make Prediction ......

深入Scikit-learn:掌握Python最强大的机器学习库

> 本篇博客详细介绍了Python机器学习库Scikit-learn的使用方法和主要特性。内容涵盖了如何安装和配置Scikit-learn,Scikit-learn的主要特性,如何进行数据预处理,如何使用监督学习和无监督学习算法,以及如何评估模型和进行参数调优。本文旨在帮助读者深入理解Scikit- ......
Scikit-learn 机器 Scikit Python learn

Scikit-LLM:将大语言模型整合进Sklearn的工作流

我们以前介绍过Pandas和ChaGPT整合,这样可以不了解Pandas的情况下对DataFrame进行操作。现在又有人开源了Scikit-LLM,它结合了强大的语言模型,如ChatGPT和scikit-learn。但这个并不是让我们自动化scikit-learn,而是将scikit-learn和语 ......
工作流 Scikit-LLM 模型 Sklearn 语言

scikit-learn 中 Boston Housing 数据集问题解决方案

scikit-learn 中 Boston Housing 数据集问题解决方案 在部分旧教程或教材中是 sklearn,现在【2023】已经变更为 scikit-learn 作用:开源机器学习库,支持有监督和无监督学习。它还提供了用于模型拟合、数据预处理、模型选择、模型评估和许多其他实用程序的各种工 ......

NumPy 秘籍中文第二版:十、Scikits 的乐趣

原文:NumPy Cookbook - Second Edition 协议:CC BY-NC-SA 4.0 译者:飞龙 在本章中,我们将介绍以下秘籍: 安装 scikit-learn 加载示例数据集 用 scikit-learn 对道琼斯股票进行聚类 安装 Statsmodels 使用 Statsm ......
秘籍 乐趣 Scikits NumPy
共31篇  :1/2页 首页上一页1下一页尾页