数据挖掘

NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据|附代码数据

全文链接:http://tecdat.cn/?p=2155 最近我们被客户要求撰写关于NLP自然语言处理的研究报告,包括一些图形和统计输出。 随着网民规模的不断扩大,互联网不仅是传统媒体和生活方式的补充,也是民意凸显的地带。领导干部参与网络问政的制度化正在成为一种发展趋势,这种趋势与互联网发展的时代 ......
自然语言 数据 模型 文本 留言板

MATLAB用改进K-Means(K-均值)聚类算法数据挖掘高校学生的期末考试成绩|附代码数据

全文链接:http://tecdat.cn/?p=30832 最近我们被客户要求撰写关于K-Means(K-均值)聚类算法的研究报告,包括一些图形和统计输出。 本文首先阐明了聚类算法的基本概念,介绍了几种比较典型的聚类算法,然后重点阐述了K-均值算法的基本思想,对K-均值算法的优缺点做了分析,回顾了 ......
均值 数据 数据挖掘 算法 成绩

SPSS Modeler分析物流发货明细数据:K-MEANS(K均值)聚类和Apriori关联规则挖掘

全文链接:http://tecdat.cn/?p=32633 原文出处:拓端数据部落公众号 物流发货明细数据在现代物流业中扮演着至关重要的角色。通过对这些数据进行挖掘和分析,我们可以发现隐含在背后的供应链运营规律和商业模式,从而指导企业在物流策略、成本管理和客户服务等方面做出更加科学和有效的决策。 ......
均值 规则 Modeler K-MEANS Apriori

【视频】支持向量机算法原理和Python用户流失数据挖掘SVM实例

全文链接:http://tecdat.cn/?p=32604 原文出处:拓端数据部落公众号 分析师:Bailey Zheng和Lijie Zhang 即使是同一种植物,由于生长的地理环境的不同,它们的特征会有所差异。例如鸢尾花,可分为山鸢尾、杂色鸢尾、维吉尼亚鸢尾。 假设此时您得到了一朵鸢尾花,如何 ......
数据挖掘 向量 算法 实例 原理

基于SQL的数据可视化和数据挖掘

基于SQL的数据可视化和数据挖掘 IT奋斗的青年 2023-04-12 21:34 发表于山东 我们的项目是一个在线教育平台,平台上有数百门课程,数千名学生在线学习。我们的目标是从数据中挖掘出有价值的信息,帮助平台做出更加科学和有效的运营决策。 数据分析流程 1. 数据清洗和预处理 在进行数据分析之 ......
数据 数据挖掘 SQL

Python——基于数据挖掘的上市公司财务造假识别(制造业)

# 制造业 ```python import pandas as pd import numpy as np %matplotlib inline import matplotlib.pyplot as plt import seaborn as sns color = sns.color_pale ......

Python——基于数据挖掘的上市公司财务造假识别(制造业)

# 制造业 ```python import pandas as pd import numpy as np %matplotlib inline import matplotlib.pyplot as plt import seaborn as sns color = sns.color_pale ......

NLP自然语言处理—主题模型LDA案例:挖掘人民网留言板文本数据|附代码数据

从上图可以看出不同地区留言板的情感倾向分布,总的来说,负面情感留言数目和积极情感相差不多,负面情感留言较多,占比46%,积极情感留言占比42%,中立情感的留言占比11%。 从地区来看,活跃在各大媒体的“朝阳区群众”留言数目也是最多的,其次是海淀区,昌平区。因此,从情感分布来看大部分留言还是在反应存在 ......
自然语言 数据 模型 文本 留言板

数据挖掘:关联规则

1. 基本概念 1.1 事务与项集 事务(transaction):关联规则分析的对象,可以理解为一种商业行为;事务由序号和项集组成,序号是唯一确定一个事物的标志; 项集:数据库中的数据项构成的非空集合。顾客购买行为是一种包含多个商品购买的事务。二一种商品可以视为一个项目;若干个项目的集合简称未项集 ......
数据挖掘 规则 数据

如何开展数据挖掘测试

数据挖掘测试是指在数据挖掘模型开发完成后,对模型进行测试以评估其性能和准确性。以下是一些开展数据挖掘测试的步骤: 1、数据准备:收集和整理用于测试的数据集,确保数据集的质量和完整性。 2、数据探索:对数据集进行探索性分析,了解数据的分布、相关性等信息。 3、数据预处理:对数据进行清洗、转换、归一化等 ......
数据挖掘 数据

数据挖掘:线性回归

原文连接:https://blog.csdn.net/weixin_43651049/article/details/122733618 1. 理解线性回归模型 回归模型研究的是因变量(目标)和自变量(预测器)之间的关系,因变量可以是连续也可以离散,如果是离散的就是分类问题。思考房价预测模型,我们可 ......
数据挖掘 线性 数据

数据挖掘中常用的相似性度量方法

[TOC](目录) 本文将介绍数据分析、数据挖掘、机器学习等领域中常用的相似性度量(Similarity Measurement)方法。 # (1) Manhattan Distance(曼哈顿距离) 我们知道曼哈顿街区有一个个方块构成,从一个十字路口(0,0)到另一个十字路口(3,3)的最短路程, ......
相似性 数据挖掘 常用 方法 数据

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(上篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending ......
模型 金融 数据挖掘 挑战赛 上篇

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(下篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending

数据挖掘实践(金融风控):金融风控之贷款违约预测挑战赛(下篇)[xgboots/lightgbm/Catboost等模型]--模型融合:stacking、blending ......
模型 金融 数据挖掘 挑战赛 下篇

地铁数据挖掘

最近在看图神经网络的视频,里面使用了北京上海的地铁信息,这里整了一下郑州的地铁信息,直接上代码 # 引包 from bs4 import BeautifulSoup import requests url = 'http://www.zzmetro.com/lines/query/operating ......
数据挖掘 地铁 数据

记一次数据误删操作通过闪回以及日志挖掘恢复

由于开发人员不小心删除业务表然后想通过我来恢复数据,我第一时间发现由于undo_retention参数只保留15分钟,通过闪回这种方法并不能恢复数据, 然后通过日志挖掘来截取该时间段数据,然后通过创建记录表来保存到记录表里方便查询。通过记录表里的数据来恢复数据。以下命令是一些操作的命令 日志挖掘通过 ......
数据 日志

数据挖掘(Data Mining)

数据挖掘(Data Mining)软件。使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断。 ......
数据挖掘 数据 Mining Data

COMP3425数据挖掘

COMP3425辅导、辅导c/c++,Python编程COMP3425 and COMP8410 Data Mining S1 2023Assignment 2: Description ofDataData and Metadata The data supplied for the assign ......
数据挖掘 数据 COMP 3425

Python数据分析与挖掘实战笔记

(声明:这些代码只是看书的时候跟着敲一敲,留个印象,为的是以后用到有个方便快速查找看个思路,并没有真正运行。) 数据挖掘建模过程 数据挖掘建模过程: 定义挖掘目标:明确挖掘目标,弄清用户需求。 数据采样: 采样标准(相关性、可靠性、有效性) 采样方法:随机、分层、等距 数据探索:进行探索、审核和加工 ......
数据分析 实战 笔记 数据 Python

R语言改进Apriori关联规则挖掘研究西安PM2.5含量与天气因素关系数据可视化

全文链接:http://tecdat.cn/?p=32284 原文出处:拓端数据部落公众号 随着社会的发展,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并命名与之相关的技术发展与创新。而大数据的意义并不在“大”,而在于“有用”。价值含量、挖掘成本比 ......
含量 因素 规则 天气 Apriori

python_数据分析与挖掘实战_词云

# -*- coding: utf-8 -*- # 代码12-1 评论去重的代码 import pandas as pdimport reimport jieba.posseg as psgimport numpy as np # 去重,去除完全重复的数据reviews = pd.read_csv( ......
数据分析 实战 数据 python

数据挖掘-电商产品评论数据情感分析

import pandas as pd import re import jieba.posseg as psg import numpy as np # 去重,去除完全重复的数据 reviews = pd.read_csv("./reviews.csv") reviews = reviews[[' ......
数据 数据挖掘 情感 产品

python数据挖掘与分析实战__电子商务网站用户行为分析及服务推荐

import osimport pandas as pd # 修改工作路径到指定文件夹 os.chdir("D:/CourseAssignment/AI/CollectWebDate/") # 第一种连接方式 from sqlalchemy import create_engine engine = ......

数据挖掘第6次作业

电子商务网站用户行为分析及服务推荐 一、背景与挖掘目标 本章通过对用户访问的网页日志数据进行分析与处理,采用基于物品的协同过滤算法对处理后的数据进行建模分析,并应用模型实现智能推荐,进行个性化推荐,帮助用户更加便捷地获取信息。 某法律网站是北京一家电子商务类的大型法律资讯网站,致力于为用户提供丰富的 ......
数据挖掘 数据

数据挖掘作业5

家用热水器用户行为分析与事件识别 一、背景与挖掘目标 居民在使用家用热水器的过程中,会因为地区气候、不同区域和用户年龄性别差异等原因形成不同的使用习惯。家电企业若能深入了解其产品在不同用户群中的使用习惯,开发符合客户需求和使用习惯的功能,就能开拓新市场。 本案例将依据BP神经网络算法构建洗浴事件识别 ......
数据挖掘 数据

python_数据分析与挖掘实战_词云

# -*- coding: utf-8 -*- # 代码12-1 评论去重的代码 import pandas as pd import re import jieba.posseg as psg import numpy as np # 去重,去除完全重复的数据 reviews = pd.read_ ......
数据分析 实战 数据 python

Python数据挖掘之关联规则学习

一、关联算法应用介绍 关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。常见于与购物篮分析。 常用关联算法表如下,简单理解的话,就是测算某几项东西一起出现的概率。比如:如果测算得出,大量订单中出现面包、牛奶这两个东西,那么 ......
数据挖掘 规则 数据 Python

【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战,适合新人入门

【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战 项目链接合集(必看) 项目专栏合集https://www.heywhale.com/home/column/64141d6b1c8c8b518ba97dcc 必看 1. 【机器学习入门与实践】合集入门必看系列 A.机器学习系列入门系列[一] ......
数据挖掘 实战 机器 新人 项目

数据挖掘作业5

# -*- coding: utf-8 -*- # 代码10-1 import pandas as pd import matplotlib.pyplot as plt inputfile = r'E:\python 实验\大数据数据\original_data.xls' # 输入的数据文件 dat ......
数据挖掘 数据

数据挖掘作业6

# -*- coding: utf-8 -*- # 代码11-1 import os import pandas as pd # 修改工作路径到指定文件夹 os.chdir("D:/chapter11/demo") # 第一种连接方式 from sqlalchemy import create_en ......
数据挖掘 数据