数据分析

R语言广义加性混合模型(GAMM)分析长沙气象因子、空气污染、PM2.5浓度、显著性检验、逐日变化可视化|附代码数据

全文链接:https://tecdat.cn/?p=32981 原文出处:拓端数据部落公众号 气候变化和空气污染对现代社会产生了越来越大的影响。在这种背景下,研究气象和空气污染之间的关系以及其对PM2.5浓度的影响变得非常重要。为了更好地理解和解释这些关系,广义加性混合模型(GAMM)成为一种强大的 ......
空气污染 广义 因子 浓度 气象

R语言改进的K-Means(K-均值)聚类算法分析股票盈利能力和可视化|附代码数据

全文链接:http://tecdat.cn/?p=32418 原文出处:拓端数据部落公众号 大量数据中具有"相似"特征的数据点或样本划分为一个类别。聚类分析提供了样本集在非监督模式下的类别划分。 人们在投资时总期望以最小的风险获取最大的利益,面对庞大的股票市场和繁杂的股票数据,要想对股票进行合理的分 ......
均值 算法 盈利 K-Means 能力

城市时空预测的统一数据管理和综合性能评估 [实验、分析和基准]《Unified Data Management and Comprehensive Performance Evaluation for Urban Spatial-Temporal Prediction [Experiment, Analysis & Benchmark]》

2023年11月1日,还有两个月,2023年就要结束了,希望在结束之前我能有所收获和进步,冲呀,老咸鱼。 摘要 解决了访问和利用不同来源、不同格式存储的不同城市时空数据集,以及确定有效的模型结构和组件。 1.为城市时空大数据设计的统一存储格式“原子文件”,并在40个不同的数据集上验证了其有效性,简化 ......

数据统计分析 — 抽样分布

从总体(容量为N个体)多次取出样本(容量为n个体),通过n的某个统计量的情况,来预估总体的情况 抽样 从有限总体的抽样 简单随机样本(有限总体):从容量N的有限总体中抽取一个容量n的样本,如果容量为n的每一个可能的样本都以相等的概率被抽出,则称该样本为简单随机样本 从无限总体的抽样 随机样本(无限总 ......
数据统计 数据

倾斜摄影三维模型数据几何坐标重建方法分析

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对三维模型进行几何精纠正处理,精度高,... ......
坐标 几何 模型 方法 数据

《数据分析基础——基于python的实现》笔记

统计基础 中心极限定理(Central Limit Theorem) 不知道为啥我看到的中心极限定理有两个版本的表述 (后来发现确实是有两个版本) 第一个版本说:某城市的工资分布是个很奇怪的分布 但如果对该城市进行抽样,每次抽20个人求平均值,抽100次,那么这100个平均值的分布就会是正态分布。 ......
数据分析 基础 笔记 数据 python

大数据分析与应用笔记

定义 大数据:是需要新处理模式才能具有更强的决策力、洞察发 现力和流程优化能力的海量、高增长率和多样化的信息资产。 数量(Volume)、种类(Variety)、速度 (Velocity)、价值(Value)、准确性(Veracity) (1)数据清理:消除噪声和删除不一致数据。 (2)数据集成:多 ......
数据分析 笔记 数据

R语言数量生态学冗余分析RDA分析植物多样性物种数据结果可视化

原文链接:http://tecdat.cn/?p=25564 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于生态学冗余分析RDA的研究报告,包括一些图形和统计输出。 冗余分析(redundancy analysis,RDA)是一种回归分析结合主成分分析的排序方法,也是多因变量(multir ......
生态学 冗余 多样性 物种 数量

SPSS Modeler分析物流发货明细数据:K-MEANS(K均值)聚类和Apriori关联规则挖掘|附代码数据

全文链接:http://tecdat.cn/?p=32633 原文出处:拓端数据部落公众号 物流发货明细数据在现代物流业中扮演着至关重要的角色。通过对这些数据进行挖掘和分析,我们可以发现隐含在背后的供应链运营规律和商业模式,从而指导企业在物流策略、成本管理和客户服务等方面做出更加科学和有效的决策。 ......
均值 数据 规则 Modeler K-MEANS

R语言时变面板平滑转换回归模型TV-PSTR分析债务水平对投资的影响|附代码数据

全文下载链接:http://tecdat.cn/?p=21506 最近我们被客户要求撰写关于TV-PSTR的研究报告,包括一些图形和统计输出。 在本文中,当采用两种状态时,单转换函数PSTR模型具有两个变量: 我们的经验方法的基础包括评估N个国家的资本流动性。相应的模型定义如下: 其中,Iit是第i ......
时变 债务 面板 模型 水平

R数据分析:反事实框架和因果中介的理论理解

其实很早之前给大家写中介分析的做法的时候我也有思考过当中介变量或者因变量不是连续变量的时候,中介怎么做?或者说这个时候中介的结果如何解释?当时反正是一直没有太想明白这些问题,毕竟这些情况在发表的文献中也较少见,也就稀里糊涂过去了。 近期又被好多同学多次问及这些问题。想着逃避不过去了,试着看些文献给大 ......
数据分析 因果 框架 事实 中介

数据分析--数据采集方法

数据采集方法 本文主要是个人学习过程中记录的笔记,此部分内容包括常见的数据文件的存储和读取,通常在使用Python读取数据文件比较推荐Pandas模块,当然在对Excel进行读取和操作时也可以配合openpyxl,xlwings等。由于此前是使用JupyterNotebook进行编写和学习的,如果使 ......
数据 数据采集 数据分析 方法

R语言聚类、文本挖掘分析虚假电商评论数据:K-Means(K-均值)、层次聚类、词云可视化|附代码数据

全文链接:http://tecdat.cn/?p=32540 原文出处:拓端数据部落公众号 聚类分析是一种常见的数据挖掘方法,已经广泛地应用在模式识别、图像处理分析、地理研究以及市场需求分析。本文主要研究聚类分析算法K-means在电商评论数据中的应用,挖掘出虚假的评论数据。 本文主要帮助客户研究聚 ......
均值 数据 层次 文本 K-Means

R语言贝叶斯Metropolis-Hastings Gibbs 吉布斯采样器估计变点指数分布分析泊松过程车站等待时间|附代码数据

原文链接:http://tecdat.cn/?p=26578 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于吉布斯采样器的研究报告,包括一些图形和统计输出。 指数分布是泊松过程中事件之间时间的概率分布,因此它用于预测到下一个事件的等待时间,例如,您需要在公共汽车站等待的时间,直到下一班车到 ......

R语言自然语言处理NLP:情感分析上市公司文本信息知识发现可视化|附代码数据

全文链接:http://tecdat.cn/?p=31702 原文出处:拓端数据部落公众号 情感分析,就是根据一段文本,分析其表达情感的技术。比较简单的情感分析,能够辨别文本内容是积极的还是消极的(褒义/贬义);比较复杂的情感分析,能够知道这些文字是否流露出恐惧、生气、狂喜等细致入微的情感。此外,情 ......

数据统计分析 — 正态分布

连续型随机变量的概率分布 德国的高斯 法国的拉普拉斯 回到最开始的业务场景 通过统计描述,分析师已经了解了配件A过去的日消耗量波动情况,现希望基于历史数据设定库存控制线,要求该库存量能够保证99%的使用日不会出现库存断货情况。 该怎么办呢? 控制线设置成均数可以吗? 肯定是不可以的,因为均值只是代表 ......
正态分布 数据统计 数据

使用Python获取建筑网站数据,进行可视化分析,并实现网站JS解密!

哈喽兄弟们,今天来实现一下建筑市场公共服务平台的数据采集,顺便实现一下网站的JS解密。 话不多说,我们直接开始今天的内容。 首先我们需要准备这些 环境使用 Python 3.8 Pycharm 模块使用 requests --> pip install requests execjs --> pip ......
网站 数据 Python

系统集成知识点速记口诀-数据分析

成本效益定最佳,挣值分析比基准,趋势分析预未来,偏差分析比计划, 储备分析比剩余,应急已知未知险,管理未知未知险,多个方案决策树, 潜在影响敏感性,又被称作龙卷风,相关分析看利益,权高利高重管理, 权高利低令满意,权低利高随告知,权低利低仅监督。 ......

数据分享|SQL Server、Visual Studio、tableau对信贷风险数据ETL分析、数据立方体构建可视化

原文链接:https://tecdat.cn/?p=34085 原文出处:拓端数据部落公众号 分析师:Zuyuan Wang 追求信贷规模的扩张,往往会导致贷款逾期率的不断增加,如何在当今社会运用数据识别用户特征进行风险管控成为了银行放贷的重点依据。 解决方案 任务/目标 研究公司个人贷款的数据集, ......
数据 立方体 信贷 风险 tableau

MATLAB用GARCH-EVT-Copula极值理论模型VaR预测分析股票投资组合|附代码数据

全文链接:http://tecdat.cn/?p=30426 最近我们被客户要求撰写关于GARCH-EVT-Copula的研究报告,包括一些图形和统计输出。 对VaR计算方法的改进,以更好的度量开放式基金的风险。本项目把基金所持股票看成是一个投资组合,引入Copula来描述多只股票间的非线性相关性, ......

数据统计分析 — 泊松分布

在一指定时间范围内或在指定的面积或体积内某一事件出现的次数的分布,他们对应的随机变量的概率服从的分布叫做泊松分布 例如: 某企业中每月某设备出现故障的次数 单位时间内到达某一服务台需要服务的顾客人数 ......
数据统计 数据

大数据分析系统简介,什么是大数据分析系统?

大数据分析系统是一种基于大数据技术和分析算法的软件系统,用于处理、存储和分析海量、多样化和高速增长的数据。 它能够帮助用户从大数据中提取有价值的信息,并支持决策制定和业务优化过程。以下是对大数据分析系统的详细介绍。 **1. 大数据特征** 大数据具有三个主要特征:体量大、速度快和多样化。体量大指的 ......
数据分析 数据 系统 简介

数据分析系统

数据分析系统是一种基于计算机技术和统计学原理,用于收集、整理、存储和分析数据的软件工具。它可以帮助用户从大量的数据中提取有价值的信息,并支持决策制定过程。 以下是对数据分析系统的详细介绍。 1. 数据收集与整理 数据分析系统首先需要从各种来源收集数据,包括传感器、数据库、日志文件、互联网等。 这些数 ......
数据分析 数据 系统

R语言用线性混合效应(多水平/层次/嵌套)模型分析声调高低与礼貌态度的关系|附代码数据

全文下载链接:http://tecdat.cn/?p=23681 最近我们被客户要求撰写关于线性混合效应的研究报告,包括一些图形和统计输出。 线性混合效应模型与我们已经知道的线性模型有什么不同 ( 点击文末“阅读原文”获取完整代码数据******** ) ? 线性混合模型(有时被称为 "多层次模型 ......
声调 线性 高低 效应 模型

SPSS Modeler用K-means(K-均值)聚类、CHAID、CART决策树分析31省市土地利用情况和GDP数据|附文件数据

全文链接:http://tecdat.cn/?p=32840 原文出处:拓端数据部落公众号 随着经济的快速发展和城市化进程的不断推进,土地资源的利用和管理成为了一项极为重要的任务。而对于全国各省市而言,如何合理利用土地资源,通过科学的方法进行规划和管理,是提高土地利用效率的关键。 本文旨在应用SPS ......
均值 数据 省市 土地 Modeler

高校教研大数据分析系统

学校常用的成绩分析软件在教育领域扮演着至关重要的角色,它们帮助学校管理者和教师对学生的学习进展进行跟踪和分析。以下是一些常用的成绩分析软件及其功能说明。 学生成绩管理系统: 学生成绩管理系统是一种全面的学生学习数据管理和分析解决方案。它可以帮助学校管理者和教师快速整理和存储学生成绩信息,并提供直观的 ......
数据分析 教研 数据 系统

学生成绩数据分析软件,提升数据分析效率?

学生成绩数据分析软件,统计分析软件,开源的统计分析和数据可视化软件,强大的数据可视化软件,商业智能工具,学生成绩数据分析 ......
数据分析 数据 效率 成绩 学生

数据分析报告的阅读

EDA是在数据分析中最常用的操作,但是光靠人工来进行所有的工作耗时耗力,所以我们要学习自动化的方法来完成这一操作,让EDA变成简单而有趣的事情。 ......
分析报告 报告 数据

10月《中国数据库行业分析报告》已发布,深度剖析甲骨文大会Oracle技术新趋势

10月报告为甲骨文大会-Oracle技术特辑,聚焦Oracle新特性创新实践与生态趋势,详解当前及未来Oracle在自治、多模融合、可观测性、数据安全等关键技术的发展,欢迎大家下载学习、交流! ......
甲骨 甲骨文 分析报告 深度 趋势

R语言估计时变VAR模型时间序列的实证研究分析案例|附代码数据

原文链接: http://tecdat.cn/?p=3364 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于时变VAR模型的研究报告,包括一些图形和统计输出。 加载R包和数据集 加载包后,我们将此数据集中包含的12个心情变量进行子集化: mood_data <- as.matrix(sym ......