数据分析

Python贝叶斯高斯混合模型GMM聚类分析数据和混合密度可视化

全文链接 :https://tecdat.cn/?p=33821 原文出处:拓端数据部落公众号 混合模型是另一种生成模型,它将数据点的分布建模为多个单独分布的组合("混合")。客户常见的混合模型类型是高斯混合模型,其中数据生成分布被建模为多个高斯分布的组合。 import numpy as np i ......
密度 模型 数据 Python GMM

Python随机波动模型Stochastic volatility,SV随机变分推断SVI分析标普500指数股票价格时间数据波动性可视化

全文链接:https://tecdat.cn/?p=33809 原文出处:拓端数据部落公众号 随机波动模型(Stochastic volatility models)经常被客户用来对股票价格随时间的变动性进行建模。波动性(volatility)是随时间的对数收益的标准差。与假设波动性恒定不变不同,随 ......

针对Informer中时序数据ETT油温数据分析

针对Informer中时序数据ETT油温数据分析针对Informer中时序数据ETT油温数据分析 油温数据介绍 数据问题介绍 数据分析油温数据介绍电力变压器油温数据,由国家电网提供,该数据集是来自中国同一个省的两个不同县的变压器数据,时间跨度为2年,原始数据每分钟记录一次(用 m 标记),每个数据集 ......
油温 数据 时序 数据分析 Informer

R语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡违约分析信贷数据集|附代码数据

原文链接:http://tecdat.cn/?p=23344 最近我们被客户要求撰写关于信用卡违约分析的研究报告,包括一些图形和统计输出。 本文中我们介绍了决策树和随机森林的概念,并在R语言中用逻辑回归、回归决策树、随机森林进行信用卡违约数据分析 决策树是由节点和分支组成的简单树状结构。根据每个节点 ......
数据 信贷 信用卡 Regression Logistic

Python配对交易策略Pairs Trading统计套利量化交易分析股票市场|附代码数据

原文链接:http://tecdat.cn/?p=24814 原文出处:拓端数据部落公众号 最近我们被客户要求撰写关于配对交易策略的研究报告,包括一些图形和统计输出。 说到在股票市场上赚钱,有无数种不同的赚钱方式。似乎在金融界,无论你走到哪里,人们都在告诉你应该学习 Python。毕竟,Python ......
股票市场 策略 Trading 代码 股票

三维模型3DTile格式轻量化的数据压缩与性能平衡关系分析

三维工厂K3DMaker是一款三维模型浏览、分析、轻量化、顶层合并构建、几何校正、格式转换、调色裁切等功能专业处理软件。可以进行三维模型的网格简化、纹理压缩、层级优化等操作,从而实现三维模型轻量化。轻量化压缩比大,模型轻量化效率高,自动化处理能力高;采用多种算法对三维模型进行几何精纠正处理,精度高,... ......
模型 性能 格式 数据 3DTile

解析用户消费记录(数据分析三剑客综合使用)

博客地址:https://www.cnblogs.com/zylyehuo/ 开发环境 anaconda 集成环境:集成好了数据分析和机器学习中所需要的全部环境 安装目录不可以有中文和特殊符号 jupyter anaconda提供的一个基于浏览器的可视化开发工具 import numpy as np ......
三剑客 数据分析 数据 用户

matplotlib -- 绘图操作 -- 数据分析三剑客

博客地址:https://www.cnblogs.com/zylyehuo/ 开发环境 anaconda 集成环境:集成好了数据分析和机器学习中所需要的全部环境 安装目录不可以有中文和特殊符号 jupyter anaconda提供的一个基于浏览器的可视化开发工具 import matplotlib. ......
三剑客 数据分析 matplotlib 数据

pandas(进阶操作)-- 处理非数值型数据 -- 数据分析三剑客(核心)

博客地址:https://www.cnblogs.com/zylyehuo/ 开发环境 anaconda 集成环境:集成好了数据分析和机器学习中所需要的全部环境 安装目录不可以有中文和特殊符号 jupyter anaconda提供的一个基于浏览器的可视化开发工具 import numpy as np ......
数据 三剑客 数据分析 数值 核心

机器学习之数据处理及分析库Pandas

简介 Pandas工具包是专门用作数据处理和分析的,其底层的计算其实都是由Numpy来完成,再把复杂的操作全部封装起来,使其用起来十分高效、简洁。在数据科学领域,无论哪个方向都是跟数据打交道,所以Pandas工具包是非常实用的。 数据预处理 import pandas as pd df = pd.r ......
数据处理 机器 数据 Pandas

pandas -- 处理非数值型数据 -- 数据分析三剑客(核心)

博客地址:https://www.cnblogs.com/zylyehuo/ 为什么学习pandas numpy已经可以帮助我们进行数据的处理了,那么学习pandas的目的是什么呢? numpy能够帮助我们处理的是数值型的数据,当然在数据分析中除了数值型的数据还有好多其他类型的数据(字符串,时间序列 ......
数据 三剑客 数据分析 数值 核心

numpy -- 数据分析三剑客

博客地址:https://www.cnblogs.com/zylyehuo/ NumPy(Numerical Python) 是 Python 语言中做科学计算的基础库。重在于数值计算,也是大部分Python科学计算库的基础,多用于在大型、多维数组上执行的数值运算。 开发环境 anaconda 集成 ......
三剑客 数据分析 数据 numpy

jupyter -- 数据分析可视化开发工具

博客地址:https://www.cnblogs.com/zylyehuo/ jupyter介绍 jupyter就是anaconda提供的一个基于浏览器的可视化开发工具 jupyter的基本使用 启动 在终端中录入:jupyter notebook的指令,按下回车 新建 python3:anacon ......

线性回归和时间序列分析北京房价影响因素可视化案例|附代码数据

全文链接:http://tecdat.cn/?p=21467 最近我们被客户要求撰写关于北京房价的研究报告,包括一些图形和统计输出。 在本文中,房价有关的数据可能反映了中国近年来的变化 目的 人们得到更多的资源(薪水),期望有更好的房子 人口众多 独生子女政策:如何影响房子的几何结构?更多的卧室,更 ......
时间序列 线性 序列 房价 因素

R语言非线性回归和广义线性模型:泊松回归、伽马回归、逻辑回归、Beta回归分析机动车事故、小鼠感染、蛤蜊数据、补剂锻炼钠摄入数据

全文链接:https://tecdat.cn/?p=33781 原文出处:拓端数据部落公众号 我们使用广义线性模型(Generalized Linear Models,简称GLM)来研究客户的非正态数据,并探索非线性关系。GLM是一种灵活的统计模型,适用于各种数据类型和分布,包括二项分布、泊松分布和 ......
补剂 数据 蛤蜊 小鼠 非线性

R语言决策树、随机森林、逻辑回归临床决策分析NIPPV疗效和交叉验证|附代码数据

全文链接:http://tecdat.cn/?p=32295 原文出处:拓端数据部落公众号 临床决策(clinical decision making)是医务人员在临床实践过程中,根据国内外医学科研的最新进展,不断提出新方案,与传统方案进行比较后,取其最优者付诸实施,从而提高疾病诊治水平的过程。 在 ......
疗效 逻辑 森林 语言 代码

R语言用线性混合效应(多水平/层次/嵌套)模型分析声调高低与礼貌态度的关系|附代码数据

全文下载链接:http://tecdat.cn/?p=23681 最近我们被客户要求撰写关于线性混合效应的研究报告,包括一些图形和统计输出。 线性混合效应模型与我们已经知道的线性模型有什么不同 ( 点击文末“阅读原文”获取完整代码数据******** ) ? 线性混合模型(有时被称为 "多层次模型 ......
声调 线性 高低 效应 模型

指标字典-数据分析与可视化指南

指标字典,指标字典,数据分析,可视化指南,数据集,指标定义,什么是指标字典,创建指标字典的目的,指标字典的内容,创建和维护指标字典的步骤 ......
数据分析 字典 指标 指南 数据

SQL_duckdb分析nuScenes数据

使用duckdb来了解数据 using self-driving car data from the nuScenes dataset, and writing Python code to visualize its route, IMU acceleration, and perceived o ......
SQL_duckdb nuScenes 数据 duckdb SQL

每日随笔——hive数据分析4

在前面的博客中,我们已经完成了数据的导入,清洗以及将hive数据库中的数据导入到windows系统的mysql数据库 到目前为止,我们已将项目完成了大部分,现在就剩下实现可视化界面,完成柱状图了,这个需要eharts 下面是网址:https://echarts.apache.org/zh/index ......
数据分析 随笔 数据 hive

生信教程:使用全基因组SNP数据进行ABBA-BABA分析

动动发财的小手,点个赞吧! 简介 ABBA BABA 统计(也称为“D 统计”)为偏离严格的分叉进化历史提供了简单而有力的测试。因此,它们经常用于使用基因组规模的 SNP 数据(例如来自全基因组测序或 RADseq)来测试基因渗入。 在本次实践中,我们将结合使用可用软件和一些用 R 从头编写的代码来 ......
基因组 基因 ABBA-BABA 数据 ABBA

PostgreSQL数据库WAL日志空间大小以及不清理的原因深入分析

1. 背景很多初学者会对WAL日志占用多少空间比较疑惑,听网上的一些文章说是由max_wal_size来控制的,但发现很多时候WAL日志空间会超过这个设置的值,不知道为什么? 同时有时会发现WAL日志不清理了,占用空间在不停的增长,然后不知道为什么?看一些网上的文章,发现情况不是网上说的那种情况。中 ......
PostgreSQL 大小 原因 数据库 数据

数据可视化工具在成绩分析中的作用与意义

数据可视化的基本概念,数据可视化在成绩分析中的作用,数据可视化工具的选用与应用,数据可视化的意义与效果评价,数据可视化工具,成绩分析,提高数据理解能力 ......
意义 作用 成绩 工具 数据

R语言文本挖掘:kmeans聚类分析上海玛雅水公园景区五一假期评论词云可视化|附代码数据

全文链接:http://tecdat.cn/?p=32307 原文出处:拓端数据部落公众号 互联网时代,大量的新闻信息、网络交互、舆情信息以文本形式存储在数据库中,如何利用数据分析和文本挖掘的算法,将海量文本的价值挖掘出来,成为我们团队近期的一个研究方向,本案例就是我们的一个尝试。 文本聚类其实也就 ......
景区 文本 公园 语言 代码

智慧工地系统源码,实现对施工全过程的实时监控、数据分析、智能管理和优化调控

智慧工地是指通过信息化技术、物联网、人工智能技术等手段,对建筑工地进行数字化、智能化、网络化升级,实现对施工全过程的实时监控、数据分析、智能管理和优化调控。智慧工地的建设可以提高工地的安全性、效率性和质量,降低施工成本,是建筑行业数字化转型升级的重要抓手。智慧工地物联网云平台子系统模块:基于智慧工地 ......
数据分析 工地 全过程 实时 源码

hive数据分析

HIVE数据分析实验报告 信2105-3 20213728杨申龙 数据导入 将csv文件导入到虚拟机的hive数据库中,并通过datagrip软件实现对数据库的可视化操作 数据清洗 在datagrip中进行如下操作,将数值清洗为真实日期 insert overwrite table test2 se ......
数据分析 数据 hive

软件工程测试--hive数据分析,步骤

![](https://img2023.cnblogs.com/blog/2913863/202309/2913863-20230925134737420-1341675633.png) ![](https://img2023.cnblogs.com/blog/2913863/202309/2913... ......

对企业数据分析来说,使用数据可视化至关重要的几个原因?

在当今信息时代,企业面临着大量的数据产生和积累。这些数据蕴含着巨大的价值,可以为企业提供深入洞察、支持决策以及发掘业务机会。然而,将这些庞大的数据转化为有意义的见解并进行决策,并不是一件容易的事情。这正是为什么数据可视化在企业数据分析中至关重要的原因之一。 1. 向日益忙碌的管理层传递信息:高层管理 ......

R语言Gibbs抽样的贝叶斯简单线性回归仿真分析|附代码数据

全文下载链接:http://tecdat.cn/?p=4612 最近我们被客户要求撰写关于贝叶斯简单线性回归的研究报告,包括一些图形和统计输出。 贝叶斯分析的许多介绍都使用了相对简单的教学实例(例如,根据伯努利数据给出成功概率的推理)。虽然这很好地介绍了贝叶斯原理,但是这些原则的扩展并不是直截了当的 ......
线性 语言 代码 数据 Gibbs