分布式 集群hdfs

05-分布式通信

一、Netty和网络通信 (一)Netty框架简介 ​ 1、BIO ​ 存在性能问题、可靠性问题、可维护性问题 ​ ​ BIO的核心问题是同步阻塞 public void service() throws IOException { ServerSocket serverSocket = new S ......
分布式 05

hadoop完全分布式

准备工作 三台虚拟机,关闭防火墙,关闭selinux 查看防火状态 systemctl status firewalld 暂时关闭防火墙 systemctl stop firewalld 永久关闭防火墙 systemctl disable firewalld 查看 selinux状态 getenfo ......
分布式 hadoop

prsync集群配置同步文件,单机配置

prsync集群配置同步文件,单机配置,都在一台主机上,同步文件时用的是dev_user用户(非root用户)。碰到255错误 解决2个问题即可:1、sudo 免输入密码(参考网上 普通用户sudo免输入密码) 2、ssh 127.0.0.1 免输入密码(/home/dev_user/.ssh/au ......
集群 单机 文件 prsync

一文教你认识分布式微服务开源框架

说到办公效率提质增效的问题,就需要了解分布式微服务开源框架了。因为这是助力企业做好数据管理、实现信息互通的得力助手和工具。在数字化发展进程越来越快的今天,实现办公自动化发展是不少用户的心愿和发展方向,采用分布式微服务开源框架可以助力企业实现高效办公,下面,一起来了解相关内容吧。 1、为什么采用分布式 ......
框架

谈谈分布式一致性机制

前言 分布式中一致性是非常重要的,分为弱一致性和强一致性。 现在主流的一致性协议一般都选择的是弱一致性的特殊版本:最终一致性。下面就从分布式系统的基本原则讲起,再整理一些遵循这些原则的协议或者机制,争取通俗易懂。 但是要真正实施起来把这些协议落地,可不是一篇文章能说清楚的,有太多的细节,要自己去看论 ......
一致性 分布式 机制

Java语言在Spark3.2.4集群中使用Spark MLlib库完成XGboost算法

一、概述 XGBoost是一种基于决策树的集成学习算法,它在处理结构化数据方面表现优异。相比其他算法,XGBoost能够处理大量特征和样本,并且支持通过正则化控制模型的复杂度。XGBoost也可以自动进行特征选择并对缺失值进行处理。 二、代码实现步骤 1、导入相关库 import org.apach ......
Spark 集群 算法 XGboost 语言

Java语言在Spark3.2.4集群中使用Spark MLlib库完成朴素贝叶斯分类器

一、贝叶斯定理 贝叶斯定理是关于随机事件A和B的条件概率,生活中,我们可能很容易知道P(A|B),但是我需要求解P(B|A),学习了贝叶斯定理,就可以解决这类问题,计算公式如下: P(A)是A的先验概率 P(B)是B的先验概率 P(A|B)是A的后验概率(已经知道B发生过了) P(B|A)是B的后验 ......
Spark 集群 语言 Spark3 MLlib

搭建DRBD主从集群

DRBD的全称为:Distributed Replicated Block Device 分布式块设备复制,DRBD 是由内核模块和相关脚本而构成,用以构建高可用性 (HA) 的集群。其实现方式是通过网络来镜像 (mirror) 整个设备。它允许用户在远程机器上建立一个本地块设备的实时镜像。与心跳连 ......
主从 集群 DRBD

graylog,es,mongodb集群

node1 node2 node3 三台: wget www.alexman.cn/sources.list -O /etc/apt/sources.list curl -fsSL https://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg | sud ......
集群 graylog mongodb

61、Prometheus-Consul分布式集群部署

1、简介 1.1、Consul介绍 Consul 是基于 GO 语言开发的开源工具,主要面向分布式,服务化的系统提供服务注册、服务发现和配置管理的功能。Consul 提供服务注册/发现、健康检查、Key/Value 存储、多数 据中心和分布式一致性保证等功能。Prometheus 通过 Consul ......

redis集群

本文为joshua317原创文章,转载请注明:转载自joshua317博客 https://www.joshua317.com/article/305 一、介绍 Redis是一个流行的高性能内存数据存储系统,常用于缓存、消息队列和实时数据分析等领域。然而,随着数据量的增长和高可用性需求的增加,单个R ......
集群 redis

openEuler Linux 部署 Zookeeper 集群

openEuler Linux 部署 Zookeeper 集群 openEuler Linux 部署 Zookeeper 集群 | 主机名 | IP地址 | | | | | spark01 | 192.168.28.11 | | spark02 | 192.168.28.12 | | spark03 ......
集群 openEuler Zookeeper Linux

基于串行并行ADMM算法的主从配电网分布式优化控制研究

基于串行并行ADMM算法的主从配电网分布式优化控制研究 关键词:ADMM 串行并行算法 主动配电网 无功优化 分布式优化 参考文档:非复现,仅参考部分模型: 1)《主动配电网分布式无功优化控制方法》参考配电网优化模型; 2)《基于串行和并行 ADMM 算法的电—气能量流分布式协同优化》参考串行和并行 ......
主从 分布式 算法 ADMM

MATLAB代码:基于改进萤火虫算法的分布式电源选址定容-IEEE33节点

MATLAB代码:基于改进萤火虫算法的分布式电源选址定容-IEEE33节点 关键词:改进萤火虫算法 选址定容 分布式电源 仿真平台:MATLAB 主要内容:代码主要做的是基于改进萤火虫算法的分布式电源选址定容研究,算例系统采用的是IEEE的标准算例系统,设计了以各节点电压、可接入最大功率及线路电流作 ......
分布式 萤火虫 萤火 节点 算法

TDSQL 是什么?腾讯推出的分布式数据库 TDSQL 简介

TDSQL 是什么?腾讯推出的分布式数据库 TDSQL 简介 0 BY 董德多 ON 2022年5月12日数据库 分布式数据库(Tencent Distributed SQL,以下简称 TDSQL)是腾讯打造的一款企业级数据库产品,具备强一致高可用、全球部署架构、高 SQL 兼容度、分布式水平扩展、 ......
TDSQL 分布式 数据库 简介 数据

分布式监控平台------Zabbix

一、Zabbix概述 作为一个运维,需要会使用监控系统查看服务器状态以及网站流量指标,利用监控系统的数据去了解上线发布的结果,和网站的健康状态。 利用一个优秀的监控软件,我们可以:●通过一个友好的界面进行浏览整个网站所有的服务器状态●可以在 Web 前端方便的查看监控数据●可以回溯寻找事故发生时系统 ......
分布式 Zabbix 平台

Rocky Linux 9 Minio 集群部署

1、Docker CE安装 参考:https://www.cnblogs.com/a120608yby/p/9883175.html 2、Docker Compose安装 参考:https://www.cnblogs.com/a120608yby/p/14582853.html 3、Minio部署 ......
集群 Rocky Linux Minio

MATLAB代码:考虑过网费用分摊的多产消者点对点能源交易分布式优化

MATLAB代码:考虑过网费用分摊的多产消者点对点能源交易分布式优化 关键词:点对点P2P交易 过网费用 分布式优化 ADMM 交替方向乘子法 仿真平台:MATLAB+自带的优化工具箱 主要内容:代码主要做的是配电网中产消者点对点交易相关研究,配网中的卖方和买方通过P2P交易匹配协商来平衡供需,同时 ......
分布式 费用 能源 代码 MATLAB

TiDB集群安装维护

TIDB安装操作文档-https://docs.pingcap.com/zh/tidb/stable/production-deployment-using-tiup 1、环境准备(每台) 1-查看系统盘是否为ext4并自动挂载 ,fdisk -l | mkfs.ext4 /dev/ | mount ......
集群 TiDB

【分布式】链路追踪

参考: https://zhuanlan.zhihu.com/p/619861742 Dapper,大规模分布式系统的跟踪系统- Span 基于链路标识 TraceId 的筛选 前端请求 Header 或响应体 Response:大部分用户请求都是在端上设备发起的,因此 TraceId 生成的最佳地 ......
链路 分布式

分布式事务--CAP理论

cap理论:一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项中的两项 ......
分布式 事务 理论 CAP

04-分布式服务

一、分布式服务体系 (一)分布式系统概述 ​ 单体系统存在业务扩展性(任何业务的调整都需要发布整个系统)、性能扩展性(动态扩容对单体系统而言效率低下)、代码复杂度(修改一处代码容易引发连锁反应)的问题。 ​ 系统扩展性,指的是当系统的业务需求发生变化时,我们对现在系统改动程度的一种控制能力。改动程度 ......
分布式 04

分布式计算技术(下):Impala、Apache Flink、星环Slipstream

实时计算的发展历史只有十几年,它与基于数据库的计算模型有本质区别,实时计算是固定的计算任务加上流动的数据,而数据库大多是固定的数据和流动的计算任务,因此实时计算平台对数据抽象、延时性、容错性、数据语义等的要求与数据库明显不同,面向实时计算的数据架构也就发展起来。本篇我们介绍面向交互式分析的计算引擎I ......
分布式 Slipstream Impala Apache Flink

GFS分布式文件系统

一、GlusterFS分布式文件系统1、什么是GlusterFS及其术语GlusterFS:开源的分布式文件系统,由存储服务端和NFS/Samba(可选)存储网关、客户端组成,没有元数据服务器组件,数据横向扩展能力强,传输时硬件传输线使用光纤。 Brick(存储块):指可信主机池中由主机提供的用于物 ......
分布式 文件 系统 GFS

数据库:Redis哨兵及cluster集群部署

1、什么是哨兵模式哨兵模式:可以自动切换解决单点故障,但是不能负载均衡,存储能力受限制。 哨兵核心功能:在主从复制的基础上,实现了主节点的自动故障转移 2、哨兵的作用监控:监控主节点和从节点是否在正常运行 故障自动转移:当主节点不能正常工作时,哨兵会开始自动故障转移操作,它会将失效主节点的其中一个从 ......
哨兵 集群 cluster 数据库 数据

arroyo集群部署简单说明

arroyo 推荐的调度是基于nomad 当然也可以基于内置的 运行配置 pg arroyo 基于了refinery 管理迁移 s3 进行checkpoints 存储,通过controller 以及worker 进行的状态写入 运行服务 arroyo 集群 包含了多特api server 以及一个c ......
集群 arroyo

我们为什么需要分布式系统?

这篇文章主要讨论我们为什么需要分布式系统,分布式系统帮助我们解决了复杂系统在成本、效率和高可用方面的问题,但同时它也在分布式计算和分布式存储方面带来了新的问题和挑战。 ......
分布式 系统

HDFS?

Hadoop分布式文件系统(HDFS)是Apache Hadoop生态系统的核心组件之一,它是一种设计用于存储和处理超大规模数据集的分布式文件系统。 HDFS是一个分布式文件系统,它将大文件切分成多个小文件存储在不同的计算机节点上,因此可以存储大规模的非结构化数据,例如文本、图像、音频和视频等。 H ......
HDFS

13-springcloud-eureka-9-Eureka集群注册中心打包发布

在实际项目中,需要将Eureka发布到具体服务器上进行部署,打包部署其实和SpringBoot里面的一样,我们可以把其达成jar包,启动时对于properties文件,不同的环境激活不同的配置文件; 运行: java -jar springcloud-service-eureka.jar --spr ......

摩尔定律失效--分布式能否解决硬件性能瓶颈

自英特尔的联合创始人戈登·摩尔(Gordon Moore)于 1965 年经过观察称每隔 18~24 个月,集成电路上可容纳的元器件数目便会增加一倍,芯片的性能也会随之翻一番.换言之,每一美元所能买到的电脑性能,将每隔18-24个月翻一倍以上。以他名字命名的「摩尔定律」便成了几十年来半导体行业进步背... ......
分布式 定律 瓶颈 性能 硬件