集群

ray-分布式计算框架-集群与异步Job管理

0. ray 简介 ray是开源分布式计算框架,为并行处理提供计算层,用于扩展AI与Python应用程序,是ML工作负载统一工具包 Ray AI Runtime ML应用程序库集 Ray Core 通用分布式计算库 Task -- Ray允许任意Python函数在单独的Python worker上运 ......
分布式 集群 框架 ray Job

Nginx + Nacos2.x集群配置

Nginx : # 集群配置 http { upstream nacos-cluster { ip_hash; server 127.0.0.1:8858; server 127.0.0.1:8868; server 127.0.0.1:8878; } server { listen 8838; s ......
集群 Nacos2 Nginx Nacos

如何建设一个用于编译 iOS App 的 macOS 云服务器集群?

现代软件开发一般会借助 CI/CD 来提升代码质量、加快发版速度、自动化重复的事情,iOS App 只能在 mac 机器上编译,CI/CD 工具因此需要有一个 macOS 云服务器集群来执行 iOS App 的编译。今天就来谈谈如何建设 macOS 云服务器集群 ......
集群 服务器 macOS iOS App

REDIES集群脚本

REDIES集群脚本 转至元数据结尾 Created by 蒋颖伟, last modified on 六月 16, 2017 转至元数据起始 一、dockerfile 及其中的脚本 1.创建集群的cluster.sh #/bin/bashcat /mnt/redishosts|awk '{prin ......
集群 脚本 REDIES

StarRocks 3.0 集群安装手册

本文介绍如何以二进制安装包方式手动部署最新版 StarRocks 3.0集群。 什么是 StarRocks StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户 ......
集群 StarRocks 手册 3.0

[问题记录]k8s集群中coredns解析失败

[问题记录]k8s集群中coredns解析失败 故障现象 在k8s集群,使用coredns提供集群内部dns服务 但是在使用过程中,偶现解析公网域名失败的情况,应用内日志记录显示UnknownHost 问题排查 对有问题的集群进行网络抓包解析,在服务侧记录到DNS解析失败的现象时,观察当时的DNS解 ......
集群 coredns 问题 k8s k8

使用docker 运行etcd 单实例/集群

一. 介绍 本文描述了如何使用docker搭建etcd集群,github/etcd上有单实例etcd服务的搭建方法,包括linux,mac,docker。 在操作之前你需要安装docker docker-compose 是可选的,如果你不想使用 docker-compose 就跳过他 二. etcd ......
集群 实例 docker etcd

win环境基于docker搭建zookeeper伪集群

创建路径:D:\Docker\zk-cluster 在此路径下创建配置文件:docker-compose.yml version: '2' networks: zk-net: name: zk-net services: zoo1: image: zookeeper restart: always ......
集群 zookeeper 环境 docker win

OSD自然OUT之后无法再加入集群-v1-20210308_124828

OSD自然OUT之后无法再加入集群企业云平台产品中心共享知识库Exported on 03/08/2021Table of Contents问题描述 4问题原因 5解决方法 6验证步骤 6相关下载链接:OSD自然OUT之后无法再加入集群.pdf1- - - - - - - - 这是一条华丽的分割线 ......
集群 20210308 自然 124828 OSD

手动部署OceanBase集群

1. 准备工作 准备工作参考:https://www.cnblogs.com/haha029/p/17336622.html 中的“准备工作” 初始化基础环境:创建admin用户、配置ssh互信、修改内核、修改会话变量、配置防火墙、配置时钟同步。 2. 部署OceanBase集群 2.1 安装oce ......
集群 手动 OceanBase

k8s大规模集群优化

大规模集群优化2022-11-24 13:11Kubernetes ⾃ v1.6 以来,官⽅就宣称单集群最⼤⽀持 5000 个节点。不过这只是理论上,在具体实践中从 0 到 500 0,还是有很⻓的路要⾛,需要⻅招拆招。官⽅标准如下:不超过 5000 个节点 不超过 150000 个 pod不超过 ......
集群 大规模 k8s k8 8s

集群

1. 大纲 1. redis应用场景 2. redis得持久化方式 3. redis得集群 4. java连接redis服务器 2. redis应用场景 1、热点数据的缓存 由于redis访问速度块、支持的数据类型比较丰富,所以redis很适合用来存储热点数据,另外结合 expire,我们可以设置过 ......
集群

K8S集群node的删除和添加

copy自: K8S集群node的删除和添加 1、在master节点查看所有的node节点 [root@master ~]# kubectl get node NAME STATUS ROLES AGE VERSION master Ready master 23h v1.17.4 node01 R ......
集群 node K8S K8 8S

k8s集群pod常见状态

Error : Pod 启动过程中发生错误NodeLost : Pod 所在节点失联Unkown : Pod 所在节点失联或其它未知异常Waiting : Pod 等待启动Pending : Pod 等待被调度ContainerCreating : Pod 容器正在被创建Terminating : ......
集群 状态 常见 k8s pod

K8s 集群 etcd节点故障解决方案

1 环境说明 k8s版本:v1.20 etcd节点(192.168.0.12)故障: 报错详情: 4月 24 22:47:13 k8s-node2 etcd[9543]: {"level":"warn","ts":"2023-04-24T22:47:13.571+0800","caller":"et ......
节点 集群 故障 解决方案 方案

redis主从、哨兵、集群

redis主从、哨兵、集群 redis实际生产过程中可能出现的问题: 机器宕机,redis直接停用,影响业务 容量瓶颈,内存大小不够 QPS瓶颈,读的并发量很高很高,一个服务不够 redis主从(master-slave) 主从实现的功能: 做读写分离:主库用来写,从库只用来读 做数据副本 机器故障 ......
主从 哨兵 集群 redis

集群时钟同步必读-NTP和chrony

一、 前言 搭建和维护集群环境中时钟同步是非常重要一环。如果集群的时间不统一,例如ceph集群就会报错无法更新数据、CDH集群无法添加客户端等等。目前主流在Linux系统搭建集群用到NTP和chrony软件,本文简单介绍两者的集群搭建。 二、 NTP和chrony区别 根据chrony官网描述,主要 ......
集群 时钟 chrony NTP

kubectl 命令 --save-config 将部署信息添加到注解,防止deploy或webhook通过注释添加到集群 --record 记录下当前的版本信息为了回滚

1、--save-config 为什么需要使用kubctl apply保存配置? kubectl apply <file.yaml> --save-config创建或更新部署,并将部署另存为元数据。 文件上说--save-config[=false]:如果为true,则当前对象的配置将保存在其注释中 ......
信息 注解 集群 注释 save-config

reids04 集群原理及搭建

今日内容详细 1 集群原理及搭建 # 做了读写分离,做了高可用,还存在问题 1 并发量:单机redis qps为10w/s,但是我们可能需要百万级别的并发量 2 数据量:机器内存16g--256g,如果存500g数据呢? # 使用集群解决这个问题 # 解决:加机器,分布式 redis cluster ......
集群 原理 reids 04

mysql主从分离 缓存优化 python操作哨兵集群

今日内容 1 python操作哨兵 # 高可用架构后 》不能直接连某一个主库了 》主库可能会挂掉,后来它就不是主库了 # 之前学的连接redis的操作,就用不了了 import redis conn=redis.Redis(host='',port=6379) conn.set() conn.clo ......
主从 哨兵 集群 缓存 python

kubernetes集群的高可用架构

概述 kubernete在云平台的高可用分为两种情形 单az的高可用集群搭建 多az的高可用集群搭建 这两种情形其实就是一个k8s集群内部的高可用,只是多az的场景下能够实现更高级别的高可用,此时k8s需要跨az部署集群。 集群内部的高可用需要实现基础组件的高可用,其中最重要的就是etcd和apis ......
集群 kubernetes 架构

手动恢复_MariaDB_集群

KEYWORDS: tencent, tstack, solution, HISTORY: Created at 15:26:22 on 2020-02-15. 手动恢复 MariaDB 集群 (TStack K 与 P 版均适用) (2020-02-15) [ERROR] WSREP: bind: ......
集群 手动 MariaDB

k8s集群故障后中间件恢复

k8s集群故障后中间件恢复k8s集群恢复之后,mysql、rabbitmq、redis中间件的集群状态无法自愈,需要手动修复。mysql组复制恢复mysql集群会只有一个主节点在线,通过启动其他节点,其他节点同步数据会出现事务日志不一致的情况,如图:修复方法:需要--清空从节点数据,从主节点恢复所有 ......
中间件 集群 故障 k8s k8

如何在k8s集群中安装配置loki并使用grafana可视化管理

按照以下步骤在 Kubernetes 集群中安装 Loki 并使用 Grafana 进行可视化管理: 在 Kubernetes 中安装 Loki。您可以使用 Helm Package Manager 的 Loki Chart 进行安装,也可以手动在 Kubernetes 上安装 Loki。 安装 P ......
集群 grafana loki k8s k8

Ceph集群搭建篇

环境准备 ceph官方文档:https://docs.ceph.com/en/latest/ 本次搭建用到的测试机器,规划如下: | 主机名 | IP | 数据盘 | | | | | | ceph-node01 | 192.168.11.13 | 5块1TB容量硬盘 | | ceph-node02 ......
集群 Ceph

Kubernetes初探[1]:部署您的第一个ASP.NET Core应用到k8s集群

原文:Kubernetes初探[1]:部署您的第一个ASP.NET Core应用到k8s集群 - 雨夜朦胧 - 博客园 (cnblogs.com) Kubernetes简介 Kubernetes是Google基于Borg开源的容器编排调度引擎,作为CNCF(Cloud Native Computin ......
集群 Kubernetes Core ASP NET

redis应用场景及三种集群方式

1. 正文 1. redis应用场景 2. redis得持久化方式 3. redis得集群 4. java连接redis服务器 2. redis应用场景 1、热点数据的缓存 由于redis访问速度块、支持的数据类型比较丰富,所以redis很适合用来存储热点数据,另外结合 expire,我们可以设置过 ......
集群 场景 方式 redis

以太网链路聚合与交换机堆叠、集群

随着业务的发展和园区网络规模的不断扩大,用户对于网络的带宽、可靠性要求越来越高。对于这种情况,传统解决方案通过升级设备方式提高网络带宽,同时通过部署冗余链路并辅以STP协议实现高可靠,然而这种方案存在灵活度低、故障恢复时间长、配置复杂、成本高等缺点。为了解决这些问题,我们将思考另一种解决方案:通过链 ......
链路 以太网 集群 交换机

关于sap应用在pacemaker集群下的资源与资源组设计

关于sap相关的应用,如果建立两个节点组成的pacemaker集群,集群中有两个业务相关的应用资源如:ASCS 与 AERS 当然对于pacemaker集群来说、就无所谓资源/资源组运行在那个节点、因为在那两个节点上都是可以运行所有资源的 当然笔者还是建议是将两个应用资源/资源组能分别启动在两台不同 ......
资源 集群 pacemaker sap

python操作哨兵、python操作集群、缓存优化、mysql 主从

python操作哨兵、python操作集群、缓存优化、mysql 主从 python操作哨兵 用高可用架构后 》不能直接连某一个主库了 》主库可能会挂掉,后来它就不是主库了 # 之前学的连接redis的操作,就用不了了 import redis conn=redis.Redis(host='',po ......
主从 python 哨兵 集群 缓存