普罗 集群prometheus grafana

Prometheus部署

Prometheus是最初在SoundCloud上构建的开源系统监视和警报工具包。自2012年成立以来,许多公司和组织都采用了Prometheus,该项目拥有非常活跃的开发人员和用户社区。Prometheus 于2016年加入了 Cloud Native Computing Foundation,这 ......
Prometheus

Zookeeper 3.8.0 集群安装及监控

Zookeeper 集群安装及监控 1. 前言 业务需要对Zookeeper集群进行监控,发现的方案有三种: JMX zookeeper exporter ZK Monitor(Since 3.6.0) 采用JMX 进行监控,可获取到的指标项不够丰富。Zookeeper Exporter监控可获得的 ......
集群 Zookeeper

使用kubeadm快速部署一个K8s集群

kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。 这个工具能通过两条指令完成一个kubernetes集群的部署: # 创建一个 Master 节点 $ kubeadm init # 将一个 Node 节点加入到当前集群中 $ kubeadm join <Master节点 ......
集群 kubeadm K8s K8 8s

使用kubeadm搭建高可用的K8s集群

kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。 这个工具能通过两条指令完成一个kubernetes集群的部署: # 创建一个 Master 节点 $ kubeadm init # 将一个 Node 节点加入到当前集群中 $ kubeadm join <Master节点 ......
集群 kubeadm K8s K8 8s

citus 11.2 更好的支持patroni 集群部署

citus 11.2 可以更好的支持基于patroni 的集群环境部署了,同时patroni 官方也提供了相关的文档专门介绍如何进行citus ha 的部署 我以前有简单说明过基于patroni+ citus 11 进行实际部署,目前官方提供了类似的能力,可以省去我们不少时间 部署一些简单说明 参考 ......
集群 patroni citus 11.2 11

KubeSphere Cloud 月刊|灾备支持 K8s 1.22+,轻量集群支持安装灾备和巡检组件

功能升级 备份容灾服务支持 K8s v1.22+ 版本集群 随着 Kubernetes 近一年频繁的发版、升级,越来越多的用户开始部署并使用高版本的 Kubernetes 集群。备份容灾服务支持 Kubernetes v1.22+ 版本的集群后,能够尽可能地覆盖用户新版本集群上的容器化应用,为核心的 ......
轻量 月刊 集群 KubeSphere 组件

mysql集群搭建docker-compose方案

MySQL集群搭建大致有两种方式,一种是单主/多从的主从复制方式,另一种是使用Galera Cluster高可用解决方案。 1、步骤 以下我们详细介绍一下单主/多从的主从复制方式: 确认服务器环境,采用官方支持的操作系统版本和MySQL版本,并保证主从服务器之间的网络连接能够正常通信。 安装MySQ ......
集群 docker-compose compose 方案 docker

【MySQL】通过xenon实现数据库高可用集群

[root@node01 ~]# yum install -y golang screen git[root@node01 ~]# which ip /usr/sbin/ip [root@node01 ~]# visudo mysql ALL=(ALL) NOPASSWD:/usr/sbin/ip ......
集群 数据库 数据 MySQL xenon

Kubernetes 学习总结(19)—— Kubernetes 集群管理平台如何选择?Rancher vs KubeSphere

Kubernetes 学习总结(19)—— Kubernetes 集群管理平台如何选择?Rancher vs KubeSphere 前言 Kubernetes(K8s)集群管理平台都是基于 Kubernetes 提供功能,可以说他们是在 K8s 的基础上封装了一层更为友好的操作方式。他们都是为了降低 ......
Kubernetes 集群 KubeSphere Rancher 平台

kubernetesk8s各个版本高可用集群灵活安装 掌握k8s日常运维

一、环境介绍 主机名称IP地址部署软件备注 k8s-master1 192.168.66.30 etcd+kube-apiserver+kube-controller-manager+kube-scheduler+Kubelet+docker+kube-proxy master k8s-master ......

使用Docker部署Consul集群并由Ocelot调用

关于consul的介绍就不写了百度就行,我们直接开干。 一、部署consul集群 拉取consul的镜像 docker pull consul 然后部署consul容器 docker run --name consul1 -d -p 8500:8500 -p 8300:8300 -p 8301:83 ......
集群 Docker Consul Ocelot

kafka的原理及集群部署详解

kafka原理详解 消息队列概述 消息队列分类 点对点 组成:消息队列(Queue)、发送者(Sender)、接收者(Receiver) 特点:一个生产者生产的消息只能被一个接受者接收,消息一旦被消费,消息就不在消息队列中了 发布/订阅 组成:消息队列(Queue)、发布者(Publisher)、订 ......
集群 原理 kafka

Prometheus Operator 与 kube-prometheus 之一-简介

简介 Prometheus Operator Prometheus Operator: 在 Kubernetes 上管理 Prometheus 集群。该项目的目的是简化和自动化基于 Prometheus 的 Kubernetes 集群监控堆栈的配置。 kube-prometheus 最简单的方法是将 ......

Prometheus Alertmanager生产配置趟过的坑总结

简介 Alertmanager 处理由客户端应用程序(如 Prometheus server)发送的警报。它负责去重(deduplicating),分组(grouping),并将它们路由(routing)到正确的接收器(receiver)集成,如电子邮件,微信,或钉钉。它还负责处理警报的静默/屏蔽( ......
Alertmanager Prometheus

Prometheus性能调优-什么是高基数问题以及如何解决?

背景 近期发现自己实验用的 Prometheus 性能出现瓶颈, 经常会出现如下告警: PrometheusMissingRuleEvaluations PrometheusRuleFailures 之后慢慢排查发现是由于 Prometheus 的某些 series 的高基数(High Cardin ......
基数 Prometheus 性能 问题

从源码彻底理解 Prometheus/VictoriaMetrics 中的 relabel_configs/metric_relabel_configs 配置

背景 最近接手维护了公司的指标监控系统,之后踩到坑就没站起来过。。 本次问题的起因是我们配置了一些指标的删除策略没有生效: - action: drop_metrics regex: "^envoy_.*|^url\_\_\_\_.*|istio_request_bytes_sum" 与这两个容易引 ......

Nginx + Keepalived 高可用集群部署

负载均衡技术对于一个网站尤其是大型网站的web服务器集群来说是至关重要的!做好负载均衡架构,可以实现故障转移和高可用环境,避免单点故障,保证网站健康持续运行。在使用 Nginx 做反向代理或者负载均衡的时候,都是以 Nginx 为入口,如果 Nginx 宕机了,那么所有的服务都无法正常提供,影响非常 ......
集群 Keepalived Nginx

【Redis场景5】集群秒杀优化-分布式锁

集群环境下的秒杀问题 前序 【Redis场景1】用户登录注册 【Redis场景2】缓存更新策略(双写一致) 【Redis场景3】缓存穿透、击穿问题 【Redis场景拓展】秒杀问题-全局唯一ID生成策略 【Redis场景4】单机环境下秒杀问题 在单机环境下的并发问题,我们可以使用相关锁来解决;但是在集 ......
分布式 集群 场景 Redis

使用containerd搭建MinIO集群服务

概述 因为在云服务器上默认只有一块磁盘,如果直接在系统盘上安装MinIO,会被拒绝,所以这里采用containerd的方式绕过这一限制 操作环境 操作系统 CentOS 7.9 MinIO版本 RELEASE.2023-03-13T19-46-17Z 服务器host信息 192.168.10.1 m ......
集群 containerd MinIO

手把手教你搭建Windows 搭建Prometheus + Grafana + Jmeter可视化监控平台

下载安装包 Prometheus windows_exporter Grafana 下载地址:https://share.weiyun.com/D9sdiWoC 工作原理 Exporter 监控工具,获取数据 Prometheus 普罗米修斯时序数据库,用来存储和查询监控数据 Grafana 仪表盘 ......
Prometheus Windows Grafana Jmeter 平台

【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)

问题描述 使用Azure Kubernetes服务(AKS),可以通过kubectl连接 pod 中查看日志,但是如何来查看节点的系统日志呢?如是否有ubuntu系统升级的记录? 问题解答 是的,可以进入AKS的节点查看系统文件,如日志文件(/var/log) 或者由应用生产的其他日志。 具体的操作 ......
集群 AKS 方法 Azure 日志

【故障公告】Kubernetes 集群节点宕机造成博客站点故障(被3.5万QPS压垮)

非常抱歉!今天 18:40-18:55 左右 Kubernetes 集群一台高配节点突然宕机,造成博客站点故障,访问时出现 502 Bad Gateway,由此给您带来麻烦,请您谅解。 发现故障并定位问题后,我们增加了新节点服务器并重启宕机节点服务器,之后恢复正常。 19:17 左右又出现故障,疑似 ......
故障 节点 集群 Kubernetes 站点

统一观测丨使用 Prometheus 监控 E-MapReduce,我们该关注哪些指标?

开源大数据平台E-MapReduce(简称“EMR”)是云原生开源大数据平台,向客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎。本文旨在分享阿里云Prometheus对EMR平... ......

容灾恢复 | 记一次K8S集群中etcd数据快照的备份恢复实践

描述:在 Kubernetes 集群中所有操作的资源数据都是存储在 etcd 数据库上, 所以防止集群节点瘫痪未正常工作或在集群迁移时,以及在出现异常的情况下能尽快的恢复集群数据,则我们需要定期针对etcd集群数据进行相应的容灾操作。 在K8S集群中或者Docker环境中,我们可以非常方便的针对 ... ......
快照 集群 备份 数据 etcd

为K8S集群准备Ceph存储

随着K8S存储接口逐渐成熟并顺势推出CSI接口规范后,原来“in-tree”(树内)模式的很多存储插件也逐步迁移到了“out-of-tree”(树外)模式的CSI插件上,甚至有些原来支持的存储卷类型都被直接移除了(例如在K8S v1.26上直接移除了 glusterfs 卷类型),查阅了一下K8S官 ......
集群 Ceph K8S K8 8S

Eureka高可用集群服务端和客户端配置

微服务应用中,生产环境一般都需要保障服务注册中心的高可用!高可用也分好几个等级,例如:同数据中心(可用Zone区)高可用——》同地域(Region)跨数据中心(可用Zone区)高可用——》全国跨地域(Region)跨数据中心(可用Zone区)高可用——全球跨地域(Region)跨数据中心(可用Zon ......
集群 客户端 客户 Eureka

利用kubeadm部署Kubernetes v1.22.10高可用集群

一、概述 Kubernetes集群控制平面(Master)节点右数据库服务(Etcd)+其它服务组件(Apiserver、Controller-manager、Scheduler等)组成;整个集群系统运行的交互数据都将存储到数据库服务(Etcd)中,所以Kubernetes集群的高可用性取决于数据库 ......
集群 Kubernetes kubeadm 22.10 22

一个容器,但是一整个k8s集群

你可能需要一个快速启动和销毁的 k8s 集群;你可能在资源受限的环境中运行 k8s 集群;你可能是一个完全的初学者,觉得搭建完整的 k8s 套件太难。那么这篇短文可能可以帮到你。 ......
集群 容器 k8s k8 8s

Centos7搭建hadoop3.3.4分布式集群

1、背景 最近在学习hadoop,本文记录一下,怎样在Centos7系统上搭建一个3个节点的hadoop集群。 2、集群规划 hadoop集群是由2个集群构成的,分别是hdfs集群和yarn集群。2个集群都是主从结构。 2.1 hdfs集群规划 | ip地址 | 主机名 |部署服务| |--|--| ......
分布式 集群 Centos7 hadoop3 Centos

IoT 边缘集群基于 Kubernetes Events 的告警通知实现

背景 边缘集群(基于 树莓派 + K3S) 需要实现基本的告警功能。 边缘集群限制 CPU/内存/存储 资源紧张,无法支撑至少需要 2GB 以上内存和大量存储的基于 Prometheus 的完整监控体系方案(即使是基于 Prometheus Agent, 也无法支撑) (需要避免额外的存储和计算资源 ......
集群 Kubernetes 边缘 Events IoT