prometheus metrics kube-state-metrics集群

大数据之—kafka集群环境

前言 参考:https://blog.csdn.net/huxili2020/article/details/120371459 一、安装 mkdir -p /opt/kafka && cd /opt/kafka tar -zxvf /opt/kafka/kafka_2.13-3.3.1.tgz m ......
集群 环境 数据 kafka

大数据之—HBase集群环境搭建

前言 参考:https://blog.csdn.net/huxili2020/article/details/120459471 前置条件:Hadoop、Zookeeper 均需要正常的集群环境 官网:https://hbase.apache.org/downloads.html 软件仓库:http ......
集群 环境 数据 HBase

06prometheus动态加载exporter

1.简要说明 应用场景:为了不频繁重启prometheus导致监控数据出现中断,使用动态加载exporter比较适合生产环境 prometheus默认添加exporter采用的是静态配置,添加完后要重启prometheus. 2.动态加载file_sd_configs方式 文件内容用json格式 3 ......
prometheus exporter 动态 06

Predixy 代理 Redis Cluster 集群

1、环境 服务器名称 IP地址 备注 predixy-161-130 10.32.161.130 Predixy redis-161-131 10.32.161.131 redis节点 redis-161-132 10.32.161.132 redis节点 redis-161-133 10.32.1 ......
集群 Predixy Cluster Redis

Twemproxy(nutcracker)代理 Redis Cluster 集群

1、环境 服务名称 IP地址 备注 twemproxy-161-130 10.32.161.130 twemproxy (nutcracker) redis-161-131 10.32.161.131 redis节点 redis-161-132 10.32.161.132 redis节点 redis ......
集群 nutcracker Twemproxy Cluster Redis

Prometheus部署

Prometheus是最初在SoundCloud上构建的开源系统监视和警报工具包。自2012年成立以来,许多公司和组织都采用了Prometheus,该项目拥有非常活跃的开发人员和用户社区。Prometheus 于2016年加入了 Cloud Native Computing Foundation,这 ......
Prometheus

Zookeeper 3.8.0 集群安装及监控

Zookeeper 集群安装及监控 1. 前言 业务需要对Zookeeper集群进行监控,发现的方案有三种: JMX zookeeper exporter ZK Monitor(Since 3.6.0) 采用JMX 进行监控,可获取到的指标项不够丰富。Zookeeper Exporter监控可获得的 ......
集群 Zookeeper

使用kubeadm快速部署一个K8s集群

kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。 这个工具能通过两条指令完成一个kubernetes集群的部署: # 创建一个 Master 节点 $ kubeadm init # 将一个 Node 节点加入到当前集群中 $ kubeadm join <Master节点 ......
集群 kubeadm K8s K8 8s

使用kubeadm搭建高可用的K8s集群

kubeadm是官方社区推出的一个用于快速部署kubernetes集群的工具。 这个工具能通过两条指令完成一个kubernetes集群的部署: # 创建一个 Master 节点 $ kubeadm init # 将一个 Node 节点加入到当前集群中 $ kubeadm join <Master节点 ......
集群 kubeadm K8s K8 8s

citus 11.2 更好的支持patroni 集群部署

citus 11.2 可以更好的支持基于patroni 的集群环境部署了,同时patroni 官方也提供了相关的文档专门介绍如何进行citus ha 的部署 我以前有简单说明过基于patroni+ citus 11 进行实际部署,目前官方提供了类似的能力,可以省去我们不少时间 部署一些简单说明 参考 ......
集群 patroni citus 11.2 11

KubeSphere Cloud 月刊|灾备支持 K8s 1.22+,轻量集群支持安装灾备和巡检组件

功能升级 备份容灾服务支持 K8s v1.22+ 版本集群 随着 Kubernetes 近一年频繁的发版、升级,越来越多的用户开始部署并使用高版本的 Kubernetes 集群。备份容灾服务支持 Kubernetes v1.22+ 版本的集群后,能够尽可能地覆盖用户新版本集群上的容器化应用,为核心的 ......
轻量 月刊 集群 KubeSphere 组件

mysql集群搭建docker-compose方案

MySQL集群搭建大致有两种方式,一种是单主/多从的主从复制方式,另一种是使用Galera Cluster高可用解决方案。 1、步骤 以下我们详细介绍一下单主/多从的主从复制方式: 确认服务器环境,采用官方支持的操作系统版本和MySQL版本,并保证主从服务器之间的网络连接能够正常通信。 安装MySQ ......
集群 docker-compose compose 方案 docker

【MySQL】通过xenon实现数据库高可用集群

[root@node01 ~]# yum install -y golang screen git[root@node01 ~]# which ip /usr/sbin/ip [root@node01 ~]# visudo mysql ALL=(ALL) NOPASSWD:/usr/sbin/ip ......
集群 数据库 数据 MySQL xenon

Kubernetes 学习总结(19)—— Kubernetes 集群管理平台如何选择?Rancher vs KubeSphere

Kubernetes 学习总结(19)—— Kubernetes 集群管理平台如何选择?Rancher vs KubeSphere 前言 Kubernetes(K8s)集群管理平台都是基于 Kubernetes 提供功能,可以说他们是在 K8s 的基础上封装了一层更为友好的操作方式。他们都是为了降低 ......
Kubernetes 集群 KubeSphere Rancher 平台

kubernetesk8s各个版本高可用集群灵活安装 掌握k8s日常运维

一、环境介绍 主机名称IP地址部署软件备注 k8s-master1 192.168.66.30 etcd+kube-apiserver+kube-controller-manager+kube-scheduler+Kubelet+docker+kube-proxy master k8s-master ......

使用Docker部署Consul集群并由Ocelot调用

关于consul的介绍就不写了百度就行,我们直接开干。 一、部署consul集群 拉取consul的镜像 docker pull consul 然后部署consul容器 docker run --name consul1 -d -p 8500:8500 -p 8300:8300 -p 8301:83 ......
集群 Docker Consul Ocelot

kafka的原理及集群部署详解

kafka原理详解 消息队列概述 消息队列分类 点对点 组成:消息队列(Queue)、发送者(Sender)、接收者(Receiver) 特点:一个生产者生产的消息只能被一个接受者接收,消息一旦被消费,消息就不在消息队列中了 发布/订阅 组成:消息队列(Queue)、发布者(Publisher)、订 ......
集群 原理 kafka

Prometheus Operator 与 kube-prometheus 之一-简介

简介 Prometheus Operator Prometheus Operator: 在 Kubernetes 上管理 Prometheus 集群。该项目的目的是简化和自动化基于 Prometheus 的 Kubernetes 集群监控堆栈的配置。 kube-prometheus 最简单的方法是将 ......

Prometheus Alertmanager生产配置趟过的坑总结

简介 Alertmanager 处理由客户端应用程序(如 Prometheus server)发送的警报。它负责去重(deduplicating),分组(grouping),并将它们路由(routing)到正确的接收器(receiver)集成,如电子邮件,微信,或钉钉。它还负责处理警报的静默/屏蔽( ......
Alertmanager Prometheus

Prometheus性能调优-什么是高基数问题以及如何解决?

背景 近期发现自己实验用的 Prometheus 性能出现瓶颈, 经常会出现如下告警: PrometheusMissingRuleEvaluations PrometheusRuleFailures 之后慢慢排查发现是由于 Prometheus 的某些 series 的高基数(High Cardin ......
基数 Prometheus 性能 问题

从源码彻底理解 Prometheus/VictoriaMetrics 中的 relabel_configs/metric_relabel_configs 配置

背景 最近接手维护了公司的指标监控系统,之后踩到坑就没站起来过。。 本次问题的起因是我们配置了一些指标的删除策略没有生效: - action: drop_metrics regex: "^envoy_.*|^url\_\_\_\_.*|istio_request_bytes_sum" 与这两个容易引 ......

Nginx + Keepalived 高可用集群部署

负载均衡技术对于一个网站尤其是大型网站的web服务器集群来说是至关重要的!做好负载均衡架构,可以实现故障转移和高可用环境,避免单点故障,保证网站健康持续运行。在使用 Nginx 做反向代理或者负载均衡的时候,都是以 Nginx 为入口,如果 Nginx 宕机了,那么所有的服务都无法正常提供,影响非常 ......
集群 Keepalived Nginx

【Redis场景5】集群秒杀优化-分布式锁

集群环境下的秒杀问题 前序 【Redis场景1】用户登录注册 【Redis场景2】缓存更新策略(双写一致) 【Redis场景3】缓存穿透、击穿问题 【Redis场景拓展】秒杀问题-全局唯一ID生成策略 【Redis场景4】单机环境下秒杀问题 在单机环境下的并发问题,我们可以使用相关锁来解决;但是在集 ......
分布式 集群 场景 Redis

使用metrics-server监控k8s的资源指标

首先,欢迎使用DHorse部署k8s应用。 k8s可以通过top命令来查询pod和node的资源使用情况,如果直接运行该命令,如下所示。 [root@centos05 deployment]# kubectl top pod W0306 15:23:24.990550 8247 top_pod.go ......
metrics-server 指标 metrics server 资源

使用containerd搭建MinIO集群服务

概述 因为在云服务器上默认只有一块磁盘,如果直接在系统盘上安装MinIO,会被拒绝,所以这里采用containerd的方式绕过这一限制 操作环境 操作系统 CentOS 7.9 MinIO版本 RELEASE.2023-03-13T19-46-17Z 服务器host信息 192.168.10.1 m ......
集群 containerd MinIO

手把手教你搭建Windows 搭建Prometheus + Grafana + Jmeter可视化监控平台

下载安装包 Prometheus windows_exporter Grafana 下载地址:https://share.weiyun.com/D9sdiWoC 工作原理 Exporter 监控工具,获取数据 Prometheus 普罗米修斯时序数据库,用来存储和查询监控数据 Grafana 仪表盘 ......
Prometheus Windows Grafana Jmeter 平台

【Azure K8S | AKS】分享从AKS集群的Node中查看日志的方法(/var/log)

问题描述 使用Azure Kubernetes服务(AKS),可以通过kubectl连接 pod 中查看日志,但是如何来查看节点的系统日志呢?如是否有ubuntu系统升级的记录? 问题解答 是的,可以进入AKS的节点查看系统文件,如日志文件(/var/log) 或者由应用生产的其他日志。 具体的操作 ......
集群 AKS 方法 Azure 日志

【故障公告】Kubernetes 集群节点宕机造成博客站点故障(被3.5万QPS压垮)

非常抱歉!今天 18:40-18:55 左右 Kubernetes 集群一台高配节点突然宕机,造成博客站点故障,访问时出现 502 Bad Gateway,由此给您带来麻烦,请您谅解。 发现故障并定位问题后,我们增加了新节点服务器并重启宕机节点服务器,之后恢复正常。 19:17 左右又出现故障,疑似 ......
故障 节点 集群 Kubernetes 站点

统一观测丨使用 Prometheus 监控 E-MapReduce,我们该关注哪些指标?

开源大数据平台E-MapReduce(简称“EMR”)是云原生开源大数据平台,向客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎。本文旨在分享阿里云Prometheus对EMR平... ......

容灾恢复 | 记一次K8S集群中etcd数据快照的备份恢复实践

描述:在 Kubernetes 集群中所有操作的资源数据都是存储在 etcd 数据库上, 所以防止集群节点瘫痪未正常工作或在集群迁移时,以及在出现异常的情况下能尽快的恢复集群数据,则我们需要定期针对etcd集群数据进行相应的容灾操作。 在K8S集群中或者Docker环境中,我们可以非常方便的针对 ... ......
快照 集群 备份 数据 etcd