故障kubeadm

掌握 Kubernetes 故障排除:有效维护集群的最佳实践和工具

Kubernetes 是一款管理容器化应用程序的强大工具。然而,与任何复杂的系统一样,使用它时也可能出错。当问题出现时, 掌握有效的故障排除技术和工具非常重要。 本文将介绍以下步骤,助您了解事件收集的入门知识: 检索最新事件 使用 Pod 模拟问题 在位于 PV 的 Pod 中存储事件 检索最新事件 ......
集群 Kubernetes 故障 工具

linux网络故障排查

在日常使用中,经常会出现无法连通的情况,这个时候我们就需要找到问题出在哪里,这里面给各位提供一个生产环境排查网络故障的大体思路,一般情况下如果遇到网络故障,都是通过筛选的方式一点一点的确定问题所在,首先判断是本机的问题还是网络上其它设备的问题,如果同一网络环境中的其它主机正常的,要去其它网络设备(路 ......
故障 linux 网络

kubeadm部署k8s集群

一、系统环境准备 1、系统环境说明 系统环境说明 系统 角色 IP 组件 K8s版本 centos7.9 kubeadm-master1 192.168.100.41 docker,kubeadm,kubelet,kubectl v1.20.0 centos7.9 kubeadm-master1 1 ......
集群 kubeadm k8s k8 8s

kubeadm安装k8s集群

kubeadm安装k8s集群 一、机器准备(所有的master和node节点需要执行) 部署k8s集群的节点按照用途可以划分为如下2类角色: master:集群的master节点,集群的初始化节点,基础配置不低于2c 4g slave:集群的slave节点,可以多台,基础配置不低于1c 2g 主机名 ......
集群 kubeadm k8s k8 8s

html+css3+anime.js实现文字故障动画

记录一个很酷的动画,效果如图: 是基于html+css3+anime.js实现的,看了眼代码,其实是默认文字的div中定位了几个相同的文字块,利用clip-path这个属性去裁剪展示其中的一部分,用于展示故障的效果,动画则是使用anime.js去循环改变X与Y轴的位置,同时调整绘制的颜色,demo代 ......
故障 文字 动画 anime html

【笔记】问题控制与管理&故障、问题、已知错误、变更请求之间的逻辑关系&问题管理流程

【笔记】问题控制与管理&故障、问题、已知错误、变更请求之间的逻辑关系 问题控制与管理 与故障管理的尽可能快地恢复服多的目标不同,问题管理是要防止再次发生故障 **例如你制作了一个报表,用户填写了问题数据进去,因此报错提示了,让用户换个数据或者和用户说不要这样填写的方法就算是故障管理,问题还存在,只不 ......
问题 amp 逻辑 故障 流程

【笔记】数据库、网络故障与恢复

【笔记】数据库故障与恢复 数据库故障主要分:事务故障、系统故障和介质故障 事务故障 是指事务在运行至正常终点前被终止,此时数据库可能出现不正确的状态。 是由于事务程序内部错误而引起的,有些可以预期,如金额不足等,有些不可以预期,如非法输入、运算溢出等。 类似于手动执行回滚 恢复过程: 1、反向(从后 ......
故障 数据库 笔记 数据 网络

kubeadm init 报错ERROR FileContent--proc-sys-net-bridge-bridge-nf-call-iptables

现象: [ERROR FileContent--proc-sys-net-bridge-bridge-nf-call-iptables]: /proc/sys/net/bridge/bridge-nf-call-iptables contents are not set to 1 原因: /proc ......

再现ORA-600 4000故障处理---惜分飞

联系:手机/微信(+86 17813235971) QQ(107644445) 标题:再现ORA-600 4000故障处理 作者:惜分飞©版权所有[未经本人同意,不得以任何形式转载,否则有进一步追究法律责任的权利.] 有一个10g的库,由于redo损坏导致无法正常recover成功 正常途径无法op ......
故障 4000 ORA 600

kubeadm 加入work 节点集群时报 http://localhost:10248/healthz处理方法

现象: [kubelet-check] The HTTP call equal to 'curl -sSL http://localhost:10248/healthz' failed with error: Get "http://localhost:10248/healthz": dial tc ......
节点 集群 localhost 时报 kubeadm

kubeadm 部署 k8s

kubeadm 部署 k8s # 简介 记录在centos7.6.1810上,使用kubeadm 部署 k8s,部署在三台虚机上,部署版本是1.22.0 # 虚机信息 使用三台一模一样的虚机,系统版本为 **CentOS7.6.1810** 安装虚机的ISO是 CentOS-7-x86_64-Min ......
kubeadm k8s k8 8s

k8s kubeadm编译修改证书默认期限

获取源码 k8s_version="v1.27.6" git clone --depth=1 -b ${k8s_version} https://github.com/kubernetes/kubernetes.git 修改源码 sed -i 's/CertificateValidity = tim ......
期限 证书 kubeadm k8s k8

[雷池WAF]长亭雷池WAF配置基于健康监测的负载均衡,实现故障自动切换上游服务器

为了进一步加强我们的内网安全,我们在原有硬WAF的基础上,又在内网使用的社区版的雷池WAF,作为应用上层的软WAF。从而实现多WAF防护的架构。 经过进一步了解,发现雷池WAF的上游转发代理是基于Tengine的,所以我们萌生出了一个想法,就是让雷池既可以具备WAF的功能,又具备负载均衡和故障切换的 ......
雷池 长亭 WAF 故障 服务器

k8s 1.26.4的安装步骤(使用kubeadm安装master+1节点) ——( centos7.9,cri-dockerd插件)

一:系统环境初始化(所有节点都需要操作)1.配置服务器时间保持一致yum -y install ntpdatentpdate ntp1.aliyun.com 添加定时同步 每天凌晨0点自动同步时间echo "0 0 * * * ntpdate ntp1.aliyun.com" >> /var/spo ......
节点 cri-dockerd 插件 步骤 centos7

修复grub引导故障

开机启动只能到: 一般此类情况为efi目录下centos或其它系统(redhat,ubuntu)目录下的grub.cfg文件有问题,可以是缺少此文件。 修复处理grub命令行下执行: ls ls (hd0,gpt1)/ #所有显示的分区都看一下,一个是确定各分区里的文件内容,另一个是要找到boot分 ......
故障 grub

Hadoop-Operation category READ is not supported in state standby 故障解决

在查询hdfs时或者执行程序向hdfs写入数据时遇到报错:Operation category READ is not supported in state standby 意思是:该主机状态为待机,不支持操作类别READ. 你会发现最基本的hdfs命令都不能执行,例如:hadoop fs -ls ......

Redis学习--------分片集群、散列插槽、集群伸缩、故障转移

Redis学习 分片集群、散列插槽、集群伸缩、故障转移 https://blog.csdn.net/qq_43719634/article/details/124911627 Redis集群添加新节点(水平扩展)、删除其中一个节点 https://blog.csdn.net/qq_33417321/ ......
集群 故障 Redis

故障排查

参考资料 服务器案例查询助手 > 典型场景案例指导 ......
故障

使用 kubeadm 安装 k8s 集群

# 背景 之前使用过`kubespray`​的 ansible playbook 安装集群,尽管此剧本是官方推荐使用的,但是它有以下缺点: * 剧本的编排太过于晦涩 * 创建集群的过程中,会产生许多必要的配置文件和依赖 ​![image](https://img2023.cnblogs.com/bl ......
集群 kubeadm k8s k8 8s

MHA故障恢复

[root@db04 ~]# cat recovery_mha.sh #!/bin/bash . /etc/init.d/functions slave_ip=("172.16.1.51" "172.16.1.52" "172.16.1.53" "172.16.1.54") for runt in ......
故障 MHA

记一次ORACLE的离奇故障,ORACLE bug导致数据库连接时断时通

故障表现: Windows server平台下 Java应用程序和plsql developer客户端都无法连接数据库 plsql developer 报错 ora-12541 sqlplus报错 ora-12560 用 lsnrctl status 查看监听 则一直显示正在连接... 处理过程: ......
ORACLE 故障 数据库 数据 bug

Kafka的监控和故障恢复

前言 说完Kafka在企业级应用中的使用之后,接下来避免不了的话题就是故障监控和恢复了,今天咱们也来聊聊这个话题 监控Kafka集群 Kafka集群的监控是确保其正常运行和性能优化的关键步骤。下面列出了一些常用的方法和工具来监控Kafka集群: JMX监控: Kafka提供了JMX(Java Man ......
故障 Kafka

实现redis哨兵,模拟master故障场景

1.概述 在哨兵(sentinel)机制中,可以解决redis高可用问题,即当master故障后可以自动将slave提升为master,从而可以保证redis服务的正常使用。 2.哨兵的实现 哨兵的前提是已经实现了一个redis的主从复制的运行环境,从而实现一个一主两从基于哨兵的高可用redis架构 ......
哨兵 故障 场景 master redis

WIN11 安装 SQL Server 2019,SQLSERVER2022, MYSQL 8.0 ,Doker,Mongodb失败故障分析

最近研究数据库性能调优遇到各种数据库各种装不上,不知道熬了多少根软白沙,熬了多少颗张三疯,问了多少AI,查了多少网页,熬了两天,终于搞明白了一件事:那就是WIN11 ON ARM (因为拿的是MAC PRO M2做.NET平台开发安装)SQL SERVER2019,SQL SERVER 2022,M ......
SQLSERVER 故障 Mongodb Server MYSQL

k8s之集群部署(kubeadm)

[master&node] 1.修改主机名 hostnamectl set-hostname master-01 cat >> /etc/hosts << EOF 172.28.32.1 master-01 172.28.32.2 worker-01 EOF 2.配置阿里云官方源 mkdir -p ......
集群 kubeadm k8s k8 8s

初识K8S-kubeadm安装

安装方式Kubeadm1.环境准备a.hosts文件,IP和主机名b.防火墙及selinuxc.内核参数配置 /etc/sysctl.d/k8s.conf net.bridge.bridge-nf-call-ip6tables = 1net.bridge.bridge-nf-call-iptable ......
K8S-kubeadm kubeadm K8 8S

【故障公告】遭遇用心良苦的疯狂攻击:DDoS + CC攻击

2023年10月2日19:32,收到阿里云的通知短信,最近几年几乎每年都会遇到短暂的 DDoS 攻击,为了减少攻击带来的影响,我们部署了好多台负载均衡,本以为和以前一样只是其中1-2台负载均衡受到攻击而被屏蔽。 但接下来接连不断的通知短信把我们惊呆了,我们针对不同线路部署的所有负载均衡全部被攻击,全... ......
故障 公告 DDoS

compattelrunner.exe 是 Windows 操作系统中的一个可执行文件。它是 Microsoft 官方提供的用于收集计算机性能数据和故障排除的工具,这些数据旨在帮助 Microsoft 监测和改进 Windows 操作系统。

compattelrunner.exe 是 Windows 操作系统中的一个可执行文件。它是 Microsoft 官方提供的用于收集计算机性能数据和故障排除的工具,这些数据旨在帮助 Microsoft 监测和改进 Windows 操作系统。 Compattelrunner.exe 的主要功能如下: ......

kernel:watchdog: BUG: soft lockup - CPU#1 stuck for 22s! [pgrep:33099] kernel:watchdog: BUG: soft lockup - CPU#3 stuck for 22s! [pidof:33116]故障处理

一、查看报错翻译 二、检查操作 一台虚拟机又kvm虚拟了5台虚拟机,并且跑了大量任务,感觉像负载过大,CPU扛不住导致,导致内核锁死。 三、解决办法 执行echo 30 > /proc/sys/kernel/watchdog_thresh,调整该值可以延长watchdog等待时间,最大为60s。 ......
watchdog kernel lockup stuck soft

PG 故障分析之 select count(*) 产生大量WAL 日志(wal_log_hint)

Hello, 大家好, 今天给大家分享的这个本周发生在生产环境的一个真实的案例。 故障的现象是: 主库短时间内生成了大量的WAL日志,触发了归档archive_command的操作,导致灾备中心的2台standby 机器同步中断。 Standby Log: FATAL: could not rece ......
wal_log_hint 故障 select count 日志