《Kubernetes故障篇:calico/node is not ready: BIRD is not ready》

发布时间 2023-03-26 18:59:27作者: 牧之丨

文章目录
一、背景信息
二、解决方法
总结:整理不易,如果对你有帮助,可否点赞关注一下?

一、背景信息
k8s集群部署后发现calico的pod未通过健康检查,如下所示:

通过命令kubectl describe pods calico-node-7cnct -n kube-system,查看其中一个pod信息,如下所示:

说明:通过报错日志分析估计calico没有发现node节点实际的网卡名称。

二、解决方法
解决方案:调整calicao网络插件的网卡发现机制,修改IP_AUTODETECTION_METHOD对应的value值。官方提供的yaml文件中,ip识别策略(IPDETECTMETHOD)没有配置,即默认为first-found,这会导致一个网络异常的ip作为nodeIP被注册,从而影响node-to-node mesh。我们可以修改成can-reach或者interface的策略,尝试连接某一个Ready的node的IP,以此选择出正确的IP。

操作如下:

修改calico的yaml文件,添加配置项
vim calico.yaml

# Cluster type to identify the deployment type
- name: IP_AUTODETECTION_METHOD #增加内容
value: "interface=eth.*" 或者 value: "interface=eth0" #增加内容
# 下面内容是calico.yaml里默认的不修改
- name: CLUSTER_TYPE
value: "k8s,bgp"
# Auto-detect the BGP IP address.
- name: IP
value: "autodetect"
# Enable IPIP
- name: CALICO_IPV4POOL_IPIP
value: "Always"

重新在master节点上部署

[root@k8s-master-201 install-kubernetes]# kubectl apply -f calico.yaml