etcd 参数优化-526互联

heartbeat-interval

目前 heartbeat-interval 使用默认值即100 , 较小的心跳间隔会导致发送频繁的消息，消耗 CPU 和网络资源。而较大的心跳间隔，又会导致检测到 Leader 故障不可用耗时过长，影响业务可用性。我们可以将其优化为300

election-timeout

目前 election-timeout 使用默认值即1000 election-timeout至少为heartbeat-interval的10倍因此需要调整为 3000

snapshot-count

snapshot-count 值过大它会消耗较多内存，过小则的话在某节点数据落后时，如果它请求同步的日志条目 Leader 已经压缩了，此时我们就不得不将整个 db 文件发送给落后节点，然后进行快照重建。快照重建是极其昂贵的操作，对服务质量有较大影响，因此我们需要尽量避免快照重建。etcd 3.2 版本之前 snapshot-count 参数值是 1 万，比较低，短时间内大量写入就较容易触发慢的 Follower 节点快照重建流程。etcd 3.2 版本后将其默认值调大到 10 万，可以将该参数调整为默认值即10万。（tcs存在一行log数据量过大的问题如果改成10w可能会导致内存占用过大暂时维持1w）