news 2026/5/8 18:07:07

节点NotReady后容器驱逐时间调整

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
节点NotReady后容器驱逐时间调整

一、简介

早期k8s版本中,Kubernetes Controller Manager 有一些相关参数,用于控制节点监控和 Pod 驱逐的行为。

  • --node-monitor-grace-period=40s(节点失联后等待多久才标记为不健康)

  • --node-monitor-period=30s(Controller Manager 检查节点状态的频率)

  • --pod-eviction-timeout=5m0s(节点标记为不健康后,等待多久才开始驱逐 Pod)

但是在k8s 1.20版本后,节点失联后 Pod 的驱逐逻辑已完全由基于污点的驱逐 (Taint Based Evictions)机制接管。完全废弃了--pod-eviction-timeout参数。

参考官方链接:https://kubernetes.io/zh-cn/docs/reference/command-line-tools-reference/kube-apiserver/

接下来,我们测试一下,看看是否有效。

二、验证

2.1 先创建一个测试用例

现在可以看到,默认的容忍度时间是300秒。

2.2 修改kube-apiserver的启动参数

vim /etc/kubernetes/manifests/kube-apiserver.yaml #添加以下启动参数 - --default-not-ready-toleration-seconds=60 - --default-unreachable-toleration-seconds=60

#重启kube-apsierver容器 mv kube-apiserver.yaml /tmp/ mv /tmp/kube-apiserver.yaml . #检查容器是否正常启动 docker ps|grep apiserver docker logs ${docker_id} kubectl get pod -n kube-system -o wide|grep kube-apiserver

2.3 验证驱逐时间

修改完kube-apiserver的启动参数后,只对新增容器有效,存量容器需要重启后生效:

接下来咱们模拟node节点故障,触发节点驱逐:

结果符合预期(可能有微小误差):

时间

动作

10:34:20

节点关机

10:35:11

节点NotReady

10:36:10

驱逐容器

三、扩展

有关于pod驱逐的效率可以参考kube-controller-manager的启动参数,官方链接:https://kubernetes.io/zh-cn/docs/reference/command-line-tools-reference/kube-controller-manager/

相关参数:

参数

含义

--large-cluster-size-threshold int32 默认值:50

node-lifecycle-controller 在执行 Pod 驱逐操作逻辑时, 基于此标志所设置的节点个数阈值来判断所在集群是否为大规模集群。 当集群规模小于等于此规模时,--secondary-node-eviction-rate会被隐式重设为 0。 注意:如果节点位于多个区域中,则此阈值将被每个区域视为区域节点大小阈值,以独立确定节点驱逐率。

--node-eviction-rate float 默认值:0.1

当某区域健康时,在节点故障的情况下每秒删除 Pods 的节点数。 请参阅--unhealthy-zone-threshold以了解“健康”的判定标准。 这里的区域(zone)在集群并不跨多个区域时指的是整个集群。

--secondary-node-eviction-rate float32 默认值:0.01

当一个区域不健康造成节点失效时,每秒钟从此标志所给的节点上删除 Pod 的节点个数。 参见--unhealthy-zone-threshold以了解“健康与否”的判定标准。 在只有一个区域的集群中,区域指的是整个集群。如果集群规模小于--large-cluster-size-threshold所设置的节点个数时, 此值被隐式地重设为 0。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/30 23:10:49

深入浅出窗口看门狗(WWDG):从原理到实战,守护MCU系统稳定运行

在嵌入式系统开发中,“稳定性”是贯穿始终的核心诉求。无论是工业控制中的PLC、汽车电子中的ECU,还是智能家居中的传感器节点,一旦程序出现“跑飞”“死循环”等异常,都可能引发设备故障、数据丢失甚至安全事故。为应对这类问题&a…

作者头像 李华
网站建设 2026/5/2 19:48:43

Qwen2-VL微调终极指南:3步快速上手视觉语言模型训练

Qwen2-VL微调终极指南:3步快速上手视觉语言模型训练 【免费下载链接】Qwen2-VL-Finetune An open-source implementaion for fine-tuning Qwen2-VL and Qwen2.5-VL series by Alibaba Cloud. 项目地址: https://gitcode.com/gh_mirrors/qw/Qwen2-VL-Finetune …

作者头像 李华
网站建设 2026/5/9 3:16:00

XAPK转换实战指南:轻松解决安卓应用安装困扰

XAPK转换实战指南:轻松解决安卓应用安装困扰 【免费下载链接】xapk-to-apk A simple standalone python script that converts .xapk file into a normal universal .apk file 项目地址: https://gitcode.com/gh_mirrors/xa/xapk-to-apk 你是否遇到过下载的安…

作者头像 李华
网站建设 2026/4/30 23:09:08

终极阿尔比恩OL数据分析工具完整指南:快速掌握游戏数据奥秘

终极阿尔比恩OL数据分析工具完整指南:快速掌握游戏数据奥秘 【免费下载链接】AlbionOnline-StatisticsAnalysis A tool with many features for the game Albion Online 项目地址: https://gitcode.com/gh_mirrors/al/AlbionOnline-StatisticsAnalysis 在《阿…

作者头像 李华
网站建设 2026/5/3 17:03:44

用友网页版打不开,界面一直转圈

有时候使用用友T 时经常会遇到页面一直转圈,加载不出来的情况解决方案:点击电脑上的开始程序,找到畅捷通T服务管理器,点击切换到iis如果切换到iis失败,可在【控制面板】位置找到【程序】-【程序和功能】,点…

作者头像 李华