点击空白处退出提示
作品详情
该集群规模大,可用性要求高。通过 ansible 自动化部署整个集群,通过调整 etcd 和 apiserver 相关参数,使用 trimaran 替换原 k8s 调度器,优化 apiserver 缓存大小,调整客户端 list 使用方式等手段提高集群的高可用性。
工作内容:
1. 使用 ansible 自动化部署集群;
2. 调整 etcd db 容量,数据盘直接使用本地 ssd ,自动压缩历史数据和定期碎片清理,优化心跳间隔和选举超时时间;
3. 将原 k8s 调度器替换为基于实时负载的调度器;
4. 使用 Go 开发基于 webhook 的统一认证服务。
项目成果:
1. 快速完成 2000+ 节点的 k8s 集群搭建;
2. 保证了 etcd 集群零宕机;
3. 替换默认 k8s 调度器,解决节点资源使用不均衡问题;
4. 将 k8s 认证接入企业统一认证,保证集群安全性。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论