36人参与 • 2024-07-28 • Java
阿里巴巴集团内部拥有着百万级的容器数量连同上面承载的上千个业务,因此,sidecar 容器的管理与升级也就成为了亟待完善的主题。因此,我们总结了内部许多 sidecar 容器的通用化需求,并将其沉淀到 openkruise 上面,最终抽象为 sidecarset 作为管理和升级种类繁多 sidecar 容器的利器。
==========================================================================================
sidecarset 是 openkruise 中针对 sidecar 抽象出来的概念,负责注入和升级 kubernetes 集群中的 sidecar 容器,是 openkruise 的核心 workload 之一。它提供了非常丰富的功能,用户使用 sidecarset 可以非常方便实现 sidecar 容器的管理。主要特性如下:
配置单独管理:为每一个 sidecar 容器配置单独的 sidecarset 配置,方便管理。
自动注入:在新建、扩容、重建 pod 的场景中,实现 sidecar 容器的自动注入。
原地升级:支持不重建 pod 的方式完成 sidecar 容器的原地升级,不影响业务主容器,并包含丰富的灰度发布策略
1. sidecar logging architectures
应用日志可以让你了解应用内部的运行状况,日志对调试问题和监控集群活动非常有用。应用容器化后,最简单且最广泛采用的日志记录方式就是写入标准输出和标准错误。
但是,在当前分布式系统、大规模集群的时代下,上述方案还不足以达到生产环境的标准。首先,对于分布式系统而言,日志都是分散在单个容器里面,没有一个统一汇总的地方。其次,如果发生容器崩溃、pod 被驱逐等场景,会出现日志丢失的情况。因此,需要一种更加可靠,独立于容器生命周期的日志解决方案。
sidecar logging architectures 是将 logging agent 放到一个独立的 sidecar 容器中,通过共享日志目录的方式,实现容器日志的采集,然后存储到日志平台的后端存储。
阿里巴巴以及蚂蚁集团内部同样也是基于这种架构实现了容器的日志采集,下面我将介 绍openkruise sidecarset 如何助力 sidecar 日志架构在 kubernetes 集群中的大规模落地实践。
openkruise sidecarset 基于 kubernetes admissionwebhook 机制实现了 sidecar 容器的自动注入,因此只要将 sidecar 配置到 sidecarset 中,不管用户用 cloneset、deployment、statefulset 等任何方式部署,扩出来的 pod 中都会注入定义好的 sidecar 容器。
sidecar 容器的所有者只需要配置自身的 sidecarset,就可以在业务无感知的情况下完成 sidecar 容器的注入,这种方式极大的降低了 sidecar 容器使用的门槛,也方便了 sidecar 所有者的管理工作。为了满足 sidecar 注入的多种场景,sidecarset 除 containers 之外还扩展了如下字段:
apiversion: apps.kruise.io/v1alpha1
kind: sidecarset
metadata:
name: test-sidecarset
spec:
selector:
matchlabels:
app: web-server
namespace: ns-1
containers:
image: logtail:1.0.0
volumemounts:
mountpath: /var/log/web
sharevolumepolicy: disabled
transferenv:
envname: tz
volumes:
emptydir: {}
pod 选择器
支持 selector 来选择要注入的 pod,如示例中将选择 labels[app] = web-server 的 pod,将 logtail 容器注入进去,也可以在所有的 pod 中添加一个 labels[inject/logtail] = true 的方式,来实现全局性的 sidecar 注入。
namespace:sidecarset 默认是全局生效的,如果只想对某一个 namespace 生效,则配置该参数。
数据卷共享
共享指定卷:通过 volumemounts 和 volumes 可以完成与主容器的特定卷的共享,如示例中通过共享 web-log volume 来达到日志采集的效果。
共享所有卷:通过 sharevolumepolicy = enabled | disabled 来控制是否挂载 pod 主容器的所有卷卷,常用于日志收集等 sidecar,配置为 enabled 后会把应用容器中所有挂载点注入 sidecar 同一路经下(sidecar 中本身就有声明的数据卷和挂载点除外)。
环境变量共享:可以通过 transferenv 从其它容器中获取环境变量,会把名为 sourcecontainername 容器中名为 envname 的环境变量拷贝到本 sidecar 容器,如示例中日志 sidecar 容器共享了主容器的时区 tz,这在海外环境中尤其常见。
sidecarset 不仅实现 sidecar 容器的注入,而且复用了 openkruise 中原地升级的特性,实现了在不重启 pod 和主容器的前提下单独升级 sidecar 容器的能力。由于这种升级方式基本上能做到业务方无感知的程度,所以 sidecar 容器的升级已不再是上下交困的难题,从而极大解放了 sidecar 的所有者,提升了 sidecar 版本迭代的速度。
为了满足一些复杂的 sidecar 升级场景,sidecarset 除了原地升级以外,还提供了非常丰富的灰度发布策略。
灰度发布应该算是日常发布中最常见的一种手段,它能够比较平滑的完成 sidecar 容器的发布,尤其是在大规模集群的场景下,强烈建议使用这种方式。下面是首批暂停,后续基于最大不可用滚动发布的例子,假设一个有 1000 个 pod 需要发布:
apiversion: apps.kruise.io/v1alpha1
kind: sidecarset
metadata:
name: sidecarset
spec:
updatestrategy:
type: rollingupdate
partition: 980
maxunavailable: 10%
上述配置首先发布(1000 - 980)= 20 个 pod 之后就会暂停发布,业务可以观察一段时间发现 sidecar 容器正常后,调整重新 update sidecarset 配置:
apiversion: apps.kruise.io/v1alpha1
kind: sidecarset
metadata:
name: sidecarset
spec:
updatestrategy:
type: rollingupdate
maxunavailable: 10%
这样调整后,对于余下的 980 个 pod,将会按照最大不可用的数量(10% * 1000 = 100)的顺序进行发布,直到所有的 pod 都发布完成。
partition 的语义是保留旧版本 pod 的数量或百分比,默认为 0
。这里的 partition
不表示任何 order
序号。如果在发布过程中设置了 partition
:
如果是数字,控制器会将 (replicas - partition)
数量的 pod 更新到最新版本。
如果是百分比,控制器会将 (replicas * (100% - partition))
数量的 pod 更新到最新版本。
maxunavailable 是发布过程中保证的,同一时间下最大不可用的 pod 数量,默认值为 1。用户可以将其设置为绝对值或百分比(百分比会被控制器按照 selected pod 做基数来计算出一个背后的绝对值)。
注意:maxunavailable 和 partition 两个值是没有必然关联。举例:
当 {matched pod}=100,partition=50,maxunavailable=10,控制器会发布 50 个 pod 到新版本,但是发布窗口为 10,即同一时间只会发布 10 个 pod,每发布好一个 pod 才会再找一个发布,直到 50 个发布完成。
当 {matched pod}=100,partition=80,maxunavailable=30,控制器会发布 20 个 pod 到新版本,因为满足 maxunavailable 数量,所以这 20 个 pod 会同时发布。
对于有金丝雀发布需求的业务,可以通过 strategy.selector 来实现。方式:对于需要率先金丝雀灰度的 pod 打上固定的 labels[canary.release] = true,再通过 strategy.selector.matchlabels 来选中该 pod。
apiversion: apps.kruise.io/v1alpha1
kind: sidecarset
metadata:
name: sidecarset
spec:
updatestrategy:
type: rollingupdate
selector:
matchlabels:
maxunavailable: 10%
上述配置只会发布打上金丝雀 labels 的容器,在完成金丝雀验证之后,通过将 updatestrategy.selector 配置去掉,就会继续通过最大不可用来滚动发布。
sidecarset 对于 pod 的升级顺序,默认按照如下规则:
对升级的 pod 集合,保证多次升级的顺序一致。
选择优先顺序是(越小优先级越高):unscheduled < scheduled, pending < unknown < running, not-ready < ready, newer pods < older pods。
除了上述默认发布顺序之外,scatter 打散策略允许用户自定义将符合某些标签的 pod 打散到整个发布过程中。比如,对于像 logtail 这种全局性的 sidecar container,一个集群当中很可能注入了几十个业务 pod,因此可以使用基于 应用名 的方式来打散 logtail 的方式进行发布,实现不同应用间打散灰度发布的效果,并且这种方式可以同最大不可用一起使用。
apiversion: apps.kruise.io/v1alpha1
kind: sidecarset
metadata:
name: sidecarset
spec:
updatestrategy:
type: rollingupdate
scatterstrategy:
value: nginx
value: web-server
value: api-gateway
maxunavailable: 10%
阿里巴巴以及蚂蚁集团内部已经大规模的使用 sidecarset 来管理 sidecar 容器,下面我将通过日志采集 logtail sidecar 来作为一个示例。
apiversion: apps.kruise.io/v1alpha1
kind: sidecarset
metadata:
name: logtail-sidecarset
spec:
selector:
matchlabels:
app: nginx
updatestrategy:
type: rollingupdate
maxunavailable: 10%
containers:
image: log-service/logtail:0.16.16
command:
sh
-c
/usr/local/ilogtail/run_logtail.sh 10
livenessprobe:
exec:
command:
/etc/init.d/ilogtaild
status
resources:
limits:
memory: 512mi
requests:
cpu: 10m
memory: 30mi
volumemounts:
mountpath: /var/log/nginx
transferenv:
envname: tz
volumes:
emptydir: {}
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、oppo等大厂,18年进入阿里一直到现在。
深知大多数java工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年java开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上java开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
如果你觉得这些内容对你有帮助,可以扫码获取!!(备注java获取)
搞定算法,面试字节再不怕,有需要文章中分享的这些二叉树、链表、字符串、栈和队列等等各大面试高频知识点及解析
最后再分享一份终极手撕架构的大礼包(学习笔记):分布式+微服务+开源框架+性能优化
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》
va开发知识点,真正体系化!**
由于文件比较大,这里只是将部分目录截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且会持续更新!
如果你觉得这些内容对你有帮助,可以扫码获取!!(备注java获取)
搞定算法,面试字节再不怕,有需要文章中分享的这些二叉树、链表、字符串、栈和队列等等各大面试高频知识点及解析
最后再分享一份终极手撕架构的大礼包(学习笔记):分布式+微服务+开源框架+性能优化
[外链图片转存中…(img-ykygph7s-1713458257861)]
《互联网大厂面试真题解析、进阶开发核心学习笔记、全套讲解视频、实战项目源码讲义》
您想发表意见!!点此发布评论
版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。
发表评论