包含【
sre
】标签的所有文章-
应急响应总结 阿里云香港机房故障始末给企业运维的教训
对应急响应总结:从阿里云香港机房故障始末中提炼企业运维应吸取的教训,覆盖监控告警、沟通流程、容灾设计与演练改进建议,提升可用性与恢复能力。
阿里云香港机房故障应急响应运维容灾教训SRE监控演练 -
香港站群服务器子云实现灰度发布与流量切分的技术实现指南
面向香港站群服务器子云的灰度发布与流量切分技术实现指南,涵盖架构设计、路由策略、灰度流水线、监控与回滚,以及合规与网络注意事项。
香港站群服务器子云灰度发布流量切分技术实现指南