36篇干货文章+16个直播议题回顾,包含可观测性、智能运维、监控告警、故障急救小妙招、运维转型&体系建设等热门内容,快来解锁周末假期的又一正确打开方式吧!
可观测性
- 每日百亿查询请求,这么庞大的系统是咋敢玩可观测性的呢?-百度搜索中台
- 全链路根因定位,虎牙APM可观测平台建设实践-匡凌轩
- 入坑可观测体系建设后,才发现会遇到这么多难题……-陈成禧
- PB级日志高效处理!去哪儿网分布式追踪系统实践-王鹏
智能运维
- 一次令人窒息的云事故,逼我们肝出这个智能监控平台……-柯圣
- 京东科技全链路故障诊断智能运维实践-张静
- 用ClickHouse搭智能运维可观测性平台,简直不要太香……-高鹏
- 浙江移动云原生运维数智化转型实践-王晓征
- 建设银行在智能运维上的探索与实践-包航宇
监控告警
- 减少90%无效告警!苦熬3年终于能睡整觉了……-程田&大明
- 说出运维人的心声:为何监控如此痛苦?-Mathew Duggan
- Prometheus监控指标查询性能调优-爱奇艺会员技术团队
- 异常定位准确又高效!去哪儿网根因分析实践-梁成琰
- 大厂性能测试监控指标及分析调优指南-牛金亮
- 不要Prometheus,容器集群监控系统架构如何对症下药?-王坤
- 适配金融业的应用监控标准化演进之路-胖亚鹏
- 详解Prometheus四种指标类型,谁还不是个监控老司机了-小灰灰
故障急救小妙招
- 八大生产故障的通用排查思路(不收藏后悔系列)-悟空
- 一次棘手的容器故障,我终于知道SRE有多重要了……-Gin
- 风险预警的架构这样做,让故障扼杀在摇篮之中……-谷林涛
- 我的血泪故障复盘史,写给不想被祭天的运维-我是羽北
- 肝完这篇稳定性建设万字总结,谁还吐槽我线上不稳定!-itegel
- 大促稳定性保障深度复盘,包含应对措施和案例分析-Lost
- 程序运行慢到离谱,谁想到数据库分片导致的……-池剑锋
- 第一次操盘大促,稳定性保障如何做到万无一失?-孟闯
运维转型&体系建设
- CMDB建设,为何最终总被沦为鸡肋?-三页
- 说出运维人的心声:为何监控如此痛苦?-Mathew Duggan
- DevOps是扯淡,让运维和开发都不堪重负?-Cory O’Daniel
- 平台工程搭完,运维岗位真的不能干了吗?-三页
- 业务指数级增长,可用性建设也可以如此稳当?-周甲黎
- 这套SLO报警与运营体系,不允许还有SRE没看过!-武安闯
- B站服务稳定性建设:高可用架构与多活治理-吉翔
- 救火运维逆袭攻略:云原生+ DevOps+ SRE+ ITIL-刘亚丹
- 降本增效没起色,CTO喊话造了这个效能平台-方勇
- 降本30%+增效40%,这样落地FinOps省钱又省力!-钟仕骏
- 云成本节省上亿,得物FinOps落地实践-家琪&子狐&Gin
精选16个热门直播+配套PPT干货
1、中国银行运维转型与敏捷开发探索实践:
- 《中国银行的运维监控体系建设》
- 《混沌工程在中国银行的探索与实践》
- 《中国银行基于质量内建的DevOps实践》
2、甩掉技术债包袱,B站的SRE体系建设与转型实践:
- 《服务稳定性建设:高可用架构与多活治理》
- 《B站应用降本增效与容量运营治理》
- 《SLO运营体系与报警:如何从工程理论探索到最佳实践》
- 《B站风险预警的架构设计及落地实践》
3、聚焦云原生新范式 重塑IT运维核心竞争力:
- 《如何构建云原生可观测性体系》
- 《构建全生命周期的云原生安全防护》
- 《中小银行可用性和应急管理应用与实践》
4、重塑IT运维新模式,探索新兴技术的规模化落地:
- 《云原生时代,如何加速建设运维技术保障体系》
- 《多云场景下的基础设施建设挑战与对策》
- 《趣丸可观测体系建设实践》
- 《趣丸AIOps探索与实践》
5、《转转一体化监控系统搭建实战》
6、《平安健康千亿级全链路追踪系统的建设与实践》
PPT下载:
pan.baidu.com/s/1VxJY53L1DeQja0MRoFaevA#list/path=%2F