36篇文章+16场直播,热门运维宝典等你来探索!

发表时间: 2023-12-16 09:30

36篇干货文章+16个直播议题回顾,包含可观测性、智能运维、监控告警、故障急救小妙招、运维转型&体系建设等热门内容,快来解锁周末假期的又一正确打开方式吧!

可观测性


  • 每日百亿查询请求,这么庞大的系统是咋敢玩可观测性的呢?-百度搜索中台
  • 全链路根因定位,虎牙APM可观测平台建设实践-匡凌轩
  • 入坑可观测体系建设后,才发现会遇到这么多难题……-陈成禧
  • PB级日志高效处理!去哪儿网分布式追踪系统实践-王鹏


智能运维


  • 一次令人窒息的云事故,逼我们肝出这个智能监控平台……-柯圣
  • 京东科技全链路故障诊断智能运维实践-张静
  • 用ClickHouse搭智能运维可观测性平台,简直不要太香……-高鹏
  • 浙江移动云原生运维数智化转型实践-王晓征
  • 建设银行在智能运维上的探索与实践-包航宇


监控告警


  • 减少90%无效告警!苦熬3年终于能睡整觉了……-程田&大明
  • 说出运维人的心声:为何监控如此痛苦?-Mathew Duggan
  • Prometheus监控指标查询性能调优-爱奇艺会员技术团队
  • 异常定位准确又高效!去哪儿网根因分析实践-梁成琰
  • 大厂性能测试监控指标及分析调优指南-牛金亮
  • 不要Prometheus,容器集群监控系统架构如何对症下药?-王坤
  • 适配金融业的应用监控标准化演进之路-胖亚鹏
  • 详解Prometheus四种指标类型,谁还不是个监控老司机了-小灰灰


故障急救小妙招


  • 八大生产故障的通用排查思路(不收藏后悔系列)-悟空
  • 一次棘手的容器故障,我终于知道SRE有多重要了……-Gin
  • 风险预警的架构这样做,让故障扼杀在摇篮之中……-谷林涛
  • 我的血泪故障复盘史,写给不想被祭天的运维-我是羽北
  • 肝完这篇稳定性建设万字总结,谁还吐槽我线上不稳定!-itegel
  • 大促稳定性保障深度复盘,包含应对措施和案例分析-Lost
  • 程序运行慢到离谱,谁想到数据库分片导致的……-池剑锋
  • 第一次操盘大促,稳定性保障如何做到万无一失?-孟闯


运维转型&体系建设


  • CMDB建设,为何最终总被沦为鸡肋?-三页
  • 说出运维人的心声:为何监控如此痛苦?-Mathew Duggan
  • DevOps是扯淡,让运维和开发都不堪重负?-Cory O’Daniel
  • 平台工程搭完,运维岗位真的不能干了吗?-三页
  • 业务指数级增长,可用性建设也可以如此稳当?-周甲黎
  • 这套SLO报警与运营体系,不允许还有SRE没看过!-武安闯
  • B站服务稳定性建设:高可用架构与多活治理-吉翔
  • 救火运维逆袭攻略:云原生+ DevOps+ SRE+ ITIL-刘亚丹
  • 降本增效没起色,CTO喊话造了这个效能平台-方勇
  • 降本30%+增效40%,这样落地FinOps省钱又省力!-钟仕骏
  • 云成本节省上亿,得物FinOps落地实践-家琪&子狐&Gin


精选16个热门直播+配套PPT干货


1、中国银行运维转型与敏捷开发探索实践:

  • 《中国银行的运维监控体系建设》
  • 《混沌工程在中国银行的探索与实践》
  • 《中国银行基于质量内建的DevOps实践》

2、甩掉技术债包袱,B站的SRE体系建设与转型实践:

  • 《服务稳定性建设:高可用架构与多活治理》
  • 《B站应用降本增效与容量运营治理》
  • 《SLO运营体系与报警:如何从工程理论探索到最佳实践》
  • 《B站风险预警的架构设计及落地实践》

3、聚焦云原生新范式 重塑IT运维核心竞争力:

  • 《如何构建云原生可观测性体系》
  • 《构建全生命周期的云原生安全防护》
  • 《中小银行可用性和应急管理应用与实践》

4、重塑IT运维新模式,探索新兴技术的规模化落地:

  • 云原生时代,如何加速建设运维技术保障体系》
  • 《多云场景下的基础设施建设挑战与对策》
  • 《趣丸可观测体系建设实践》
  • 《趣丸AIOps探索与实践》

5、《转转一体化监控系统搭建实战》

6、《平安健康千亿级全链路追踪系统的建设与实践》

PPT下载:
pan.baidu.com/s/1VxJY53L1DeQja0MRoFaevA#list/path=%2F