12月27日,由中国信息通信研究院、中国通信标准化协会主办的2023系统稳定性与精益软件工程大会-云服务稳定性保障技术专场暨稳定性保障实验室年会在北京举行。会上,天翼云携手中国信通院以及业界多家头部机构,共同发布《可观测性技术发展研究报告》;“天翼云底座可观测能力建设实践”荣获第二届云系统稳定安全运行优秀案例“可观测性实践优秀案例”证书。在业务系统SRE实践专场,天翼云操作系统TeleCloudOS 4.0斩获“混沌工程成熟度水平检验证书”,天翼云科技有限公司运维专家赵磊在会上分享了天翼云基于全栈监控的运维实践。
坚持科技创新,云服务安全稳定性获业界认可
随着数字技术不断发展,现代信息系统通常呈现出规模巨大、结构复杂、采用分布式架构等特点,传统的系统监控和调试方法难以满足全面观测和管理的需求,给故障排查、性能优化和数据分析等任务带来巨大挑战。可观测性技术作为服务稳定性体系建设中的重要一环,有助于企业迅速发现并解决问题,成为现代企业数字化管理不可或缺的关键技术之一。
天翼云作为云服务国家队,基于自身业务特色,设计并提出了“监”“测”“控”“观”“量”五位一体的服务全生命周期和全链路的可观测解决方案,全面提升云服务稳定性保障能力,助力企业增强业务韧性。
在此次大会上,“天翼云底座可观测能力建设实践”荣获第二届云系统稳定安全运行优秀案例“可观测性实践优秀案例”证书,可观测能力水平与实践应用获业界权威认可。
为进一步助力企业提升对系统内部的深度洞察能力,使其能够迅速发现问题、准确定位故障,并及时采取措施进行故障修复和性能优化,天翼云积极携手产学研各界进行可观测性技术研究。大会现场重磅发布了由中国信通院牵头,联合天翼云等多家企业共同编制的《可观测性技术发展研究报告》,探讨和解释了可观测性技术的概念、关键技术、落地路径和发展趋势,并深入分析了可观测性技术在故障排查、成本优化、数据分析等方面的应用和实践,旨在提供有价值的指导和深入的理解。
打造稳定技术底座支撑,护航企业行稳致远
在用户高频访问成为常态、系统复杂性呈指数上升的背景下,SRE(站点可靠性工程)作为一种新型的运维方法,能够保障企业系统和应用平稳可靠性,正受到越来越广泛的关注度。
在业务系统SRE实践专场,天翼云科技有限公司运维专家赵磊谈到,SRE的核心是监控,面向全场景、全业务的端到端监控是稳定性保障中最重要的一环。天翼云的稳定性保障体系建立在完善的监控能力之上,覆盖从基础设施到客户体验的各个层面。基于全栈监控,天翼云构建了智能运维能力,包括智能诊断、智能恢复和智能预测,实现基于逻辑推理的诊断定位、基于故障特征识别的业务快速恢复,以及容量水位及趋势预测,为天翼云的稳定运行保驾护航。
此外,天翼云操作系统TeleCloudOS 4.0通过了Q/KXY SS005--2021《混沌工程成熟度》标准工程熟练度、应用成效度和组织建设度的检验,荣获中国信通院授予的“混沌工程成熟度水平检验证书”。
在全面上云用云的背景下,各行业业务的正常运转高度依赖云上系统。云服务的稳定运行已经成为社会经济活动平稳开展的重要基础。未来,天翼云将持续坚持科技创新,夯实天翼云底座稳定性保障能力体系,为行业高质量发展提供更安全稳定的数智底座。