前言
数字化时代业务变得更加多样化,运营商加速其ICT基础设施建设和应用的数字化转型,但是目前的运维模式难以满足转型要求,日常运维将面临巨大的挑战,重新定义新一代智能运维势在必行。随着网络复杂性和新业务多样性的激增,网络需要提供更敏捷的支撑,对智能运维提出了迫切的需求。运营商在运维数字化转型中面临着多方面的挑战,需要制定更具体的数字化战略,完成运维流程,技术和人员的转型,实现智能运维。
运维数字化转型是运营商实现商业成功的必然选择。我们将通过本文与您分享安永针对新一代智能运维的方向、路径和特征的理解和研究。我们首先聚焦探讨当前运营商在运维数字化转型过程中面临的挑战和困局。在接下来的将重点介绍运营商如何在运维数字化转型的困局中突围,构建新一代智能运维的核心能力,找准拥抱智能运维的正确“姿势”赢得主动、实现自身转型成功。
一、当前面临的挑战和困局
1. 电信业务收入增长乏力,运营商需要借助数字化转型应对变化、保障业务发展
电信业务收入增长乏力,与互联网行业相比表现不佳:全球电信运营商收入在2016年出现回暖,但整体收入增长依然缓慢。2017年排名前十的电信运营商的收入是美股上市主要互联网巨头企业收入总和的1.4倍。到了 2021年,这种情况已经完全逆转了,这些互联网巨头企业的收入是电信运营商的1.5倍。2017—2021年,电信运营商收入复合年均增长率(CAGR)仅为2.24%,远低于互联网CAGR 23.64%。
电信运营商普遍开始转型,并在数字化基建、产品、运营、生态等多方面开展尝试:随着数字经济驶入“快车道”,全球数字化发展的临界点即将到来,企业数字化转型已经从引导期进入成熟和推广期。加快数字化转型进程是全球通信运营商的大势所趋,数字化转型既是全球运营商寻求自身生存发展的应对之举,也是拥抱数字经济商业机会与信息变革的主动选择,把握数字化转型窗口期刻不容缓。不同国际运营商基于各自优势主动探索数字化转型路径,在数字化基础设施、数字化产品、数字化运营、数字化生态等方面均进行了不同的尝试。
2. 网络、连接和业务复杂度不断增加,业务洞察需求不断增多,运营商亟须通过数字化、智能化能力提高运维能力和水平
网络及连接复杂,传统模式难支撑:网络日益复杂,2G/3G/4G/5G形成四世同堂叠加网,新老设备并存,带来了网络的复杂性。电信业务从语音通话业务到互联网业务,连接的重心从连接“人”向智联万“物”跨越,复杂网络及连接给运营商的管理和维护带来了相当大的挑战,导致运营成本(OPEX)持续上升。
另一方面,随着数字化发展,业务场景更加复杂,对新业务场景的网络保障提出了更高且差异化的服务水平协议(SLA)要求,同时也带来了与其配套的网络运营的复杂性及相应运维成本的增加,运营商陷入运维成本与服务质量难兼顾的困局。当下传统以工具辅助人为主的运维,不足以支撑大规模动态复杂网络,且运维成本和质量面临结构性矛盾,亟需进行数字化运维转型。
业务多样性增加,提出更高保障要求:5G行业用户对网络可用性、可靠性有更高的要求。运营商步入5G时代后,电信业务多样性显著增加,业务形态从B2C->B2H->B2X发展演变,大速率、超低时延、海量互联等业务对网络服务质量的保障能力提出更高要求。用户诉求更加敏捷的服务和卓越的用户体验,可基于个性化的需求快速提供服务供应、自助服务,且服务易于使用等。当前传统尽力而为的运维模式无法满足多样化的需求,亟需通过智能化手段进行业务保障,提升用户体验。
前端业务洞察对运维数据的需求增多:数字化时代用户需求日趋复杂,趋向小众化、个性化、复杂化。运营商85%的数据来自O域数据,包含上网行为、信令、位置、访问日志数据、URL解析数据、APP应用解析数据等,同时,随着数据量指数级增长及各类数字化需求日益剧增,亟须通过运维数据的治理,盘活数据以数据赋能精准营销、协助业务体验分析及运维、支撑网络投资回报分析及产品规划等,释放数据价值,支撑业务创新。
3. 运维数字化转型是一个复杂的体系化工程,纵观全球实践,实现转型成功需要关注战略、流程、组织和人才、技术等关键因素
缺乏一把手主导,战略定力不足:当前大多数企业存在的问题缺乏一把手主导,未将转型作为企业战略的核心内容。同时,企业面临投资决策难、资金短缺。数字化转型停留在数字化战略表面,并未有效推行实施。运维数字化转型是一把手工程,需要高层领导具有全局意识和前瞻性的高度,由上向下推行、鞭策做出厘革,才能达成转型目标。
难度预估过低,期望一步到位:转型过程常见的误区,未制定可行的渐进计划,错误估计平台建设及人员转型难度,期望一步到位。运营商意识到转型的重要性,制定了相关战略,但转型是一项复杂性、体系性、长期性的工程,涉及组织、人员、平台、技术等其难度不可低估。需要分阶段按照计划有序开展,通过不断深化认识、积极探索和实践,推动转型成功。
重建设、轻运营,未对流程进行重构:“重建设、轻运营”是普遍存在问题,转型前期侧重平台建设、先进技术的集成应用等,对业务流程梳理不够、流程优化考虑不全,平台未进入实际生产流,缺乏后期持续有效的运维管理,导致难以达到预期的效果。另外,未改变传统以网络为中心的运维模式,单纯地关注网络质量和性能的传统网络运维。为满足数字化业务需求,必须从以网络为中心的运维模式转型为以用户为中心的运维模式,关注业务质量和用户体验,从而全方位提升网络质量。
未重视组织变革,缺乏数字化人才:数字化转型从根本上来说是组织变更,而不是单纯的信息技术的工具化运用。当前领导层欠缺组织变革推动意愿,缺乏意愿和能力驱动组织变更,导致在转型道路渐行渐远。另一方面,基层员工能力素质不足,数字化转型需要“全才”支持,要兼具业务能力、全局观数字化理念和技能。在缺少数字化人才支持的状况下,较难充分释放数字技术的价值。
强调IT技术主导,与CT业务目标未能融合:随着数字化时代飞速发展的业务需求及一系列新技术的发展,IT和CT逐步从隔离走向融合。但是电信运营商传统网络中网元封闭、资源难以共享,由IT技术主导无法有效获取相关数据,或IT实现的功能对于CT业务没有明显的提升。需要从CT业务入手,综合考虑CT设备的特殊性,如:来源于不同厂商、来源于同一厂商不同型号、来源于同一型号不同系统版本之间的差异等,在此基础上开发相应的IT支撑,以实现网络的数字化运维。
数据割裂,无统一平台支撑:各域数据无法融合,业务支撑受限。B域、O域及M域间的数据存在壁垒,数据质量差,准确性和有效性难以保障,数据无法精准、高效地支撑业务发展及深入业务支持决策。另外,平台技术储备不足,无统一的平台和技术支撑,难以满足对海量数据存储、传输、管理及应用的需求,数据无法变现。平台和新技术是盘活数据的重要手段,在新技术的加持下,打通全方位、全过程、全领域,进行数据的融合共享,最大化数据资产价值。
安永认为,运维数字化转型是必然的趋势,是一个复杂的体系化工程。运营商想要在运维数字化转型的困局中突围实现转型成功,需围绕着数字化战略、流程、技术和组织人员4大关键要素着力建设。接下来,我们将继续介绍新一代智能运维的特征及实现运维数字化运维的关键要素。
二、新一代智能运维的特征及实现数字化运维的关键要素
1. 随着网络智能化,数字化运维从“人使用工具”向“人使能工具”模式转变
传统运维转变为数字化运维,本质上是从“人使用工具”演进为“人使能工具”。传统运维模式下,运维人员借助一定的工具,开展故障的识别、定界定位、恢复业务等工作,保障业务的延续性,其本质是工具辅助人工作。数字化运维模式下,基于传统运维知识沉淀,识别运维价值场景实现运维场景模型构建,开发可执行的运维工具,实现可以自主运行,自动修复问题,其本质是人使能工具工作。
2. 数字化运维主要特征:
- 数据驱动:电信领域数据及模型开放,分散数据统一治理、建模、共享、开发,驱动业务决策。
- 内置智能:电信模型和算法内嵌到日常运维、运营的生产作业流程,整体流程可预测、可辅助决策以及零接触的智能化运维。
- 自动化闭环:多维感知、自分析、自决策及自执行完整闭环,实现运维作业自动化及自治化,人聚焦于自动化工具的敏捷开发。
- DevOps开发:标准化开发环境和自动化交付流程,提高交付工作可预测性、效率、安全性,提高电信数字资产开发效率及重用性。
- 确定性运维:以专业知识和AI模型准确感知、预测中断和劣化事件,提前识别服务相关风险事件,让不确定性风险可防可控。
运维数字化转型是一个复杂的体系化工程,实现运维数字化运维的关键要素主要有4个,包括:数字化战略、运营流程、技术工具及数字化人才。
3. 数字化战略:明确转型目标方向,指明战略落地路径
开展数字化转型,首要任务就是要制定数字化转型战略,并将其作为发展战略的重要组成部分,把数据驱动的理念、方法和机制根植于发展战略全局。在运维领域,要明确如何变革传统的运维模式,如何通过变革体现商业价值并实现转型目标,并在财务投资层面有计划地推动数字化运维转型落地。
利用新技术适应并改造传统的运维模式。过去CT设备智能化程度较低,对于设备生成的数据,很难做到有效的采集、分析、价值化,十分依赖人员经验开展运维。随着5G、大数据、人工智能等技术的发展,大量网元信息、链路信息等网络资源数据能够纳入管理,大量需要通过人工判断与操作的运维工作可以被新技术替代,在提升效率的同时也能够提升运维质量。因此,需要将新技术的发展结合运维工作,探索新的运维模式。
明确数字技术可实现的用例和商业价值。在战略可行性方面,需要通过实际用例说明新的数字技术能够为运维带来实际的商业价值。例如:在某个特定的运维场景下,通过使用哪些数字化手段能够实现敏捷响应瞬时需求,减少业务损失,量化说明数字化运维模式带来的价值。
重新调整资本支出,优先考虑并专注于提高组织的数字化能力。数字化运维转型前期资本支出(CAPEX)投入较大,运营商需要充分对财务支出进行规划,计算对数字化运维的投资金额及回报周期。优先对组织的数字化基础能力进行提升,确保数字化转型的成功率,从而降低转型的风险成本支出,加快未来数字化转型投资的回报周期。
4. 运营流程:规范数字化运维流程,加速拓展数字化运维场景
流程和管理体系是数字化战略落地的重要组成部分。数字化运维需要适应的智能自动化流程与管理体系。在构建与保障流程正常运行的过程中,需要构建DevOps研运一体流程与价值驱动的数据治理体系,加速数字化运维场景的拓展。
从运营流程自动化过渡到智能自动化流程。当前,运营商对于运维作业均拥有相关的流程与管理体系,领先运营商在部分流程环节实现了基于新技术与工具的局部自动化,但是智能化水平还不足,较为依赖基于人工经验的规则编排。因此,运营商需要扩大流程自动化的应用范围,在更多的运维领域环节实现自动化,并逐渐使用人工智能等技术,建立运维数据与流程的映射,通过自学习的模式,智能化总结规则并执行。
构建DevOps研运一体流程。融合DevOps、精益和敏捷软件开发思想,构建研运一体化流程,加速从人“使用”工具转变为人“使能”工具。有效支撑敏捷运营,当前网络和业务复杂度不断增加,传统运维难以支撑,需要持续开发自动化工具进行敏捷运维,提升运维效率。有效提升交付效率与质量,建立开发规范,保障敏捷开发,缩短新价值场景开发和交付的周期,持续呈现价值,提升客户界面的价值感知。
构建价值驱动的数据治理体系。从业务价值出发,识别数据应用场景。围绕以数据分析为主的业务场景,开发数据价值,丰富业务场景,推进降本增效。在实现数据应用场景过程中完善数据范围、标准、规范等数据管理需求。从业务痛点出发,发现数据问题并实施治理。依据业务需求,定期开展数据审计,持续提升数据质量。构建适合实际业务需求运维数据治理体系,开展数据治理,保障数字化运维有序高效开展,提升数字化运维服务价值。
5. 技术工具:采用微服务的架构及新技术,支撑数字化运维系统价值实现
“工欲善其事,必先利其器”,数字化运维的转型离不开技术与工具的革新与应用。随着微服务架构、大数据、人工智能等技术的涌现,电信运维也相应地提出了面向业务的运维、自治运维、零业务影响和人工干扰等理念与目标。
将BSS+OSS架构演变为基于微服务的平台架构。传统业务支撑系统往往采用集中式单体式架构,系统臃肿庞大,难以迅速推出新功能,降低了电信企业的市场竞争力。使用开放、轻量、敏捷高效的微服务技术架构,能够基于业务需求,通过将功能分解到各个离散的服务中以实现对解决方案的解耦与快速响应。
建立综合数据平台以支持多维数据的运营。通过综合数据平台的建设,充分发挥数据资产的能力,将不同系统、不同部门的网络资源数据、网络运维数据、业务运营数据等数据集成整合、制定统一合理规范的数据提取口径、指定专业人员及时提取数据并定期维护。有利于实时监测分析,从异常数据中发现问题、及时找出原因并协助做出针对性的调整,增加决策的自由度、精准度和科学性,促进电信业务的精细化、敏捷运营管理。
开发编排能力以支持快速变化的业务需求。传统软件工具开发周期时间较长,且需要具备较高的代码能力。低代码/零代码的编排能力能拿来即用,对于一些需要快速响应且需求复杂程度较低的需求,业务人员可以通过编排对现有能力进行规则化组合,缩短开发的周期,满足多样化业务需求,提升用户体验。
试点成熟的数字化技术,以支持自动化和自治化运营。将运行成熟的大数据分析和人工智能/机器学习技术应用于数字化运维工作中,基于大量运维数据进行积极探索,在故障分析、根因推荐、智能调度、参数推荐、自动调测、自动配置等方面通过人工智能的手段辅助分析并推荐最优方案,实现运维自动化与自治化水平不断提升。
6. 数字化人才:培训高素质数字化人才,广泛推行DevOps
从“人使用工具”向“人使能工具”的模式演进下,数字化运维人员工作核心也从网络运维向帮助网络实现自动化运维转变,改变了原有运维人员的知识结构和工作习惯。技术无法完全代替人的作用,数字化转型需要具备数字化思维意识和掌握数字化能力的人才,需对人员的思想意识和能力要求上进行全方位转型赋能。
建立和培养DevOps和敏捷的文化。搭建支撑业务高效运转的DevOps组织体系及培养DevOps和敏捷软件开发的文化。不断提升管理层和运维人员对数字化转型的认证,转变原来以网络运维为中心较为狭隘的思想。以软件工程思想管理运维工作,定义日常典型的运维场景,提炼运维规则沉淀成可执行的代码,实现运维作业自动化和自治化。以价值驱动为导向,识别面向客户提供服务的价值场景,通过敏捷迭代开发交付高质量的服务,持续向客户呈现可被感知的服务价值。
提升运维人员IT+CT的核心技能。在原有以CT为主的能力结构基础上,强化IT的技能,补充数字化运维管理相关技能,加强大数据、人工智能/机器学习、软件架构等知识理解、开发和应用技能。使其具备“网络策略师”“编排工程师”“数据分析师”等新型运维角色的核心技能,更好与时俱进承担起数字化运维的任务。
培养运维人员高级分析能力。以数据为基础的高级分析能力,利用预测建模、统计方法、机器学习和流程自动化技术,结合平台工具的能力分析数据或业务信息,有效支撑前端部门的敏捷运营和敏捷规划,如支撑精准营销、敏捷业务开通、客户服务和支撑业务部门网络及服务/产品的规划。
总结
随着网络复杂程度的提升、用户对网络业务可用性需求的不断提高,同时伴随着电信运营商对于数字化、智能化运维的高度重视,逐步促进了电信网络运维的形态与内容更新,在服务理念、运作模式等多个方面开展了探索。在大数据、云计算、人工智能等新技术的推动下,运维管理模式从ITIL向DevOps演化,运维管理工具也发生了从ITOM、ITOA到AIOps的颠覆性变革。电信运营商需兼顾历史与未来需求,满足运行稳定与敏捷发展需要,从数字化战略、流程、技术、人才等多方面入手,向智能运维方向不断努力,走出一条符合电信网络发展特色的运维管理之路。
本文是为提供一般信息的用途所撰写,并非旨在成为可依赖的会计、税务、法律或其他专业意见。请向您的顾问获取具体意见。