运维:你的业务保障者

发表时间: 2022-11-30 22:42

前言:为什么今天会谈一谈这个话题呢?其实一开始在思考自己到底是做什么产品或业务的,都是说运维产品,那很多时候并不知道运维是什么,所以就来说下运维是什么。

一大清早就能在菜市场买到新鲜的菜品、鸡鱼肉蛋,可是这些物品也不是自然飘过来的,司机师傅可能大半夜就在路上运输、搬卸师傅可能在凌晨进行装卸,还有那些店主可能凌晨一两点去批发市场采购运回到自家店里。

类似的,大家每天都在使用微信、刷抖音,还有各种软件、系统以及所依赖的机房、线路、服务器等等,这些也不会天然地就正常运作,背后负责其稳定运行,就是运维工作。

运维,通常属于IT技术部门,与研发、测试一并支撑起企业软件服务,机房/网络/操作系统相关的底层工作由专人负责,成为基础架构组,同时可能为运维人员提供运维基础工具;而上层和应用软件相关的工作则由运维人员负责,成为运维保障组。每个企业或公司可能会根据不同的组织架构划分,但是事情总是要做滴!

按照产品或软件的整个生命周期管理,运维工程师是相当重要的一部分,集合网络、系统、数据库、开发、安全工作于一身的“复合性人才”,负责维护和确保整个服务的高可用性,同时不断优化系统架构、提升部署效率、优化资源利用率。

无论做什么运维,最基本的职责都是保证业务能够稳定运行所以必须成为业务稳定性的owner。运维工作其实很苦逼,如果将程序员写的代码比作是生孩子,那么运维就是负责养孩子长大,全天候随时待命,就像保姆一样,管好这个孩子的“衣食住行”;还要像救火队员一样,哪里着火了就需要立即去处理。

根据运维的工作划分,区分以下两类:

1)IT运维

IT运维是IT管理的核心和重点部分,这类运维人员管理的内容可细分为六种:

(1)设备管理:对网络设备、服务器设备、操作系统运行状况进行监控。

(2)应用/服务管理:对各种应用支持软件如数据库、中间件以及各种通用或特定服务的监控管理,如交易系统、DNS、Web等的监控与管理。

(3)数据/存储/容灾管理:对系统和业务数据进行统一存储、备份和恢复。

(4)目录/内容管理:管理企业需要统一发布或因人定制的公共信息。

(5)资源资产管理:管理企业中各IT系统的资源资产情况,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交互。

(6)信息安全管理:该部分包含了许多方面的内容,如企业安全组织方式、资产分类与控制、人员安全、物理与环境安全、通信与运营安全、访问控制、业务连续性管理等。

2)业务运维

与IT运维不同,业务运维更多是从组织和业务的层面出发,基于各类组织运转(而不是机器设备)设定的指标对系统进行优化和调整,最终使得系统设备运转目标与业务目标对齐。

业务运维包含以下六个方面:

(1)业务管理:包含对企业自身核心业务系统运行情况进行监控与管理,对于业务的管理,主要关注该业务系统的CSF(关键成功因素Critical Success Factors)和KPI(关键绩效指标Key Performance Indicators)。

(2)从整个组织的角度,针对各业务系统提供业务需求整理、需求变更和用户体验优化的加载、维护、配置、升级、补丁等方面的实现服务;

(3)面向整个组织提供各业务系统的问题受理、响应、处理和转交等方面的服务;

(4)面向整个组织的各级机构和各业务部门提供各类业务系统的操作指导、数据应用、模块分配、参数设置等;

(5)面向整个组织提供客户端安装、配置、升级等技术支持;

(6)面向组织以外的部门提供相关信息(按机关相关部门要求)、回答网站咨询、信箱和电话提出的各类业务问题。

上述两类运维工作,随着数字化转型和业务的深入,渐渐地将两类工作内容进行融合,总结下来,运维的工作就有这么几点:(1)故障巡检,问题定位及排查;(2)系统、应用的部署维护;(3)系统、应用相关参数的配置;(4)数据备份;(5)脚本/补丁/升级包的更新;(6)云/本地计算资源申请使用等配置设置;(7)日常服务器运行状态的监控;(8)处理紧急运维事故;(9)技术或服务支持等。