面向5G的技术运营中台建设策略及实践

2022-07-18 14:05 江勇

以下文章来源于邮电设计技术 ,作者应江勇

1面向5G的全域运营和运维需求分析

2019年6月6日颁发5G牌照以来,工信部数据显示 [1] ,在2020年我国已建成全球最大的5G网络,全面覆盖地级以上城市及重点县市,全年新建5G基站超过60万个,已开通5G基站超过71.8万个,其中共建共享比例超过45%,5G终端连接数超过2亿,5G应用涵盖超高清视频、工业互联网、智能家居等领域。5G成果蓬勃发展离不开国内电信运营商的5G战略实践,如中国移动提出的“5G+”战略赋能各行业数字化,包括“5G+4G”协同发展、 “5G+ECO”生态共建和“5G+X”应用延展。

从技术角度看,5G正在变革运营支撑系统 [2],具体来看,5G对运营和运维提出2个要求。首先是业务场景更加复杂化,业务设计及运营要求更高,以流量实时提醒服务为例,5G网速更快和业务逻辑更复杂使得实时提醒业务出现故障后的运维定位难度直线上升。其次是运营和运维边界拓展化,表现为如下4个方面的挑战。

a)按域建设。传统运营按“烟囱式”建设,即按域划分,包括业支(即B域),如基于传统IT技术栈实现的语音主套餐计费;网络(即O域),如网络设备运行监控;信管(即M域),如员工网上办公系统等,域内和域间系统在能力上也是隔离的,无法复用。

b)长流程。面向端到端服务及投诉场景,传统响应方式是各域自查自检,流程较长,效率较低,响应不及时会严重影响客户体验。

c)技术迭代升级。运营和运维对象引入云计算、微服务、容器化等技术后会导致相关技术需要演进发展。

d)5G和ICT融合。5G商用后,网络域引入大量互联网IT(Information Technology)技术,CT(Communi-cation Technology)与IT融合,导致5G应用和生态圈建设、运营和运维模式面临变革。

1.2 5G催生新平台支撑全域运营和运维

从运营商端到端流程看,全域运营和运维技术涉及网络(即O域)、业支(即B域)、信管(即M域)、数据(即D域)等领域,5G背景下各域技术演进方向包括2个方面。

a)从O域技术演进看,网络运维软件化之后,随着互联网IT技术如微服务、容器化等引入,可以向 IT领域融合演进。5G新需求引入后,网络切片灵活性使得5G网络可以支撑的行业和场景更加多样化,对网络需求的交付速度提出了更高要求,需要持续交付和敏捷过程。因此,以O域为代表的CT与IT融合的需求更加迫切。

b)从B/M/D域技术演进看,其建设之初即基于IT技术栈的演进,5G新需求引入后,对现有运营和运维技术的演进不存在颠覆性影响。

综上,在5G和软件化技术双轮驱动下,电信运营商可以构建一个灵活可用的“新平台”来促使CT和IT融合,助推ICT融合转型,实现全域的运维服务和运营支撑保障。“新平台”可认为是技术运营中台,它主要是由5G时代业务需求驱动而产生的。

2技术运营中台概念

随着我国互联网业务的广泛发展,学术界和工业界经常谈论“技术中台”,技术运营中台可以简单拆解为“技术运营”+ “中台”。

2.1 技术运营

首先,理清技术运营与技术运维(业界习惯称为“传统运维”)的区别。

从评价指标看,技术运营包括2个部分。

a)运维指标,如从系统和资源视角,涉及“稳定”“安全” “可靠”等指标。

b)运营指标,如从企业和客户视角,涉及“体验”“效率” “效益”等指标。

从具体定义看,参考 DevOps(Development 和 Op-erations的组合词)相关标准[3] ,本文认为技术运营是指将技术通过运营变现为能力和服务,以技术能力为基础,围绕业务交付稳定、安全、高效的技术运营服务,支撑企业的持续发展和战略成功。技术运营需要同时关注运维和运营指标。

2.2 中台

“中台”源于2015 年阿里巴巴启动的中台战略实践[4],随着数字化时代下企业运营与管理模式的改变,中台理念逐步扩展至全产业。钟华[5]、郑天娇等[6]认为中台是前台与后台之间的桥梁,是快速响应服务前台的规模化创新。它的本质是将核心能力沉淀并进行“复用”和“共享”。王伟强[7]、苏乐平[8]、苏萌[9]认为中台是前台与后台之间的“变速齿轮”,它为前台而生,易于前台使用,使后台资源顺滑流向用户,响应用户。倪晓熔等[10]认为中台对应云服务架构体系中的PaaS(Platform as a Service)层,即面向应用开发与运行提供通用技术、通用集成、共享业务和共享数据等服务,电信运营商的中台则由业务中台、数据中台和技术中台等组成。李广乾[11]认为数据中台是中台思维的核心,李巍巍[12]和芮忠[13]认为数据中台为前台提供高效的数据分析和应用服务。曾炜[14]认为中台化是精准“智慧城市”的关键要素,即加强数据业务的连通性,构建全链路的数据处理底座,搭建数据中台。

2.3 技术运营中台

本文认为技术运营中台应该是企业级能力复用平台,具体理解如下。

a)企业级。针对企业规模较小、业务比较少或简单等情况,从经验上看不需要建设中台,中台是提供给企业所有应用或业务团队使用的,因此应该站在企业全局视角来审视业务发展情况,就运营商5G发展来看需要覆盖B域、M域、O域、D域等业务。

b)能力。中台主要承载的对象是能力,需要从业务中抽象出来,梳理形成技术运营的公共能力。

c)复用。中台核心价值是复用,要经历从去重到复用的过程,是比平台更细粒度的抽象。

从技术运营中台在运营商的建设来看,主要可以划分为3个阶段,具体历程如表1所示。

1 运营商技术运营中台建设历程

1.png


综上分析,前2个阶段尚看不到技术运营中台的理念,在步入中台化阶段后,因为5G业务引发的新运维技术需求才促使运营商必须思考并建设技术运营中台。

2.4 技术运营中台与技术中台的差别

对于技术中台,王伟强[7]认为技术中台主要功能包含业务组件、技术组件和服务治理3部分,其中技术组件包括通用组件服务、开发框架支持、中间件封装及运行开发支持等。张嗣宏[15]认为技术中台提供统一的技术基础设施底座(如微服务框架、分布式存储、分布式消息、计算框架等),为整个智慧中台的其他模块,如业务中台、数据中台、AI中台、能力运营中心等提供统一的底层技术能力支撑,实现技术底座的共享与复用。郑永升[16]认为技术中台通过资源集中管理、通用能力抽象和成果沉淀复用来提升技术交付专业化程度。

由此可见,技术中台一般被认为是技术组件集合或者技术底座。

针对技术运营中台与技术中台差异,本文提出的技术运营中台涵盖 3个关键词,分别是“企业级” “能力”和“复用”,主要差异体现在“能力”,此处“能力”是指中台能力,对照王伟强[7]提到的“技术组件”和“服务治理”,或者张嗣宏[15]提到的“技术底座”,按照业务场景或者业务逻辑抽象出来的“中台能力”。

3面向5G的技术运营中台设计原则

3.1 能力抽象

5G电信业务发展过程中,运营商会根据场景需要建设相关业务平台,如5G流量管控平台、数据挖掘平台等,也会建设相关业务流程,如5G用户体验流程、5G业务体验流程、5G网络升级异常流程等,这些平台和流程都需要对数据进行采集、传输、清洗、存储、管理等,如果每个业务平台都建设这些共性功能显然重复和冗余,因此技术运营中台首先需要对共性场景、功能或能力进行逻辑上的抽象,形成公共能力或公共组件。面向5G的技术运营中台能力抽象设计原则如图1所示。

2.png

1 面向5G的技术运营中台能力抽象设计原则


3.2 能力复用

技术运营平台中抽象出来的能力或者组件,需要构建能力开放平台,通过注册将能力进行服务化封装实现技术运营能力的开放,B/M/O/D域运营、运维场景均基于能力开放平台统一调用后端能力,实现企业级跨系统的能力复用。与此同时,原系统运营、运维团队的职责和技能也需要转型,这也与王伟强[7]认为中台的挑战包括运维体系、性能和可用性、IT团队变革等方面是基本一致的。面向5G的技术运营中台能力复用设计原则如图2所示。

3.png2 面向5G的技术运营中台能力复用设计原则


a)运维体系需要拓宽深度和宽度,尤其要涵盖5GAI相关场景,如营业厅人证比对场景,可以通过能力开放平台调用图像识别能力。

b)性能和可用性,比如数据采集时限是否能够满足AI训练场景的数据迭代周期要求,如果不满足需要及时提出新需求,由能力开放平台之下的中台能力及后端技术系统去改进。

c)团队变革,基于以上分析可知技术运营中台的组织架构必然需要变革,需要特定的能力技术团队,基于技术运营中台承担服务治理职责对服务进行管控。

3.3 能力管控

能力开放平台有4类用户,分别是运营者、运维者、应用开发者和系统管理者,其中前两者可以统一认为是本文提出的技术运营者。不同用户的能力范围,即宽度和深度,需要进行管控,具体包括以下3个方面。

a)编排能力:原子化能力的灵活组合和流水编排。

b)柔性能力:对原子化及组合能力的限流、隔离、熔断、弹性扩展等。

c)权限能力:通过对原子化及组合能力的使用权限管理,实现接入控制、流量配额、时长配额、权限审批等。

4面向5G的技术运营中台架构

技术运营中台架构会随着业务场景的变化而进行迭代,根据5G需求演进设计技术运营中台架构,要始终围绕“中台给前台赋能,支撑前台形成运营能力”的原则,持续补充中台的原子化、公共化能力,面向5G的技术运营中台架构如图3所示。

4.png

3 面向5G的技术运营中台架构


5面向5G的技术运营中台建设

搭建面向5G的技术运营中台是一项复杂的系统性工程,运营商需要聚合产业链合作伙伴的力量,各取所长,共建共创,发挥协同效应,才能有序保质地建好并投入实际运营,具体参与方及职责如下。

a)运营商:负责把控建设方向及进度,主抓总体架构规划,盘活内外部资源及业务,制定技术及业务规范,在水平、垂直方向上牵头各方共建,发挥跨域、跨厂商协调落地优势。

b)5G应用供应商:负责5G应用建设,充分理解客户场景及需求,抓住业务痛点,通过业务驱动搭建技术方案,对中台及后台技术提出建设需求,最终通过5G应用解决方案提升业务使用率,实现运营商收入快速增长。

c)中台技术供应商:负责某类或某个中台通用能力建设,深刻理解5G应用痛点驱动下的中台技术需求,通过技术创新突破业务痛点,切实提高5G应用业务体验,通过业务及用户增长凸现中台技术价值。

d)后台技术提供商:负责后台技术建设,引入学术界及工业界主流及前沿技术,如人工智能、容器管理、自动并行等,通过大规模实验验证技术先进性和可靠性,将创新技术快速移植到运营商面向5G的技术运营中台来,通过5G用户及业务增长来变现技术价值。

总体上看,面向5G的技术运营中台建设对运营商挑战巨大,参考互联网公司及运营商先进省份实践经验,需要把控8个关键点,具体见图4。

6.png4 运营商5G技术运营中台建设的8个关键点

6技术运营中台实践

以面5G业务的智能化运维(Artificial Intelli-gence for IT Operations,AIOps)为例,一般分为 4 个步骤,分别是:

a)5G异常指标识别,指通过人工智能算法替代传统固定阈值方法。

b)智能根因诊断,指从报警风暴中快速定位出5G指标故障根源。

c)智能弹性扩缩容,指设计5G业务容量模型,动态调配生产资源,如存储、计算、带宽等资源。

d)资源混合部署,指在线资源非业务高峰期间(如22:00—07:00)运行离线作业。

5G异常指标识别为例,在技术运营实践过程中涉及到4个中台能力,分别是数据清洗及存储能力、样本管理能力、异常识别能力和告警管理能力,如图5所示。

7.png

5 5G异常指标识别 — —中台能力拆解

7未来及展望

2021年我国规划新建5G基站将超60万个,聚焦10个重点行业,形成20大典型工业应用场景。5G正进入融合创新的关键阶段[17],从运营商在5G方面的发展策略来看,中国移动将重点推进“数智化”转型,中国电信将打造差异化“云网”能力,中国联通已经开启“从流量经营到数字化生态”的第2次转型。随着5G向纵深发展,未来面向5G的技术运营中台需要重点关注2个方面。

a)5G服务场景将向生态化演进,技术运营中台应该“以不变应万变”,在技术运营服务过程中持续提炼、补充原子化能力。

b)需要进一步强化技术运营中台管控能力,如能力智能调度、能力智能编排、能力智能治理等,即采用智能技术来自动分析5G场景需要何种运营、运维能力以及如何组合等。