计算的艺术:算网调度难在哪?

2022-12-06 11:53 通信产业网
图片
目前算力的调度和网络的调度是两个分离的体系

算力网作为新型基础设施的技术底座,在信息通信技术演进、赋能数字经济发展中发挥重要作用。随着东数西算的加快落地,以及三大运营商将算力网络建设提升至公司战略高度,算力网进入发展元年。但算力网的一体化调度、商业模式等仍在探索中。
目前算力的调度和网络的调度是两个分离的体系。” 中国联通研究院副院长、首席科学家唐雄燕近日在世界计算大会“算网融合和数字经济”主题论坛上表示,算力网终究是要提供算网融合服务的,要构建云网边一体化的智能调度和能力开放体系,将来能够形成网络和计算深度融合的格局,这是一个总的思路。
运营商推动算力网络的底层逻辑是希望通过网络来调度算力,获取算力需求的用户入口。正如唐雄燕所言,通过我们的通信网络可以把所有的算力集合起来,弥补单点算力能力不足的问题,这也是发展算力网络的初衷。

调动哪些算力

在算力产业链上,包括算力生产者、算力调度者、算力服务商以及算力消费者,运营商作为网络基础设施建设和运营者,如何调动算力,调动哪些算力 ?

据公开数据显示,国内近一半的算力为云计算厂商所有,32%的算力为政府、金融、电信、制造等行业企业私有,能够纳入算力网络体系下并对外提供服务的算力规模相对有限。运营商在网络连接中处于关键角色,但在算力体系中处于配角的地位。亚信科技算力网络首席科学家王淑玲表示,当前算力更多的是集中在云商的手里,从国外的演进路线来看,整体的马太效应是越来越明显。
但东数西算的推进以及国家对大数据中心的全国布局将加快算力网络的落地。因为算力依赖电力,所以电力充沛的地区布局算力中心,成为国家层面推动的基础设施的建设,对运营商调动算力以及“双碳”目标的实现具有积极意义。
在供给侧,算力供给将多样化,算力可能来自于核心云、边缘云、高智能的终端(如智能汽车)。算力或可以用共享经济的模式出现。
在此背景下,运营商在算力产业链中希望能够成为全社会的算力中介。全社会的算力除了公有云的服务之外,有88%的算力是分散的。唐雄燕表示,如何把这些分散的算力吸纳和集合起来,变成一个平台化的服务,这是运营商所希望做的。
对于运营商扮演算力中介的角色,亚信科技算力网络首席科学家王淑玲表示,算力网络的引进把网络更加中立的角色放到了算力供需对接的市场上,对于算力多样化起到了促进的作用。

拿什么调

算力的核心问题是运营和调度问题,要让用户的各种需求找到合适的资源,实行自动化的需求匹配和调度。不同业务场景,需要不同的算力匹配,同一客户可能需要多种类型的算力。从协同类型看,包括多云之间、云和数据中心、云和网之间的资源调度,跨行业、跨地区、跨层级的算力资源调度。

打造基于算网融合设计的服务型算力网络,构建云网边一体化智能调度和能力开放体系,成为运营商的选择。依托网络构建多样化的算力资源调度和服务的体系需要底层技术的支撑。
底层的技术包括IPV6+和全光网络。增强网络内生的算力是算力网络发展的重要方向,网络原来没有很强的计算能力,把计算的能力融入到网络里面去,这是算力网络演进的一个重要方向。以中国联通为例,其构建“ROADM+OTN”光电双平面立体架构,为算力提供超强运力的智能开放的全光底座;SRv6作为”IPv6+”技术基础,面向5G、云业务、物联网和人工智能等新兴业务需求,使能网络编程能力。
有了完善的算网基础设施之后,如何从全局上统筹好算力资源的使用,实现算力的供给和需求之间的对接,并且在这个过程中实现资源效能的最大化,需要算网大脑去支撑和实现。
算网大脑作为算力网络的核心,实现算网感知、算网统一编排、调度与算网智能决策等。算网一体化编排调度技术实现按需分配和智能调度算网资源,满足不同计算场景对算网资源需求,提供随需可调、场景多样、质量感知的算网一体差异化产品,提升数字内生能力,研发算力交易、隐私计算等新型算网服务。
算网一体化编排调度平台,实现对公有云、私有云、自有算力及网络资源的统一调度,具备在云、网、边之间按需分配和智能调度算网资源的能力,满足不同计算场景的算网需求。
技术与路线已然明确,运营商与产业链也在实践中做了诸多尝试。例如,中国电信8月在全国首次发布了科技创新产品“息壤”算力调度平台,无论业务对算力的需求是多少,息壤都可以规划出满足需求的算力和网络资源,并且有效调度,实现业务性能和成本的最优。通过算力调度引擎灵活的自定义调度策略能力,满足不同业务需求,如“东数西算”、云渲染、跨云调度、性能压测、混合云AI计算等多种应用场景。

还有哪些挑战

但算力调度仍然面临诸多挑战,如算力资源的感知、度量与开放共享问题,计算与网络融合的技术标准和产业协同问题,以及算网一体的服务和商业模式问题等。

"算力网络未来的商业模式和参与的主体变得更多样化之后,整体商业的闭环怎么样去打通。这是整个算力网络里面非常重要的一环。"王淑玲表示。
算力网络中吸引较多关注的算力并网和交易面临度量、计费、交易模式方面的困扰,同时各方资源池接口缺乏标准的技术性问题也阻碍并网与交易的实现。
异构算力资源能否采用相同的度量模式,缺乏标准让上层业务不用感知底层资源差异;感知算力是泛在算力的增强,跨域跨网需要标准化体系支撑。
由于算力资源并不像电力那样,能够用“度/千瓦时”这样的单位简单地进行量化,尤其考虑到CPU、GPU、FPGA、ASIC等不同芯片的类型,更是难以进行统一的衡量。目前,计算资源的衡量缺少一个统一且简单的度量单位,如何评估不同类型算力资源的大小成为一个亟需解决的难题。
因此,需要一种共识,在标准规范的基础上,量化异构算力资源和多样化业务需求,建立统一的描述语言,给算力资源赋予可度量、可计费的标准单位。目前,业界研究机构、产业联盟、标准组织等已经认识到这个问题,纷纷从不同角度展开了研究工作,但尚未形成统一的结论。
中兴通讯副总裁尤琰在中国算力大会演讲时表示,交易系统分工方面,在企业完成自有算力调度基础上,市场驱动实现跨企业的算力调度和交易。政府相关部门首先做好数据中心PUE、上架率等关键指标的监控,未来政府监管平台是否发展为全国算力交易调度中心,需要在实践中探索。
采写:赵妍
编辑:赵妍

指导:新文


转自通信产业网,如有侵权,马上删除!