您当前的位置:开云 开云 行业资讯

“IPv6+”智能云网,构建算力时代的联接底座

发布时间:2022-04-14 阅读量:

4月2日,华为数据通信产品线研发总裁刘少伟接受央视《对话》栏目的采访时提出,算力网络的长期目标是构建 “全国一台计算机”,算力将成为一项公共服务,用户可以随用随取。华为将基于“IPv6+”创新技术打造算力时代的联接底座。

刘少伟表示,在算力时代,算力是中心,网络是根基。类似于“西电东送”的发电厂和电网,算力网络由提供算力的数据中心和输送算力的网络组成,连接着用户、数据和算力。“东数西算”是一个解决东西部算力规模和增速发展不均、提升跨区域算力调度水平的系统工程,其中网络会贯穿算力的生产、传输和消费的全流程,需要做到算力高效释放、算力灵活调度、边缘最优服务,让千行百业可以像用电一样便捷使用算力。

● 算力高效释放(数据中心内):数据中心是算力的发电站,必须保证算力的最大产出。由于单台服务器算力有限,需要用网络联接成千上万的服务器组建大规模算力集群。联接规模越大,联接能力要求就越高。比如,海量服务器之间进行数据互访时,很容易由于流量突发而产生丢包。以RoCE网络为例,0.1%的丢包会导致网络吞吐率下降50%,造成算力资源的严重浪费。  

刘少伟介绍说,基于多年技术积累,华为创新地将智能无损算法引入数据中心网络交换机,攻克了以太网丢包难题。在服务器规模不变的情况下,数据中心内算力最高可提升93%。为了构建超大规模算力集群,华为将直连拓扑和自适应路由引入以太网领域,目前最高可支持27万台服务器的零丢包组网,组网规模达到业界平均水平的4倍,网络跳数和时延可降低25%。未来,华为超融合数据中心网络将引入网络级负载分担技术,实现网络有效带宽的倍增;同时通过与服务器网卡等端侧配合的端网协同算法,实现单跳动态时延从10-100μs缩短到1μs级,针对人工智能、高性能计算、高性能存储等业务进一步释放算力。

● 算力灵活调度(数据中心间):就像西电东送中的输变电网络一样,算力网络把算力从西部输送到东部,算力网络承载着海量企业成百上千的业务。如果把企业比作嗷嗷待哺的小鸟,那作为算力网络的鸟妈妈,如何满足每个小鸟的需求,又能公平高效的给小鸟喂食是个很大的挑战。一方面,针对每个企业对算力的需求不同,我们通过智能云图算法和基于IPv6+的新技术,按照业务实际情况为其提供一条最佳的算力网络路径,从而实现供需侧的最优资源配置。同时,我们通过切片技术将网络按业务类型划分成不同车道,相互隔离,保证算力能够高效、及时和准确的送达。

● 边缘最优服务(边缘算网): 云游戏、自动驾驶、VR/AR、物联网及工业互联网新型应用对网络时延、数据安全可控提出高要求,边缘计算应运而生。Gartner认为,到2025年,大约超过75%的数据将在边缘侧处理。边缘算网将是算力网络的重要场景,边缘联接设备数量剧增,联接要安全可控的保障,算力要实时灵活的提供,都需要边缘算力与网络相互感知,实现“网络+算力”在边缘的联合优化调度。解决这个挑战的关键技术就是算力感知路由,华为积极探索算力感知路由创新,实现应用在边缘算力资源池部署后,网络从路由层实时感知和扩散业务的算力负载,网络接入节点根据应用标识对应用进行实时流量调度,从而提升整网算力、存储、网络等资源利用率,为用户提供边缘最优算网服务,实现算力普惠。

随着网络与计算的融合,算力资源由“端”变“网”,未来在用户的不同距离上会遍布许多不同规模的算力,通过网络为用户提供各类个性化的服务。如何保障用户体验一致性?如何实现服务灵活动态部署?这些挑战只在“计算域” 内是无法解决的,需要考虑“网络域” 与“计算域”如何协同。为了攻克这些技术难题,包括算力感知网络(CAN)、应用感知网络(APN)等新技术应运而生 ,通过网络、存储、算力等多维度资源的统一管理和协同调度,实现连接和算力在网络的全局优化,达成业务与资源的最优配置。相关标准也在国内外多个标准组织获得了广泛的关注和实质性的进展,其工作组成立预讨论会(BoF),吸引了业界200余位专家积极参与讨论,华为与业界伙伴在IETF已经合作发布了10余篇APN相关技术文稿。这些工作都为推进相关技术的标准化工作奠定了坚实的基础。

算力作为数字经济时代的新生产力,通过基础设施化,从而广泛服务于我国数字社会转型中的方方面面。算力网络的长期目标就是构建 “全国一台计算机”,算力将成为一项公共服务,用户可以随用随取。在当今数字化时代大潮中,机遇与挑战并存。华为将持续携手客户及合作伙伴,共同应对数字化转型中的挑战,持续聚焦联接技术和计算技术融合的算力网络,用领先的硬件、软件和算法构建数字世界的智能基础设施。