大咖论“数”丨“东数西算”工程促进算力和网络一体化发展

大咖论“数”丨“东数西算”工程促进算力和网络一体化发展
2023-01-08 11:00 河北日报 编辑:张振山

整体上来看,“东数西算”的实施,一方面是为了更好地利用西部相对优惠的电力资源和优异的气候条件,推动数据中心的优化布局和产业整体的绿色低碳发展;另一方面希望借此带动西部的算力基础设施建设,促进当地信息化水平的提高和数字经济的发展。

算力和数据是数字经济的核心驱动力。

数据来源于各种应用,当数据积累到一定的程度,且具有快速流转、多样类型和价值密度低等特征后,便成了大数据。从内容格式来看,大数据分成结构化数据、非结构化数据和半结构化数据,其中结构化数据主要是指关系型数据,非结构化数据主要是音视频文件等数据。从数据的使用频率来看,大数据主要分为热数据、温数据和冷数据。从存储角度来看,数据可采用文件存储、块存储和对象存储等方式。从数字世界的角度来看,以上所有的数据最终都会转变成0和1的二进制数字,在网络上传输并在芯片上计算、存储。

《中国算力白皮书(2022年)》显示,算力是数据中心的服务器通过对数据进行处理后实现结果输出的一种能力,最常用的计量单位是每秒执行的浮点运算次数(FLOPS)。算力由计算、存储和网络共同支撑实现,缺一不可。

“东数西算”工程启动后,算力和网络这两个原本独立的词组成了“算力网络”这一新词,成为业界特别是电信运营商重点关注和研究的方向。

随着宽带通信和移动通信的发展,我国数据流量日益增长。据工信部统计,2015年,DOU(Dataflow of usage,每户每月上网流量)为200M左右;2021年DOU达13.36GB。数据的大幅增长带动了对数据中心的庞大需求。据中国信息通信研究院统计,我国数据中心的在用机架数量从2011年的不到30万架,增长到2021年的520万架,10年期间增长近20倍。

数量如此之大的数据中心,使得原本主要为通信服务的网络,需要承担数据中心间的流量传输,于是数网协同被提上了议事日程。在此过程中,电信运营商通过第二平面的建设,重点保障高QoS的业务,满足了部分需求。

同一服务商的不同数据中心之间可以通过租用裸纤的方式建立DCI(数据中心互联)通道。但是随着数据流量的增大以及各类应用的发展,跨区域、跨服务商的数据中心网络互联需求日益强烈,算网协同就此进入专家的研究视野。通过网络的支撑,高效地调度不同服务商间的算力,形成算网协同的解决方案,是目前阶段业界努力的方向。

集群间的网络联接主要是通过骨干网,其建设运营相对简单。我国的5G网络覆盖和千兆光网接入的能力已经进入全球前列,网络基础设施较为完善。“东数西算”工程的实施,将为算网一体的服务提供更多的应用场景,促进算力和网络的一体化发展。

算力调度是高效利用算力资源的关键。

算力调度更多是指调用合理的算力去处理相应的数据,数据中心拥有多种算力,每种算力针对不同类型的数据。从计算类型来看,算力主要分为整型和浮点计算。整型计算适用于深度学习模型的推理运算;半精度计算适用于深度学习模型的训练运算;单精度计算多用于图形应用程序、图像处理和机器学习等;双精度浮点运算主要用于超算领域。这里的分类维度和通用算力、智能算力、超算算力不是一一对应的关系。一般来说,通用算力主要用来处理整型和半精度计算;智算算力更合适进行单精度计算;超算算力特别擅长双精度计算。

基于智算算力的数据中心即为智算中心。现在业界对智算中心算力的宣传多集中于多少FLOPS或者OPS等。需要注意的是,在单位不统一、精度不统一的情况下,不同智算中心的性能指标是没有可比性的。

算力无法储存和传输,如果此时此刻的算力不能被利用,那么也就过期作废了。因此,如果要高效全面地利用好所有的算力资源(包括不同类型的算力、不同数据中心的算力、不同集群的算力),就需要通过统一的调度平台来实现统一的算力编排,并能在具有一定预期性的前提下,基于统一的算力定价机制完成算力的供给和使用,使得所有类型的算力都能“算”尽其用,所有的算力需求都能得到满足,使“数据”和“算力”达到一种理想的平衡状态。

(作者郭亮供职于中国信息通信研究院云计算与大数据研究所)


相关阅读