(资料图)
飞象网讯(马秋月/文)随着“十四五”改革开放不断落地以及数字化不断加速,应用和数据对算力的要求越来越高,不得不考虑在算网融合的当前形势下,云网融合技术如何落地,如何去支撑。在日前举行的“2022中国云网智联大会”上,新华三集团副总裁、智能管理与运维产品线总经理王斌作了《云智原生时代智能联接技术的探索与创新》的报告。
针对云智原生时代遇到的繁杂问题,王斌表示,新华三集团不断探索,通过AD-NET6.0+方案,在云智原生、开放生态、绿色低碳一系列领域做到技术创新,去支撑典型的应用场景园区网络、广域网络,以及数据中心网络,向上再去支撑百行百业的数字化转型的应用,为数字化转型构建智能联接的新底座。
新华三集团副总裁 智能管理与运维产品线总经理 王斌
云智原生时代已经全面到来
中国信息通信研究院发布最新中国数字经济发展报告显示:2021年我国的数字经济规模已经达到45.5万亿元,占到整体国民经济的39.8%的比重。由此可见,数字经济作为国民经济的稳定器和加速器的作用是毋庸置疑的。
从数据看,云、网络、人工智能技术有着相同的增长趋势。预计全球到2025年会有接近95%的新型应用会运行在云原生的环境下,而2021年仅仅只有30%。由此可见工作负载对云环境的诉求日益增高。
随着数字经济不断加速,云、SDN、人工智能的技术也在不断的深化,云智原生时代已经全面到来。
当然,云智原生时代也不是一蹴而就的,应用驱动对网络提出新的诉求,主要有五个方面:算网独立协同困难、算力效率亟待提升、应用体验要求增高、云网融合运维复杂、能耗巨大难以持续。具体来讲就是:第一,算力和网络相对独立,如何根据用户需求实现深度融合;第二,算力需求每两年翻一番,如何通过网络的优化提升算力效率;第三,应用不断创新,如何才能保障不同应用的确定性体验;第四,AI赋能云网融合,如何通过人工智能实现智能化转型;第五,数据中心能耗增加,如何才能实现绿色低碳可持续发展。
“面对众多的挑战,我们需要在算网融合、智能无损、确定性网络、绿色低碳几个不同的维度去做突破和创新。才能与时俱进,才能有效的去解决用户不断增长的需求。”王斌说。
算网融合实现算力资源的精细配给
如今,算网相对独立、算力对网络的要求逐渐增高,算力网络已经不单单是算力的问题,而是通过网络手段按需对算力进行有效调配。如何实现算网高效协同,提供“云网统一服务”?如何实现网随算动?网络在这里不仅仅要实现联接,还需要感知算力,根据应用的需求合理调度算力,实现算网一体服务。
新华三认为,在构建算力网络中,算网大脑做为核心,向下实现算网全领域资源拉通,向上实现算网融合类全业务支撑,实现云-边-端的最优化协同与调度,提供算网一体化服务;通过SRv6、算力路由等协议,由网络感知算力并同步算力,并基于业务标识的算网需求进行管理及调度,使算网调度更精确更实时。
智能无损,融合以太提升算力效率
纵观ICT发展,在算力领域,算力的增长是非常快的,相关协议、标准、能力在过去的几十年内有长足的进步,但是在运力方面,网络能力增速不如算力。
当前,IB和FC技术封闭,技术先进性停滞不前,无法应对流量洪水。而传统的基于TCP/IP协议栈的网络通信,传输效率低下;在高性能计算场景,网络丢包0.1%可以导致算力损失50%,造成了大量的能耗浪费。
对此,新华三进行探索和创新:以太技术替代FC和IB,统一IP化承载,实现高吞吐和大带宽;RDMA大势所趋,基于以太网承载RDMA,显著提升传输效率;数据中心计算、存储、网络全面IP化,依据全网状态、业务需求,结合AI能力,智能调节PFC/ECN反压水线、实现全局负载分担,提供高效无损网络。
确定性网络,满足应用的确定性体验
现有网络是尽力而为的,无法实现端到端确定性时延和抖动。而工业互联网、车联网、远程医疗、人工智能等场景对于网络传输的要求很高。但是,当前技术不成熟,部署成本高,确定性网络产业化落地推进困难。
“网络天生就需要面对时延、抖动、丢包这三个关键要素。我们必须要在网络的协议层、能力层去创新、去突破、去解决这些问题。”王斌说。
针对这些问题,新华三在不同场景进行了创新布局:在局域网方面,TSN是以以太网为基础的新一代网络标准,TSN控制模块结合TSN交换机,将在工业物联网和工业4.0中扮演的重要的角色。在广域网方面,采用SRv6的可编程能力,基于CSQF通过路径选择、时隙映射、指定周期排队转发三步,实现了端到端确定性体验。在互联网方面,基于QUIC技术,提高在Internet链路上报文的传输效率,降低应用数据流的传输延迟,提升用户的业务体验。
意图网络,化繁为简的新一代智能运维
随着资源的规模越来越大,运维成为一个非常棘手的课题。传统的设计、变更以及运维成为非常痛苦的事情:方案设计冗长复杂、变更行为无法预测、运维依赖专家经验。具体来说就是:网络业务部署缺乏灵活性,步骤冗长,配置复杂;业务变更前,用户难以对网络和应用做到准确的风险评估;网络规模、数据流量爆炸式增长,故障定位耗时耗力。
王斌表示,要解决这个问题,我们必须将人工智能技术融入到未来网中,实现从Day0-DayN的自动化。为此,新华三利用AI助力意图网络全生命周期的管理与运维。
主要分为四个方面:在意图识别上,通过深度ML学习,进行业务意图的识别,生成最佳方案和相关配置;在仿真评估上,通过数字孪生网络1:1还原生产网络,多维度评估网络变更风险和影响;在意图校验上,提取网络运行数据进行网络建模、意图求解,分析变更是否符合客户意图;在智能闭环上,基于AI算法和网络模型进行故障预测,实现故障感知-定位-处理 E2E闭环。
绿色低碳,助力数字经济可持续发展
“双碳”是一个艰巨的任务,不可能一蹴而就。不可能通过某一种单点技术就能完全解决“双碳”的问题,需要在每一个不同的场景、环节去仔细的挖掘和调测。
面对业务需求增长、网络架构僵硬、设备能耗过大、流量无法洞察的难题,新华三创新性地从绿色材料、灵活架构、技术创新和能耗管理四个方面探索解决。
针对园区网领域,园区上云业务日益增加,Wi-Fi 6协议全面升级,数字化业务飞速增长的问题,可以大量使用无线优先的应对方式。而在有线连接方面,可以采用绿色材料的光纤连接方式,从材料层面将低碳进行延展,因为光纤耐腐蚀、抗老化,使用寿命长达30年,一次建设长期使用。
针对设备利用率低下、组网不灵活、管理系统割裂、数据难以拉通的网络架构僵化问题,新华三采用灵活的架构,根据场景提供灵活组网模型、提升设备使用率,降低物理设备数量;
一网多云,物理共享,逻辑隔离,最大程度复用物理网络;边缘DC和主DC统一管理,节省控制系统。
针对数据中心元器件能耗和散热大,对电力能源消耗巨大的问题,新华三进行技术创新,例如采用无中板正交CLOS架构,直通风道, 100%均匀散热,节省风扇能耗30+%;搭载NPO硅光技术,降低元器件能耗,端口功耗降低40%;液冷技术的应用和部署,散热效率显著提升,节能降耗,实现PUE目标<1.2。
针对资源能耗不可视、不合规流量占据带宽、消耗网络资源的问题,新华三从能耗管理着手进行资源监控、智能分析和优化闭环,例如:对设备资源进行健康评估和异常预警,提升网络健康运行时间,降低平均能耗;流量成分和不合规分析,减少异常流量对网络带宽的占用,提升网络利用率;基于计算资源状态进行节能优化分析,给出优化建议,参数调节等。
最后,王斌表示:“技术是永无止境的,未来会不断探索和创新。在数字化经济不断深化的今天,新华三也希望和广大的客户、运营商、合作伙伴一同继续推进数字化转型迈向新的征程。”