百分百发挥AI算力,华为发出最关键的一击

2019-01-11 19:40:35 来源:网络整理 作者:管理员

原标题:百分百发挥AI算力,华为发出最关键的一击

百分百发挥AI算力,华为发出最关键的一击

进入2019年,人们已经不再怀疑AI人工智能的重要性。Granter在2018年发布的预测认为,2022年人工智能驱动的商业价值将高达3.9万亿美元。此外,Gartner还认为2018年是人工智能技术爆发的一年,其增长曲线非常陡峭,到2020年之后的增长曲线将趋于平坦。这也就是说,2019年将是人工智能发挥作用的关键之年。

人工智能在企业中的落地,主要是基于企业的数据中心;而在计算、存储与网络这数据中心的三大难关中,网络是最后也是最难的难关。因为不论是计算还是存储,都主要通过X86服务器及软件的方式实现,业界已经在这两个领域取得了阶段性进展。但网络作为CT技术,并不是很多IT企业的长项,而网络的性能又严重制约着人工智能算力的发挥。

2019年1月9日,华为发布了业界首款面向AI时代的数据中心交换机CloudEngine 16800。华为网络产品线总裁胡克文表示:“万物互联的智能世界正加速到来,数据中心正成为5G、人工智能等新型基础设施的核心。华为率先将AI技术引入数据中心交换机,引领数据中心网络从云时代迈入AI时代。”

网络性能制约AI算力

为什么说网络性能制约着AI算力的百分之百发挥?这是因为网络是所有企业IT和数据中心的基础,而到了云与人工智能时代的软件定义网络基础架构时代,网络将起到更加关键性的作用。在Gartner的2019十大基础设施和运营的趋势预测中,也专门提到了网络的重要性。Gartner强调2019年及以后必须关注如何让网络更快,人工智能、边缘计算、5G等新业务都需要网络的敏捷性,而2019年将是打造网络敏捷性的关键一年。

胡克文在谈到AI受到数据中心网络的影响时,认为有三大挑战:丢包率、带宽以及故障定位。首先是丢包率,传统的以太网丢包率为0.1%,这意味着算力只能发挥50%,这是华为通过实际测试发现的问题。也就是说为了百分百发挥AI算力,AI时代的数据中心网络应该达到零丢包。

其次是大带宽,因为即使做到零丢包但网络带宽也在制约AI算力的发挥。未来的五年将出现数字洪流,而随着互联网流量的增长,将导致AI数据的集中以及更大规模的数据中心。这就要求更高的带宽,特别是服务器与服务器间的互访将更频繁。而数据中心服务器支持的带宽也已经从10G到25G再到100G,以超乎想象的速度发展,但即便是100G的数据中心网络也将无法支撑即将到来的数字洪流挑战。

第三是今天的数据中心中,计算网络、存储网络和数据网络已经三网合一了,这带来了极大的运维挑战。当遇到故障时,可能数据中心的技术人员花几天几夜都无法定位问题源。而当业务部门发现问题后,再找到网络技术人员时,留给网络技术人员解决问题的时间已经所剩无几。如果还要花费几天时间才能解决问题,那么网管的运维压力之大可想而知。

上述三个问题,是面向AI时代的数据中心网络核心挑战。胡克文表示,他过去一年见过很多客户,普遍的反馈是大家过去三年的关注都在云上,而当云的建设初具规模后却突然发现搞不定网络,特别是面对AI等新兴计算任务。“这个时候,我们在想未来的数据中心网络应该是什么样?”

数据中心网络迈入AI时代

华为发布的AI数据中心交换机CloudEngine 16800作为华为AI发展战略以及全栈全场景AI解决方案的一个重要组成部分,是业界首款内嵌AI芯片的数据中心交换机,支持高密400G接口、满足AI时代5倍的流量增长,还将支撑秒级故障识别和分钟级故障自动定位、使能自动驾驶网络。

首先是内嵌AI芯片。高性能数据中心集群对网络丢包异常敏感,华为CloudEngine 16800搭载了高能效AI芯片,通过实时学习训练能力和独创的iLossless智能无损交换算法,为以太网实现了无丢包机制以及流量模型的自适应自优化,从而构建一个零丢包、低时延的数据中心网络,让AI算力充分发挥,加速人工智能应用创新。

近两年,深度学习算法取得重大突破,数据处理效率随后就成为了人工智能规模商用的新瓶颈。为了不断提升AI的运行效率,业界已经把存储介质推进到了闪存盘且大幅降低了时延,并通过GPU甚至专用的AI芯片则将处理数据的能力提升了100倍以上。为了进一步降低网络传输中服务器端数据处理的时延,数据中心的网络协议由TCP/IP推进到了RDMA远程直接数据存取,也就是网络层和传输层处理都由服务器上的网卡硬件实现,而无须像TCP/IP协议那样占用CPU的处理资源。那么,当这些都解决了之后,网络通信时延就将成为短板。

在数据中心里,TCP/IP是唯一的通信协议,但当TCP/IP网络遇到RDMA网卡,就需要在转发设备本地引入智能处理,实现零丢包、低时延、高吞吐的无损数据中心网络。华为主要采取了单流局部调优和整网全局调优两种方式,用内嵌AI芯片的华为数据中心交换机对网络状态实时检测。基于AI芯片的iLossless智能无损交换算法,可对全网流量进行实时的学习训练,并根据不同业务流量模型的特点动态设置最优的网络参数、更精准地控制流量,实现百万流和基于应用的队列自适应不同场景的全局网络自优化能力,保证数据中心网络在传输无丢包基础上达到最高的吞吐量。

第二是业界最高密度单槽位48 x 400GE。华为CloudEngine 16800,支持从10G到40G到100G再到400G端口的平滑演进,能够提供业界最高密度的单槽48个或整机768个400GE端口,交换容量是业界的五倍,可以极大的减少核心层设备的数量,简化网络的同时提升管理效率。众所周知,400GE接口标准化工作于2015年启动,目前针对数据中心应用已经完成标准化,400G时代已经来临。

为了支持超高密度及其演进,华为CloudEngine 16800在PCB板材、工艺、散热,供电等多方面都进行了重大技术改进和创新。在PCB板材工艺方面,华为采用新型亚微米无损材料及高分子键合技术的制作工艺,将PCB板的电信号传输效率提升30%,满足100G到400G甚至未来800G的兼容和能力演进。而在供电方面,华为提出业界首个双路输入智能切换的电源模块,采用磁吹灭弧和大励磁技术实现ms级快速切换,21个电源模块就可以实现原来40个模块所达到的供电能力和可靠性,电源空间节省50%;线路板上采用矩阵磁和高频磁技术,可在两个拇指大小的空间内提供1600W供电能力,使得单位空间的供电效率提升90%。

在散热方面,华为CloudEngine 16800提供单板级和系统级散热。其中,CloudEngine 16800采用独有的碳纳米导热垫和VC相变散热技术,单板散热效率较业界提升4倍,整机可靠性提升20%。此外,华为采用了业界首创的混流风扇,可以使得整机散热效率达到最佳,平均每bit数据的功耗降低50%,相当于每台每年节省32万度电、约合26万元电费,减少碳排放250余吨;加上独有的磁导率马达,静音导流环噪音降低6dB,真正做到绿色节能。

第三是网络的智能运维和自动驾驶。华为CloudEngine 16800基于内置的AI芯片,可大幅度提升“网络边缘”即设备级的智能化水平,使得交换机具备本地推理和实时快速决策的能力。通过FabricInsight网络分析器提供分布式AI运维架构,可实现秒级故障识别和分钟级故障自动定位,加速自动驾驶网络的到来。而基于分布式的AI运维架构,也可大幅提升网络运维系统的灵活性和可部署性。

华为自2012年进入数据中心网络市场以来,已服务于全球6400+个用户,帮助全球各地的互联网、金融、政府、制造、能源、大企业等多个行业的客户实现了数字化转型。2018年,华为轮值董事长徐直军宣布,华为将人工智能定位为新的通用技术并发布了人工智能发展战略,全面将人工智能技术引入到智能终端、云和网络等各个领域。CloudEngine 16800就是华为普惠AI战略的进一步发展,也是华为在数据中心网络市场的最新成果。

2017年7月,华为进入了Gartner数据中心网络魔力象限的挑战者象限,华为CloudFabric云数据中心网络解决方案已成为全球企业构建云数据中心网络的首选方案之一。华为CloudFabric解决方案提供基于标准API的接口,可与第三方云平台、控制器、VAS设备、自动化管理工具等协同工作,联合VMware 、Red Hat、Mirantis、EasyStack、F5、Ansible等20多家合作伙伴共同构建多层次SDN生态链,提供成熟的集成部署能力。

随着CloudEngine 16800的推出再加上CloudFabric解决方案,华为可帮助企业构建更为智能的网络、自主响应应用的策略以及网络的自我优化,特别是把AI广泛应用于数据中心网络的规划、部署、运维到调优等各环节,实现网络管理和运维的自动化和智能化,打造应用驱动的数据中心网络,实现网络敏捷性。2019年,CloudEngine 16800将重新定义数据中心网络的代际切换,帮助企业使能和加速AI商用进程,引领数据中心进入AI时代。(文/宁川)

显示全文
为您推荐
冬枣和香蕉为什么不能一起吃,同食味道不好(不会危害健康)
冬枣和香蕉为什么不能一起吃,同食味道不好(不会危害健康)

生活中,许多食物是不能同食的,否则不仅不能补充营养,还可能危害身体健康,比如冬枣和香蕉,网上就有人说它们不能一起吃。那么,冬枣和香蕉为什么不能一起吃呢?接下来就随小编一起去了解看看。...

发布时间:2023-10-03 15:00:14

郭姓历史名人
郭姓历史名人

【导读】 郭姓历史名人,下面是小编为你收集整理的,希望对你有帮助!郭守敬、郭隗、郭子仪、郭淮、郭嵩焘等。1、郭守敬:郭守敬,字若思,邢州邢台县人。元朝着名的天文学家、数学家、水利工程专家,郭守敬参与制定的《授时历》除了在天文数据上的进步之外,在计算方法方面也有重大的......

发布时间:2023-10-03 14:01:22

冰棍的棍子是干垃圾吗,是(不易腐烂和回收)
冰棍的棍子是干垃圾吗,是(不易腐烂和回收)

冰棍大家都吃过,过去我们吃完后会将冰棍的棍子直接扔垃圾桶,而如今随着垃圾分类的实施,我们需要将它扔进专属垃圾桶。很多人都说冰棍的棍子是干垃圾,那这是真的吗?冰棍的棍子是干垃圾吗?对此,就由小编为大家解惑。...

发布时间:2023-10-03 14:00:18

棘怎么读
棘怎么读

【导读】 棘怎么读,下面是小编为你收集整理的,希望对你有帮助!jí。棘是一个汉字,读音为jí,“朿”是“刺”的本字。两个“朿”字并排立着,表示棘树多刺,是矮小而成丛莽的灌木。本义:丛生的小枣树。会意字。战国金文不降戈《集成》:“不降棘余子之赀金。”《说文》:“棘......

发布时间:2023-10-03 13:13:29

哪个国家的人口最多
哪个国家的人口最多

【导读】 哪个国家的人口最多,下面是小编为你收集整理的,希望对你有帮助!中国是人口最多的国家,总数为13.47亿。 中国是世界上人口最多的发展中国家 ,国土面积居世界第三位 ,是世界第二大经济体。中国陆地面积约960万平方千米,东部和南部大陆海岸线1.8万多千米,内海和边......

发布时间:2023-10-03 13:01:27

摇摇杯中的弹簧是干什么用的,搅拌作用/防止蛋白粉结块
摇摇杯中的弹簧是干什么用的,搅拌作用/防止蛋白粉结块

健身的朋友对摇摇杯应该不陌生,它是一种适合冲泡蛋白粉的杯子,可以让蛋白粉快速溶解而不结块。打开摇摇杯,我们会发现它里面有弹簧,这让很多人好奇:摇摇杯中的弹簧是干什么用的?接下来就随小编一起去了解看看。...

发布时间:2023-10-03 13:00:24

肉煮不烂怎么办
肉煮不烂怎么办

【导读】 肉煮不烂怎么办,下面是小编为你收集整理的,希望对你有帮助!换成高压锅煮30分钟即可煮制软烂。在煮肉时如果煮的时间太少,火候太大,器皿不合,都会使肉煮不烂,因此若肉煮不烂可换成高压锅再煮30分钟即可软烂,再煮肉时,可以再里边放些山楂或者橘子片,这两种材料都可以......

发布时间:2023-10-03 12:01:10

电动牙刷适合什么样的人使用,儿童、上班族、行动不便者
电动牙刷适合什么样的人使用,儿童、上班族、行动不便者

相比普通牙刷,电动牙刷不仅使用更方便,刷牙效果还更好,所以现如今越来越多的人开始用电动牙刷。不过电动牙刷虽好,也是有适用人群,那电动牙刷适合什么样的人使用呢?对此,就由小编为大家解惑。...

发布时间:2023-10-03 12:00:07

男生带戒指在左手食指的意思是什么
男生带戒指在左手食指的意思是什么

【导读】 男生带戒指在左手食指的意思是什么,下面是小编为你收集整理的,希望对你有帮助!男生带戒指在左手食指是什么意思男生左手食指戴戒指一般有特殊的意义,代表目前处于未婚状态,不一定有女朋友,当然如果一个时尚的男生把戒指戴在左手食指上,或许只是喜欢戴戒指,戒指只是一个装饰的作用。对戒是恋......

发布时间:2023-10-03 11:01:11

不适合电动牙刷的人群,换牙儿童、老年人、患牙病者
不适合电动牙刷的人群,换牙儿童、老年人、患牙病者

电动牙刷与普通牙刷的区别很明显,电动的使用更方便,刷牙效果更好,但好归好,有些人是不适合使用的,接下来就随小编一起去看看不适合电动牙刷的人群。...

发布时间:2023-10-03 11:00:08

拉布拉达龙:南美巨型植食恐龙(背部长鳞甲/长18米)
拉布拉达龙:南美巨型植食恐龙(背部长鳞甲/长18米)

【导读】 拉布拉达龙:南美巨型植食恐龙(背部长鳞甲/长18米),下面是小编为你收集整理的,希望对你有帮助!拉布拉达龙是一种蜥脚类恐龙,属于巨型恐龙的一种,体长可达18米,主要用四足行走,以植物为食,最大的特点就是它们的体型巨大,脖子和尾巴很长,背部长有特殊的鳞甲。拉布拉达龙的第一批化石是在南美洲的阿根廷发......

发布时间:2023-10-03 10:06:11

故宫对儿童身高多少是半票
故宫对儿童身高多少是半票

【导读】 故宫对儿童身高多少是半票,下面是小编为你收集整理的,希望对你有帮助!根据故宫规章制度:身高1、2米以下的儿童进行免票制度,6周岁到18周岁之间未成年人和全日制大学本科及以下专业学历的学生将给予的半票优惠。其他门票优惠政策:大、中、小学学生,可凭学生证购买学生票,每张2......

发布时间:2023-10-03 10:01:11