对话以色列芯片公司Mellanox:驾驭数据洪流的能力者

亿万次指尖与屏幕的轻触,这个信息化时代赋予的特殊仪式每天都为我们星球产生着难以计量的数据。在庞大的数据背后,有数以百万计的机器集群与其交织的网络对数据洪流进行着运算和传输,维持着更加庞大的赛博(Cyber)世界的平衡,以色列炙手可热的公司Mellanox便是驾驭这数据洪流的能力者。

Amir Prescher ,Mellanox终端用户销售与业务发展高级副总裁

以InfiniBand技术成名的Mellanox公司,凭借技术优势占据着高性能计算(HPC)Top500的半数市场,在近年来又凭借以太网领域的发力快速席卷了数据中心的市场。今年3月的英伟达69亿美元收购事件又让其再次成为舆论的焦点。

如果说数据洪流充斥着广袤的赛博世界,那么云一定是它最大的载体。笔者在今年5月底参加了UCloud Think in Cloud大会。作为国内优秀公有云厂商的代表UCloud发布了若干重量级产品和技术方案,Mellanox也是其重要合作伙伴。笔者有幸采访了Mellanox终端用户销售与业务发展高级副总裁——Amir Prescher先生,Amir也从公司产品、市场、战略多个维度同笔者分享了Mellanox的一些近况和未来规划。

数据为中心,重新定义计算

Mellanox在高速网络方面的成绩得益于其独特的技术理念和基于这些理念下的诸多技术优势,“以数据为中心”就是其中之一,而CPU卸载很好的落实了这一理念。

在Mellanox看来,传统数据中心的计算模式是以CPU为中心,即所有的数据都要移动到CPU以后才能进行计算。在小数据量的时候,这一模式运转得很好,但当数据量不断增加以后,这种技术架构就会出现问题。未来的数据中心应该是以数据为中心的,也就是数据在哪里,计算就应该在哪里发生,从而避免CPU成为瓶颈。这样,当数据经过网络传输到达CPU时,已经是经过清洗、处理的数据。这有很多好处:第一,它会提升系统的性能,因为数据不需要等到了CPU以后再分析;第二,它会降低数据传输的时延,能把通讯延迟从原先的30-40多微秒下降一个量级。

Mellanox & UCloud协作,深耕云计算

如果说云的出现给计算赋予了更多能力,那么更高速的数据传输则让计算如虎添翼。作为国内优秀云计算公司的代表,UCloud与Mellanox的协作创新给我们带来更多的期待。

“Mellanox 在互联网数据中心成长异常快速, 为每一张ISP 网络都提供了因地制宜的优化方案,同时我们能够提供25G、50G、100G,以及200G的端到端的解决方案。” Amir兴奋的说。

Mellanox也是RDMA技术的推动者和领跑者,RDMA带来的优势使应用程序可以直接访问远程内存,而不占用CPU资源。InfiniBand则是最早实现RDMA的网络,被广泛应用到高性能计算中。除此外,RDMA的RoCE实现更好的赋能了云计算。我们可以从UCloud在Mallenox技术上的应用,看看这些技术的体现。

作为公有云厂商,最大的挑战来自于如何为大量租户提供高吞吐、低延迟的物理网络和虚拟化网络。从2018年起,UCloud 开始部署 25G 网络,但同期 CPU 的计算能力提升却达不到25倍,从而开始出现系统性能瓶颈,并为总拥有成本(TCO)带来巨大挑战。为此UCloud选择了基于TC Flower Offload的OpenvSwitch开源方案,通过TC Flower分类器的offload对于flow-based的系统提供强有力的方法来增加吞吐量并减少CPU在通信中的利用率。

凭借基于 SR-IOV 的网络虚拟化热迁移技术和支持 TC Flower Offload 卸载 OpenvSwitch 特性的Bare Metal方案,Mellanox基于BlueField和ConnectX的网卡系列在UCloud都有了广泛应用。“在软硬件结合、可编程化的云网络和高性能网络上,Mellanox 和 UCloud 都将有更加深入的合作。” Amir补充道。

需求千万条,安全第一条

在谈及未来数据中心的需求变化时,Amir谈到了三点:安全、隔离、数据处理和分析。

“安全性既是过滤数据的能力, 也是加密数据的能力。” Amir解释道。“智能网卡可以将数据平面和安全平面隔离开来,减少攻击者接触用户数据的机会,增加数据的安全性,同时还能通过Offload部分CPU的安全操作,让应用能得到更多的计算资源,提升应用性能。”

其实隔离与安全是相辅相成的,更安全的方案带来更彻底的隔离,更有效的隔离为用户带来更安全的体验。在讲述数据处理时,Amir特别提到了人工智能的场景,“交换机里面完成数据分析、数据更新,同时,还能支持聚合通讯等,加上硬件Tag Matching、 GPU Direct RDMA等,构成了先进的网络计算技术, 这对应用程序性能提升非常关键。” 无论是数据处理还是分析,如何为用户提供更低延时和更连贯的体验成为了关键。

不止于HPC,Mellanox的市场观

我们在Mellanox官网看到的介绍是这样的“Mellanox Technologies是面向服务器、存储和超融合基础设施的端到端以太网和InfiniBand智能互联解决方案与服务的领先供应商。”

Amir补充道:“HPC领域是Mellanox的传统领域,除此之外,Mellanox还将其技术优势扩展到其他领域,包括高速存储、数据库、人工智能等。未来还将在5G、边缘计算、自动驾驶等领域进一步拓展。” 作为网络领域的热点技术,无论是5G、云计算还是边缘计算,无论是在中心还是边缘,处理的都是数据问题。“这不是CPU的计算问题,我们做的是如何更低延时的将数据进行传输”

英伟达2019年3月11日以69亿美元收购Mellanox

“未来的数据中心将被构建为拥有数万个计算节点甚至更多的巨型计算引擎,并通过互连成为一个整体,以实现最佳性能。在应用高性能体验方面我们和英伟达有很多类似的经历和积累。相信随着英伟达的GPU与Mellanox的互连相结合,数据中心工作负载将在整个计算,网络和存储堆栈中进行优化,并能实现更高的性能,更高的利用率和更低的运营成本。” 在谈到英伟达收购一事,Amir表现出了极大的热情。

“中国是我们很关键的市场,我们开设了研发中心, 我们投入了更多的工程师,从总部投入了更多的资源。和UCloud的合作,我们在技术上迭代创新非常快,也做了很多全球市场的首次尝试,我们会继续更好地与中国客户合作以产生更多的创新解决方案。” Amir同时也表示未来在中国将会有更多的投入。

技术的变革推动时代巨轮的前进,也推动着这个时代文明的变革。Mellanox作为一家技术公司在高性能计算和网络领域的开拓驾驭了数据的洪流,我们也希望技术能让我们在时代的洪流中更好的辨别方向,乘风破浪。