微软Project Brainwave是一个基于FPGA的低延迟深度学习云平台。微软创新地使用了英特尔提供的Stratix10 FPGA,创新的硬件赋予了这一深度学习云平台强大的计算性能。随着英特尔在人工智能领域的投入不断深化,越来越多的云服务提供商通过英特尔架构获取更高的性能,以及更可控的基础设施构建和运维成本。
英特尔助力微软提升AI领导力
在过去几年,微软一直利用英特尔的现场可编程门阵列(FPGAs)来提升必应(Bing)和Azure的性能和效率。今年暑期,在英特尔推出全新英特尔至强可扩展处理器之际,Azure硬件基础设施总经理库沙格拉·瓦伊迪(Kushagra Vaid)提出,微软的愿景是利用人工智能和分析能力来驱动下一代企业应用,新至强和FPGA的结合将能够强有力地解决目前所面临的人工智能难题。
微软全新深度学习平台ProjectBrainwave的发布,代表了目前人类在深度学习模型云服务性能和灵活性方面的重大进步。ProjectBrainwave密切关注于人工智能推理因素,以便从设计方面着手提供实时人工智能。由于云基础设施已广泛应用于实时数据流中,无论是搜索查询、视频、传感器流或者与用户的交互,实时人工智能的重要性已与日俱增。微软选择利用英特尔Stratix10 FPGAs来确保系统能够按照接收请求的速度来处理这些请求,从而能够以低于1毫秒的超低延迟发挥39.5万亿次浮点运算性能。
全球AI推理在IA基础上运行
除了微软之外,许多其他云服务供应商(CSP)客户均依赖于英特尔架构来处理人工智能推理工作负载。
在亚马逊网络服务系统(AmazonWebServices,AWS)中,英特尔至强可扩展处理器的计算能力使AWS客户能够利用更多的数据通过机器学习来创建创新产品和体验。AWS已与英特尔合作,利用其C5实例中至强可扩展处理器上的英特尔数学核心函数库(IntelMathKernelLibrary,MKL)优化了其深度学习引擎,从而使推理性能提高了100倍以上。
此外,国内领先的电子购物企业京东正在太平洋地区大力投资人工智能和无人机配送技术。最近,通过利用英特尔Arria10 FPGA,京东部署了卷积神经网络(CNN)和长短期记忆网络(LSTM)来帮助分析京东上的海量图片,并进行光学字符识别(OCR)。测试结果显示,与GPU替代方案相比,Arria10 FPGA可以将LSTM性能加速提高5倍,从而避免一些效率低下的计算并减少图像识别延迟。
不止步于推理
英特尔架构扩展至人工智能训练
英特尔的人工智能解决方案还扩展到推理以外的其他领域,目前正健康地发展到人工智能训练领域。
首先,英特尔至强可扩展处理器可以提供可扩展机器学习能力,同时提供有吸引力的总体拥有成本并可简化部署和管理。
谷歌首先在谷歌云平台(GCP)上率先推出基于英特尔至强可扩展处理器的云实例。自此之后,许多运行人工智能/机器学习等计算密集型工作负载的客户开始发现其重大优势。例如GCP客户笛卡尔实验室(DescartesLabs),该机构利用人工智能进行卫星发射产量预报,并将该应用迁移至基于英特尔至强可扩展处理器的GCP实例后将成本降低2.5倍。
此外,英特尔还推出了BigDL,承诺通过在熟悉的数据分析基础架构上运行深度学习应用,将机器学习快速带入主流。这就利用了企业和CSP已经在数据分析中所实施的熟悉数据架构(如ApacheHadoop或Spark)的优势。主要CSPs,如微软、亚马逊和阿里巴巴也正在其服务中部署BigDL来加快深度学习技术的采用,使客户能够从其数据中提取更多的业务价值。
最后一点也很重要,英特尔至强融核处理器也逐渐获得了市场认可。全球最大的在线按需配送平台美团最近部署了英特尔至强可扩展处理器和英特尔至强融核处理器来运行其公共云平台美团外卖开放平台(MOS)上内部应用和人工智能即服务中的人工智能工作负载。
此外,中国的搜索巨头公司百度也对英特尔至强融核处理器进行了调查并将其作为深度学习技术的处理器选择。他们发现,与GPU替代方案相比,英特尔至强融核处理器还具有强大的浮点运算功能,同时在可编程能力、内存模型和网络特点方面具有潜在优势。
英特尔对人工智能领域IA的未来充满期待。并且,英特尔始终相信它在创造新型服务、节省总体拥有成本和发展业务方面商机无限。