端侧AI计算开发最难的问题,都被这家公司搞定了

机器之心报道

作者:泽南

为什么高通技术能成为众多公司产品宣传的重点?

最近一段时间,车规芯片的「天花板」骁龙 8155(第三代骁龙座舱旗舰级平台)引发了人们的热议,这款芯片强大的整体算力一举改变了很多车型饱受诟病的车机卡顿问题。

很多品牌都以搭载骁龙 8155 芯片作为卖点,理想 L9、小鹏 P5、蔚来 ET5、吉利星越 L 等热门车型上都有它的身影,极氪 001 甚至为了让车主放心,宣布免费为已购车的用户升级 8155 芯片。

根据车厂公布的信息,骁龙 8155 是首款 7 纳米制程工艺打造的车规级数字座舱 SOC,性能是上代 820A 的三倍,其具有八个核心,最多支持 6 个摄像头,同时能带动四块 2K 或者三块 4K 屏,支持 WiFi6,也支持 5G 和蓝牙 5.0。在配合大容量内存之后,它能够让汽车的中控屏操作体验像一台旗舰智能手机,最大程度提升了座舱系统的体验。

高性能的车机芯片也为全场景语音等 AI 功能提供了可能性。在一些车型中,AI 助手支持全场景连续对话,驾驶者可以连续下达多个指令,实现真人对话一样的体验,不再需要每个指令说一次唤醒词。

8155 已是骁龙座舱平台的第三代产品,作为这一领域的后来者,高通在车机芯片上对英特尔、瑞萨等老势力已开始占据优势。第四代的高通 8295(第四代骁龙座舱平台)也已经发布,相关车型也已在路上,据称它采用 5nm 工艺,搭载的 NPU 能达到 30 TOPS 的 AI 算力,性能比目前这一代还要提升两倍多。

汽车只是高通技术新进展的一小部分,在手机芯片上占据市场主流的高通最近在做的事,已远远超出了人们的手掌心。

从手机到智能驾驶,走统一路线

高通的车规级 8155 芯片源自于手机芯片骁龙 855,即将在集度汽车上首发的 8295 芯片则来自骁龙 888,它们都是高通基于自己在移动端领域的领先技术打造的。在新的领域里,高通技术能为产品能力和用户体验带来了质变级的提升。

据统计,全球所有主要汽车制造商均已选择骁龙座舱平台,超过 1.5 亿辆汽车采用高通汽车无线解决方案,市场份额高达 80%。骁龙数字底盘及其集成式汽车平台订单总估值超过 190 亿美元。

边缘侧 AI 的流行,让高通在大量实践中形成的技术优势在越来越多的新领域获得了应用。

为构建万物互联的世界,高通还希望实现跨终端的一致性体验,「统一的技术路线图」(one technology roadmap)应运而生。高通希望凭借在 AI、影像、图形、算力和连接等领域的领先技术,为几乎所有边缘终端提供 AI 能力、高性能低功耗系统和无线组件。

在高通 CEO 克里斯蒂亚诺 · 安蒙的设想中,「统一」的范围覆盖从耳机到智能网联汽车,这背后是高通在各领域中的深厚布局。

早在 2021 年骁龙技术峰会上,高通便称,通过骁龙移动平台,高通的 AI 技术已经支持超过 18 亿终端。在新一代骁龙 8 和骁龙 8 + 移动平台中,强大 ISP 和第七代高通 AI 引擎合力实现了精细、低延迟的面部识别能力,更进一步的拍照夜景增强、实时背景虚化、手势识别,甚至能让手机能够通过声音识别用户是否患病,这些 AI 能力为众多应用提供了支持。

通过骁龙移动平台、骁龙计算平台和骁龙 XR 平台,高通已经让各种终端设备能够在影音娱乐、智能助手、情景感知等领域带来丰富、创新的沉浸式使用体验,改变了人们的工作和生活方式。

这些技术也被延伸到了 IoT 领域,AI 正在推动家庭、工业、企业和智慧城市等应用的发展,高通支持了近 13000 家企业的物联网解决方案,其提供的高效 AI 算力正在为机器人、智能制造、智慧城市、智慧零售等场景带来新能力。

AI 能效是骁龙平台的技术优势。除了智能座舱,高通还在汽车领域推动可扩展开放自动驾驶解决方案 Snapdragon Ride。该平台面向不同驾驶场景提供不同等级算力:它可以以小于 5W 的功耗为摄像头提供 10 TOPS 机器学习算力,也能为 L4、L5 级自动驾驶提供超过 700 TOPS 算力。

统一的布局也包括云端算力。5G 网络的连接下,很多 AI 任务负载都可以在云端实现推理,高通通过 Cloud AI 100 加速器,使芯片架构从边缘到云端实现了统一。

Cloud AI 100 支持数据中心、边缘设备和汽车等多种场景。单个高通 Cloud AI 100 PCI-E 卡能提供 400 TOPS 算力,高通与合作伙伴提出的服务器解决方案,实现了 AI 推理突破每秒千万亿次运算大关。

从端到云,高通的各个业务线都已深度整合了 AI 能力,已为人们带来了全新的体验。

打造统一的 AI 开发工具

在 AR、VR 和智能驾驶这些「未来方向」上,已有的算力和 AI 算法仍然无法满足人们的需要。为了应对挑战,高性能计算和端云融合是目前科技公司发展的趋势。硬件之外,高通还实现了 AI 软件工具的统一。

最近,高通发布了自己的首个 AI 软件栈 Qualcomm AI Stack,将所有业务线的 AI 软件能力整合在了统一的软件栈中,实现了跨智能网联终端的完整解决方案。

现在,开发者可以在一个体系下,高效、低成本地面向不同智能终端进行 AI 模型和软件开发了。

根据官方介绍,高通 AI 软件栈主要包括三大部分:硬件、软件和工具。这套方案可以在所有高通支持的产品上运行,覆盖范围包括智能手机、汽车、AR/VR 硬件、物联网和云平台。

首先,高通 AI Stack 包括系统接口、仿真支持和驱动程序,支持大部分常用的操作系统,包括 Android、Windows、Linux 以及面向网联汽车的 QNX 等,以及 Prometheus、Kubernetes 和 Docker 等容器平台。

在更高一层的库和服务层面,高通 AI 软件栈支持大量数学库、编译器和虚拟平台,以及分析器和调试器。AI Stack 支持大多数流行的 AI 框架和 Runtime 如 TensorFlow、PyTorch、ONNX 和 TensorFlow Lite、TensorFlow Lite Micro、ONNX 等。

另外,AI Stack 的编译器可以针对特定内容进行定制化处理,几行 Python 代码就可以完成更多工作,为开发者提供很多便利。

AI Stack 集成了高通在 AI 领域十余年来的研发成果,如高通 AI 模型增效工具包(AIMET),它能提供模型量化和模型压缩技术,进行量化感知训练(Quantization Aware Training)和无数据训练,它的最重要能力之一是能将在云端训练的高算力需求 AI 模型从 32 位浮点精度转化为 8 位整数格式,在几乎不降低推理效果的情况下提升 4 倍效率,从而覆盖更多低功耗设备。

作为新解决方案的一部分,高通 AI 引擎 Direct 现在可以在高通所有产品的 AI 加速器上进行扩展,从高通平台上直接向 AI 加速器部署模型,不仅能够为开发者提供模型开发的功能,还支持将新开发的模型迁移至不同产品和层级。

虚实融合是未来发展的方向,高通开放的 XR 平台 Snapdragon Spaces XR 也成为了 AI Stack 的一部分,开发者可以从零开始面向 AR 眼镜创建 3D 应用,或在现有 Android 智能手机的 2D 应用中增加头戴式 AR 特性。

现在,人们只需要一次开发 ,就可以在多个不同领域部署自己的技术,工作重点可以放在探索创新的 AI 用例上,无需重复造轮子。

基于高通 AI Stack,企业也能够实现在不同产品、不同平台之间的扩展,方便地把移动端开发经验迁移到汽车上,也能将 XR 等平台的复杂模型开发经验带回移动端。

结语

每当我们用手机拍照、看短视频时,很少会意识到这些日常行为的背后有很多 AI 技术的支撑。虽然从边缘设备到云服务器,只要是连接网络的地方,AI 已经无处不在,但展望未来,还有很多事可以做。

据 Gartner 预测,到 2025 年将有超过 50% 的数据在传统数据中心之外产生和处理。数据处理正在从数据中心转向边缘,并推动对更强大的本地处理能力的需求。

高通处于行业趋势的交汇点,在长期持续的技术投入之后,高通已经构建起一套完整的体系,从芯片、软件平台、算法到生态系统和参考设计,面向开发者和用户提供了强大的能力。

可以感受到,让汽车聪明起来只是一个开始,高通的 AI 能力,还在赋能越来越多的领域。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com