新智元报道
编辑:白峰
【新智元导读】近日,由圣母大学姜炜文博士后,史弋宇教授和 IBM 研究院 Jinjun Xiong 博士开展的研究,实现了首个机器学习和量子计算协同设计框架,QuantumFlow,为神经网络在量子计算机上的实现铺平了道路。
QuantumFlow 框架能够自动地完成神经网络到 IBM 量子计算机的部署。
原文链接: https://arxiv.org/pdf/2006.14815.pdf
神经网络加速迎来新玩家
量子计算机是一种使用量子逻辑进行通用计算的设备,使用量子比特进行数据存储,使用量子算法来进行数据操作。
量子计算研究可以追溯到 19 世纪 60 年代,在 2016 诞生了首台可编 程量子计算机。IBM 于 2019 年 1 月展示了商业化量子计算机 IBM Q,并预测将于 20 世纪 20 年代获得量子优势:针对真实的应用场景,展现出量子计算超越经典计算的能力。
图 1: 量子优势之路:从 19 世纪 60 年代的量子科学,2016 年进入量子准备阶段,20 世纪 20 年代将进入量子优势阶段以利用量子计算机解决实际问题 (Source: IBM)
图 2: 神经网络硬件加速器迎来新成员:量子计算机
深度神经网络是当下计算应用中发展最快,使用最广的机器学习算法。如图2所示,深度神经网络加速器,已经在通用处理器(CPU,GPU)以及专用加速器(FPGA,ASIC)上得到广泛研究。
然而,随着应用不断复杂化导致网络结构不断扩大,存储性能瓶颈已逐渐凸显。在传统计算平台上,N 个数字比 特只能表示 1 个 N 位数据,然而在量子计算中,M 个量子比特却同时能表示 2^M 个数据,并能同时操作这些数据。
量子计算机如此强大的存储与计算能力,使其拥有巨大潜能打破神经网络在传统计算平台上的性能瓶颈,获取量子优势。
首个量子计算协同设计框架,让你的神经网络飞起来
如何在深度学习领域获取量子优势还面临诸多挑战,其中第一个障碍便是缺少一个协同设计神经网 络与量子线路的自动化工具。
现有工作或是尝试直接将针对传统计算系统设计的神经网络映射到量子计算机,或是直接设计量子神经网络。
然而这样的独立设计很难发挥量子计算机的优势(例如实数乘法会引入过多量子比特,带来巨大开销)。根本原因是缺乏一个协同设计的工具,该工作填补了这一空白,提出了第一个神经网络/量子计算协同设计框架,QuantumFlow。
图3 QuantumFlow 协同设计框架
如图 3所示,QuantumFlow 框架包括四个组件:
网络模型设计器 QF-Net:其利用随机变量对输入实数数据进行表示,能够自然地利用量子状态进行表示,并实现随机变量的运算。该设计器提出了便于量子线路实现的基本运算操作,包括向量的线性、非线性运算与批标准化操作。
量子线路设计器 QF-Circ:针对 QF-Net 中每一个运算操作,设计了对应的量子线路实现。
前向反向传播器 QF-FB:提供在传统计算平台高效的前向后向传播实现,以为支持高效地 QF-Net 模型训练。
网络映射 QF-Map:根据依靠 QF-FB 训练得到的 QF-Net 模型,将首先进行网络-线路映射,建立 QF-Net 对应的量子线路 QF-Circ;进而进行虚拟-物理量子比特映射,部署 QF-Net 到量子计 算机。在进行虚拟-物理量子比特映射时,将考虑量子计算机的错误率,以提高模型精度。
基于 QF-FB 在传统计算机上的模拟结果展示了 QF-Net 的有效性。如图 4所示,针对量子计算设计的 QF-Net 获取比具有相同结构的针对传统计算系统的多层感知器 MLP(C) 更高的精度。
图 4: QF-Net 在 MNIST 数据集子集:{3,6}, {3,8}, {1,3,6},上获取最高精度
具有批标准化操作的 QF-Net(w/ BN) 在识别数字 3,6 中获得 97.01% 的准确率,比现目前最新的针对量子计算设 计的 FFNN 网络,提升了 14.55% 的准确率。
图 5展示了一个二值分类示例。QuantumFlow 通过 QF-FB 训练得到网络如图 5(b) 所示,根据 QF-Map,将 QF-Net 首先映射到 QF-Circ 上,如图 5(C) 所示,进而根据 IBM 量子计算机 ibmq_essex 的错误率 (图 5(d)),QF-Map 将 QF-Net 映射到物理量子比特上,并对 100 组输入数据进行分类。在量子计算机上所获取的结果如图 5(h) 所示。
图 5: 二值分类示例,在 IBM 包含 5 个量子比特的量子计算机 “ibmq_essex” 上,获取了 82% 的精度。
图 5(e) 展示了有 QF-FB 在传统计算系统上获得的标准结果,图 5(f) 展示了使用 IBM Qiskit Aer 模拟进行 QF-FB 的结果,其准确度达到 98%。而图 5(g) 展示了不采用 QF-Map 而采用 IBM Qikist 自带编译器进行映射所得到的结果,正确率仅为 68%。最后,使用 QF-Map 可以将正确率提升至 82%。
该实验展示了量子计算实现神经网络的可能性,尽管 IBM 量子计算机的错误率在 10^−2 量级(相较于数字电路的 10^−15 错误率),通过 QuantumFlow 协同设计的神经网络量子计算系统已经能够对数据进行有效地分类处理。结果展示了 QuantumFlow 的有效性。
QuantumFlow 将于近期开源,详细信息请关注 https://wjiang.nd.edu/categories/qf/。
作者简介
论文第一作者姜炜文目前是圣母大学的博士后研究助理。2019年获重庆大学博士学位。2017年到2019年,曾在匹兹堡大学电子和计算机工程系参与研究工作。
博士期间,姜炜文在国际会议和主要期刊上发表了50多篇研究论文,其中包括10多篇 IEEE/ACM 会刊论文,他在硬件加速和神经网络结构方面的合作研究获得了 DAC’19,CODES+ ISSS’19和 ASP-DAC’20最佳论文提名。
他在神经网络和并行系统等方面的研究工作引起了业界的广泛关注,得到了美国国家科学基金会国际自然科学联合会的科研基金,与 Facebook、 Edgecortix inc. (日本/新加坡)等公司开展了合作研究,并在过去一年中,获得了超过$250K的研究基金资助。
姜炜文曾在2015年「NVMSA」及2017年「ICCD」中获得两项最佳论文奖,并在2016年「 ASP-DAC 」、2019年「 DAC 」、2019年「 CODES+ISSS 」及2020年「 ASP-DAC 」中获得四项最佳论文提名。
深度学习的进步很大程度上依赖算力,而现在传统硬件的算力增长已经赶不上超级人工智能的需求,如果神经网络能无缝迁移到量子计算机,像数据从CPU移到GPU中一样,将是人工智能科学家们的福音。