机器学习的崛起:从材料设计到生物医学、量子计算......再到工业应用

编辑/凯霞

机器学习在加速材料研究方面具有巨大潜力。材料科学的许多领域都从它的应用中受益,但仍然存在一些挑战,该领域是否会像围绕它的大肆宣传那样,还有待观察。

机器时代即将来临。当我们提出材料科学中机器学习的焦点问题时,我们很清楚算法可以为其编写合理的开篇社论。毕竟,它不会是第一次写文章,或者就此而言,甚至也不是第一次写书。

你可以询问 Alexa 或 Siri,它会使用它的机器学习算法为你找到一些关于人工智能的好处和危险的文章。根据你过去的搜索以及他们对你的兴趣所揭示的内容,它可能会继续推测是否有太多关于机器学习工具超越人类的能力的炒作。

然而,毫无疑问,机器学习正在影响科学的所有领域,材料科学也不例外。在《Nature Reviews Materials》杂志的 2021 年 8 月,第 6 卷 第 8 期焦点问题以及该杂志的其他文章中,探讨了机器学习如何推动材料研究,我们可以实际期待哪些进展,以及研究人员应该注意什么以确保他们的机器学习算法按照设计的方式工作。

机器学习与新兴材料智能生态系统

为了设置场景,来自美国阿贡国家实验室、佐治亚理工学院(Georgia Institute of Technology)的科学家在《Nature Reviews Materials》杂志上发表题为《Emerging materials intelligence ecosystems propelled by machine learning》的综述。回顾了材料科学机器学习的关键组成部分,从数据采集和管理协议到自主实验策略。讨论了迫在眉睫的挑战,其中包括对标准化协议、基准数据集以及机器学习代码和数据的开放共享的需求。

论文链接:https://www.nature.com/articles/s41578-020-00255-y

机器学习与材料设计

机器学习工具箱已经在材料科学的几乎所有主题中得到了卓有成效的应用。它用于光子器件的设计,

斯坦福大学电气工程系的研究人员在一篇题为《Deep neural networks for the evaluation and design of photonic devices》的综述中详细介绍了这一点。

在这篇综述中,研究人员展示了配置为判别网络的深度神经网络如何从训练集学习并作为高速代理电磁求解器运行。研究了深度生成网络如何学习设备分布中的几何特征,甚至被配置为强大的全局优化器。讨论了在光子学背景下构建的基本数据科学概念,包括网络训练过程、不同网络类别和架构的划分,以及降维。

论文链接:https://www.nature.com/articles/s41578-020-00260-1

正如罗格斯大学(The State University of New Jersey)Adam Gormley 和普林斯顿大学 Michael Webb 在一篇评论《Machine learning in combinatorial polymer chemistry》中所描述的那样,机器学习能够驾驭聚合物复杂的结构—功能景观的能力可用于设计高性能聚合物。

论文链接:https://www.nature.com/articles/s41578-021-00282-3

又如美国杨百翰大学(Brigham Young University,BYU)Gus Hart 及其同事在《Machine learning for alloys》评论中所探讨的那样,当应用于合金时,机器学习推动了从金属玻璃到高熵合金和结构材料等材料优化的进展。

该论文综述了机器学习驱动的合金研究的现状,讨论了该领域的方法和应用,并总结了理论预测和实验验证。预见机器学习和合金之间的合作将导致设计新的和改进的系统。

论文链接:https://www.nature.com/articles/s41578-021-00340-w

此外,机器学习加速并改进了具有多种特性的纳米粒子的合成,多伦多大学 Eugenia Kumacheva 及其同事发表综述《Nanoparticle synthesis assisted by machine learning》。该综述讨论了可用于纳米粒子合成的 ML 算法,并重点介绍了收集大型数据集的关键方法。研究了 ML 引导的半导体、金属、碳基和聚合物纳米粒子的合成,最后讨论了 ML 辅助纳米粒子合成发展中的当前局限性、优势和前景。

论文链接:https://www.nature.com/articles/s41578-021-00337-5

机器学习与生物医学

正如美国 Simons 基金会 Flatiron 研究所的研究人员在他们的评论中所讨论的那样,机器学习也已成为询问复杂和大型生物医学数据集的关键工具,能够研究多细胞复杂性和开发个性化疗法。

首先,简要介绍了允许研究组织特异性的关键单细胞和全组织方法,然后,重点介绍两类基于机器学习的方法,它们可用于分析、建模和解释这些方法实验数据。最后,结合高分辨率、大规模多组学数据集和可解释的机器学习模型,展望了检查多细胞复杂性的未来可能性。

论文链接:https://www.nature.com/articles/s41578-021-00339-3

机器学习与计算可持续性应用

机器学习可以应用于截然不同的问题,所以机器学习可以促进学科之间的交叉融合。在过去的十年中,计算可持续性研究所为各种计算可持续性应用开发了人工智能和 ML 方法,这些方法也被用来推进材料发现,反之亦然。

康奈尔大学和加州理工学院的科学家发表以《Computational sustainability meets materials science》为题的评论文章。描述了生态学和材料科学应用产生的协同作用。强调了模型可解释性和结合先前科学知识以更好地调节模型、产生具有科学意义的解决方案,并弥补训练数据不足的重要性。

论文链接:https://www.nature.com/articles/s41578-021-00348-2

机器学习与文本挖掘

机器学习的一个有前途的应用是文本挖掘,从文章和其他文档中提取信息,并将其集成到结构化数据集中。加泰罗尼亚理工大学的研究人员发表以《Time to kick-start text mining for biomaterials》为题的评论,这一壮举对于复杂且难以组织的数据尤其重要,例如生物材料数据。将文本和数据挖掘工具应用于生物材料需要首先解决几个特定领域的挑战。其中包括数据的高度异质性以及生物材料出版物中使用的多学科和快速发展的语言。

论文链接:https://www.nature.com/articles/s41578-020-0215-z

机器学习与量子技术

另一个重要趋势是推动能够进行实验、测量结果并在下一次迭代中做出决策的自主系统。这种方法对于需要繁琐的手动优化的实验尤其有利:其中一个例子是超导量子位的调优,正如牛津大学的 Natalia Ares 在《Machine learning as an enabler of qubit scalability》中所讨论的,在该领域中,机器学习可能是实现相关量子位可扩展性的关键因素。

论文链接:https://www.nature.com/articles/s41578-021-00321-z

机器学习与工业应用

与科学的其他领域一样,要从原理验证演示转向实际应用,与工业合作伙伴的协同作用将至关重要。丰田研究所 Muratahan Aykol 及其同事在《Machine learning for continuous innovation in battery technologies》中认为,机器学习在电池优化中的应用尤其如此,在现实条件下从测试中获得的数据是必不可少的。研究人员讨论了数据驱动、基于机器学习的方法如何帮助电池研究人员满足电池持续创新的需求。

论文链接:https://www.nature.com/articles/s41578-020-0216-y

为了探讨一位工业研究人员的观点,《Nature Reviews Materials》杂志采访了时任 Google Research 的工程师 Patrick Riley,他说,「随着该领域的成熟,一个重要的趋势是转向将机器学习视为一个独立的组成部分系统,但作为一个很好的集成齿轮。」

论文链接:https://www.nature.com/articles/s41578-021-00349-1

机器学习的所有承诺可能都不会实现。机器学习是一种强大的工具,但要让机器学习算法能够与研究人员对材料科学做出贡献的热情和创造力相媲美,还需要很长时间。这也许是一件好事。

参考内容:https://www.nature.com/articles/s41578-021-00351-7

人工智能 × [ 生物 神经科学 数学 物理 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。

欢迎关注标星,并点击右下角点赞和在看。

点击阅读原文,加入专业从业者社区,以获得更多交流合作机会及服务。