编辑 | 绿萝
有人担心人工智能(AI)已经发展得太快或者可能带来太多风险。AI之父 Geoffrey Hinton 最近辞去了谷歌副总裁的职务,因为他希望更不受约束地讨论AI对社会和人类福祉可能产生的潜在风险。
但是令人沮丧的是,许多科学领域却认为AI没有发展得足够快。其中一个领域是化学,机器学习工具极有可能在研究人员寻找和合成有用的新物质的方式上掀起一场革命。但是,由于缺乏用于“喂养”人工智能系统的数据,大规模的革命尚未发生。
任何AI系统的质量取决于它所训练的数据。这些系统依赖于神经网络,而它们的开发人员必须使用大量、可靠且无偏见的训练数据集来教授神经网络。
如果化学家想充分利用生成式AI工具的全部潜力,他们需要帮助构建这些训练数据集。这需要更多的数据,包括实验数据和模拟数据,以及历史数据和其他模棱两可的知识,例如来自不成功实验的数据。研究人员必须确保产生的信息易于获取。这项任务尚未完成。
例如,人工智能工具可以进行反合成。它们从化学家想要创造的化学结构出发,然后逆向工作,以确定最佳的起始材料和反应步骤顺序。这种方法的人工智能系统包括由德国明斯特大学(University of Münster)和中国上海大学的研究人员设计的3N-MCTS,它将已知的搜索算法与三个神经网络相结合。这些工具已经引起了人们的注意,但是很少有化学家采用它们。
MCTS方法示意图。(来源:Nature)
为了做出准确的化学预测,人工智能系统需要充分了解不同反应所涉及的特定化学结构。发现新反应的化学家通常会发表研究结果,但它们通常并不是那么详细。除非AI系统具有全面的知识,否则最终它们可能会建议起始材料的结构会阻止反应工作或导致不正确的产品。
一个混合开发的例子是人工智能研究人员所称的“逆向设计”。在化学中,这包括从所需的物理特性开始,然后确定具有这些特性的材料,并且最好能够廉价制造。例如,基于人工智能的逆向设计帮助科学家选择最佳材料以制造蓝色磷光有机发光二极管。
逆向设计的计算方法要求模型建议具有所需特征的结构,这种方法已经在化学中使用,并且研究人员经常检查它们的输出。如果想让人工智能在逆向设计方面超越现有计算工具,则需要足够的训练数据以确定化学结构与特性之间的联系。然而,在这种情
本文网址: