人工智能(AI)被称为科学的革命性工具[1,2],并被预测将在未来的研究中发挥创造性作用[3]。例如,在理论化学的背景下,科学家认为人工智能可以以一种方式帮助解决问题,使得人类无法区分是这种[AI]还是与人类专家交流[4]。然而,并非所有科学家都认同人工智能带来的改变。有些人质疑先进的计算方法是否可以超越“数字”[5-9],并在根本层面上为获得新的科学理解(scientificunderstanding)做出贡献[10-12]。
在本文中,我们将讨论先进的计算系统,尤其是人工智能,如何为科学理解做出贡献:我们概述了目前的可能性以及未来可能出现的情况。除了对文献的回顾,我们还调查了数十名在生物学、化学或物理学交叉领域工作的科学家。这些个人叙述(见补充资料)集中于思想的具体发现过程,是对科学文献的重要补充。
首先,人工智能可以作为工具揭示物理系统的属性,然后人类将这些洞察力提升到科学理解。
第三,人工智能可以充当理解的媒介。人工智能达到了新的科学见解,而且重要的是,可以将其理解传递给人类研究人员。尽管还没有任何例子表明人工智能在科学中充当了真正的“理解主体”(agentofunderstanding),但我们概述了这样一个系统的重要特征,并讨论了实现它的可能途径。
在前两个方面,人工智能使人类获得新的科学理解,而在最后一个方面,机器自己获得理解。对这些类别的区分使我们能够描绘出一个充满活力且大多未被探索的研究领域,并希望能够为自然科学中未来的人工智能发展指引方向。
人工智能先驱DonaldMichie将机器学习(ML)分为三类:弱人工智能、强人工智能和超人工智能,其中超人工智能需要机器来教人[19]。超人工智能的机器学习与理解主体的概念有关,我们将在下文中进行定义和详细介绍。
一个非常有用的、可理解的科学计算和人工智能方法的集合可以在参考文献[20]中找到。参考文献[21]中描述了分子设计的不同自动化水平,最后一步是由计算机来选择最初的想法。其他作品研究了基于特定科学方法的完全自动化可能是什么样子,从而产生了“诺贝尔图灵挑战”[22]的想法,即开发一个能够做出诺贝尔奖级别科学发现的人工智能系统。
我们注意到,我们的观点有目的地不依赖于任何特定的科学方法(以避免基础层面的问题[23])。相反,我们专注于科学家如何获得“科学理解”,以及先进的人工智能如何帮助人类获得新的科学理解。
二、科学理解
想象一个先知可以提供永远正确的重要预测。尽管这样一个假设的存在会产生重大的科学影响,但科学家们并不满足。他们希望“能够掌握预测是如何产生的,并对具体情形下的后果产生感觉”[13]。通俗地说,我们把这个目标称为“理解”,但这到底是什么意思呢?
为了找到科学理解的标准,我们从科学哲学中寻求指导。尽管几乎没有科学家会反对将“理解”作为科学的基本目标(与解释、描述和预测并列[24]),但这种观点并不总是被哲学家所接受。卡尔·亨普尔(CarlHempel)对澄清“科学解释”的含义做出了基础性的贡献,他认为“理解”是主观的,只是科学活动的心理副产品,因此与科学哲学无关[25]。
众多哲学家批评了这一结论,试图正式确定“科学理解”的实际含义。这些提议表明,“理解“与建立因果模型的能力有关(例如,开尔文勋爵说:“在我看来,‘我们是否理解物理学中的某一主题’的检验标准是,‘我们能否为它建立一个机械模型?’”[13]),与提供可视化(或明确表达,正如其坚定的支持者埃尔温·薛定谔所称[26,27])有关,或者理解对应于提供思想的统一性[28,29]。
最近,HenkdeRegt和DennisDieks发展了一种新的科学理解理论,它既是背景性的,也是实用性的[12,13,24]。他们发现,诸如可视化或统一化的技术是“理解的工具”,从而将以前的想法连接到一个总体框架中。他们的理论对正在使用的具体“工具”是不可知的,这使得它在各种科学学科中的应用特别有用。
deRegt和Dieks扩展了海森堡(WernerHeisenberg)的见解[30],他们的理论背后的主要动机是“令人满意的科学理解概念应该反映科学的实际(当代和历史)实践”,而不是仅仅引入理论或假设的想法。简单地说,他们认为“如果存在一个关于P的可理解的理论T,使科学家能够在不进行精确计算的情况下认识到T的定性特征后果,那么一个现象P就可以被理解”[12,13]。deRegt和Dieks定义了两个相互关联的标准。
理解现象的标准:如果存在一个关于P的可理解的理论T,那么现象P就可以被理解。
理论的可理解性标准:一个科学理论T对科学家来说是可理解的(在背景C中),如果他们能够认识到T的定性特征后果而不进行精确计算。
我们决定使用这个具体的理论,因为它可以用来“实验”评估科学家是否“理解”了新的概念或想法,而不是通过检查他们的方法论,只看科学结果和后果。这种方法也与AngelikaPotochnik的论点相吻合,即“理解需要在某种意义上成功掌握理解的目标”[11]。
三、科学发现与科学理解
科学理解和科学发现都是科学的重要目标。两者的区别在于,没有新的科学理解,科学发现是可能的(我们在参考文献[12,13]中使用了精确的术语)。
让我们来研究三个例子。第一,为了设计新的有机激光二极管的高效分子,利用机器学习和量子化学的见解[31]探索了160万的搜索空间。排名第一的候选分子被实验合成并进行了研究。因此,本研究的作者发现了具有非常高量子效率的新分子。尽管这些发现可能会产生重要的技术后果,但这些结果并没有提供新的科学认识。从结果本身来看,如果不进行进一步的详细计算,就不能得出定性的结果。
第二,最近在蛋白质折叠方面由机器学习促成的突破[32,33]无疑将改变生物化学的面貌。然而,到目前为止,AlphaFold一直是一个黑盒子:一个神谕,因此,它并没有直接提供deRegt和Dieks意义上的新的科学理解。
第三,物理学中的许多发现是在提供科学理解的理论或解释被发现之前(有时是很久之前)发生的。例子包括超导的发现(及其高温版本)、宇宙微波背景的发现、中微子振荡以及在夸克模型发明之前发现的粒子动物园。
这些例子表明,科学发现可以导致科学和技术的破坏,而不直接促进科学理解[11,24]。
然而,问题是,一个能够重新发现物理规律和概念的人工智能是否也能够为新的科学理解做出贡献。我们认为,这并不能保证。这些人工智能系统的人类创造者知道他们在这些案例研究中寻找的是什么。因此,目前还不清楚如何防止代码或数据中的有意识和无意识的偏见(在最广泛的意义上,例如,通过选择特定的代表)。
宽泛地说,从先进的计算系统中获得新的理解意味着发现新的想法、原则、概念甚至理论,科学家们可以在不同的情况下应用和使用这些想法、原则、概念或理论,而不需要(完整的)计算。在接下来的章节中,我们将概述如何做到这一点,以前的方法已经取得了哪些成果,以及我们如何能走得更远。
四、计算机辅助理解的三个维度
正如在引言中已经提到的,我们调查了科学文献并使用了几十位科学家的个人轶事。然后,在科学哲学提供的框架内,我们对人工智能对科学理解的贡献进行了新的分类,这有助于描绘出未来研究的不同方向。我们称这种分类为“维度”,因为它们是独立的、非排他的。
在这两个方面,人类科学家对于识别和完善新的洞察力和灵感,并将其发展到充分理解是必不可少的。对于前者,机器创造了新的数据(并可能以先进的方式表示),从而,人类科学家从其中提取她的新理解。对于后者,机器明确地寻找令人惊讶或有趣的新想法或意想不到的联系,并将其呈现给人类科学家,后者利用它们来达到新的科学理解。即使没有先进的计算系统或人工智能,这两个层面也可以存在。然而,人工智能可以大大促进和扩展它们的机会。
第三个维度是人工智能作为“理解主体”,代替人类对观察结果进行归纳,并将这些新的科学概念转移到不同现象中,而且——重要的是——将这些见解传达给人类科学家。
由于本视角的重点是人工智能辅助的新的科学理解,我们强调这样一个理解主体必须能够将其见解传递给人类。我们将简要讨论一个不能传达其见解的主体的情况。
上述的三个维度不应该被教条式地理解,而是提供一个框架来指导未来的方向。在下面的章节中,基于具体的例子,我们更详细地讨论每个维度,并提出推动目前可能的边界的途径。
1.计算显微镜
在“理解”的背景下,由计算显微镜产生的新的计算机数据需要在不完全计算的情况下被推广到其他环境中[13]。我们用两个具体的例子来说明这一点。
第一个例子是SARS-CoV-2的分子动力学模拟。参考文献[38]的作者发现了新的生物功能,这些功能在穗状蛋白的开放和封闭构象中表现出不同的行为。这一解释改变了人们对生物系统中糖类的看法,并启发了分析这些系统的新方法,而不需要进行全面计算。
在第二个例子中,参考文献[39]的作者描述了分子动力学模拟如何帮助他们发现称为糖块的基本模式。系统地使用糖块既可以用来理解生物大分子的序列-结构-属性关系,又可以为设计具有所需功能的合成结构提供信息,而不需要模拟整个系统。
计算显微镜可以进一步改进吗?我们讨论了两个充满活力的方向。第一,更先进的计算系统将允许对越来越复杂的物理系统进行分析。第二,以更可解释的方式表示信息将促进科学洞察力的提取。
①越来越复杂的系统
此外,用于量子化学[43]和物理学[44-46]的实验性量子计算的进展表明,基于量子力学的全新算法将在这个领域发挥重要作用[47,48]。算法的改进可能涉及到模拟过程中的自适应和智能解析以及先进的可视化方法[13],这直接导致了未来发展的第二个方向。
②先进的数据表示
在计算机辅助理解的第一个维度中,人类科学家应该对来自计算显微镜的新数据进行概括。因此,我们认为数据表示的进步可以极大地帮助人类掌握基础结构,促进新的科学理解。科学家们目前主要是在(可能是动画的)二维图形表示中分析数据。我们相信,真正的3D环境(通过虚拟或增强现实眼镜或全息技术实现)将大大有助于对复杂系统或复杂数据的理解。这方面的初步进展已经在化学[49-51]和天体物理学[52]中得到证明,我们期望这将成为科学家的标准工具。
①识别数据中的异常
从实验或模拟中获得的特殊数据点或意外的规律性可以引发新的想法和概念。我们的调查显示,这些例外点通常是由人类来识别的,比如以下两个例子,它们使用的是化学[57]和量子光学[58,59]中的高通量计算。
第一个例子涉及到高压物理学中晶体结构的一个意外相。在参考文献[60]中,作者发现了一个意外的NH2和NH4层交替的稳定构型,而不是密集的NH3相。他们将这一现象概念化为自发电离,这是酸碱化学中的一个常见过程,现在在NH3的高压相图中是一个被广泛接受的现象。物质高压行为中的自发电离已经成为一个比较普遍的原则,不需要进行任何模拟就可以使用。
在第二个例子中,寻找新的量子实验发现了一个具有比预期大得多的量子纠缠的解决方案[58]。该研究的作者理解了基本原理,从而发现了纠缠产生的新概念[61,62]。该原理可以在没有任何计算的情况下使用,例如,现在作为更先进的人工智能系统中的量子物理学的新代表[63],证明了计算机启发的想法在更普遍的不同背景下的应用。
一种有趣的检测异常值的技术,以前曾用于发现量子相,就是撇开一个(或一些)训练实例,观察神经网络的后果[71]。通过Hessians的计算,引入影响函数,是识别单个训练实例影响的一种计算效率高的方法[72]。自主发现对称性的神经网络可以成为科学数据中异常值的有效发现工具,因为其中的基本规则可能事先并不知道[73,74]。
估计预测的置信度将是另一种直接搜索数据中异常点的方法[75]。揭开隐藏的规律性的能力在数学中得到了证明,其中一个人工智能暗示了纽结理论中以前没有联系的不变量之间的关系,这使得数学家能够猜想并证明新的定理[76]。另外,一个能够构建新的科学假设的人工智能可以发现标准统计方法无法辨别的异常值或意外模式。
看到人工智能发现以前被人类忽视的科学数据中隐藏的模式或不规则现象,这将是真正令人兴奋的,这可能导致新的想法,并最终导致新的概念理解。截至目前,我们还没有意识到这样的案例。
最后,我们注意到,这些分析的数据点可以从计算方法(涉及上一节所述的方法)中获得,这对数学或理论物理学来说是令人兴奋的机会[77]。或者,这些数据可以直接从实验中获得。在这里,我们可以想象一个闭环的方法,其中一个算法试图探索环境,并引导探索进入意外的区域。如果数据源是一个实验,未来的人工智能系统将需要进入复杂的实验室自动化,有大的参数空间可以探索,这在生物学[78]、化学[79-84]或物理学[85,86]中得到了证明。
②识别科学文献中的惊喜
基本上每个科学领域的科学论文数量都在大量增长[87,88]。因此,研究人员不得不专注于狭窄的子学科,这使得寻找新的跨学科思想变得困难。在未来,我们相信计算机将能够以自动化的方式使用科学文献[89-92],并识别出特殊和令人惊讶的现象,以便进一步调查。虽然据我们所知,对科学文献的大规模自动分析还不能诱发新的科学理解,但该领域有重大进展。
实现这一目标的一个有希望的方法是对大型科学论文语料库进行无监督的词嵌入。在该技术中,科学文献的内容被转化为一个高维矢量空间。这种方法已被用于材料科学领域[93],并重新发现了核心科学概念,如元素周期表。此外,这些结果还表明存在以前未发现的结构-性能关系。这方面的例子包括热电材料的新候选材料。
此外,材料科学领域正在开发其他一些先进的计算技术,以从科学文献中提取知识,并通过人工智能技术对其进行系统的研究[94],并且可以得出复杂的科学结论,例如,关于不同晶体结构之间的关系[95]。
另一种方法旨在从大量的科学文献中建立语义知识网络。在这些网络中,科学概念是节点,而边则承载着关系信息。在最简单的情况下,这意味着两个科学概念在同一篇科学论文中被提及[96,97]。因此,科学知识被表示为一个不断发展的网络,它可以被用来识别科学文献中的岛屿和未开发的区域。这种类型的网络被用于生物化学,以确定有效的全球研究策略[96];并用于量子物理学,以预测和建议未来的研究方向[97]。
人工智能技术的进步可以大大改善这种类型的系统。例如,自然语言处理架构,如BERT[98],或GPT-3(参考文献[99])可以帮助从研究论文中提取更多的科学知识,而大型基于图的神经网络可以改善从语义网络中预测新的研究主题[100]。
③通过检查模型获得意外的概念
我们还期望通过合理化人工智能算法为解决特定问题而学到的东西以取得相当大的进展,换句话说,可解释的人工智能[101-103]。
实现这一目标的一个想法是受到DeepDreaming的启发,这是一种首次用于计算机视觉的方法[104,105]。简单地说,这个想法是反转一个神经网络并探测其行为。这种方法已被应用于重新发现热力学特性[35]和功能分子的设计原则[106]。
另一个显著的应用是神经网络中的“变量分解”[107]。其目的是了解神经网络已经学会的内部表征。以地心坐标表示的天文数据被用来训练一个神经网络,而变量的分离使得通过模型的内部表示重新发现了日心坐标[34]。对称性,或其守恒量,也可以通过使用一对神经网络[108,109]来自主提取。然后,这对神经网络被训练来识别两种不同的物理情况在某种未知的对称性下是否相等。最后一层是一个信息瓶颈,只由一个神经元组成。这样一来,神经网络就学会了识别保护属性,并将整个信息压缩到一个神经元的输出中。然后,输出可以很容易地被比较,而且,很容易被人类研究者解释。
在化学中,机器学习模型的反事实解释已经被证明可以产生模型预测背后的原理。反事实的解释说明了事件或实例中的哪些差异会产生结果的变化。参考文献[112]展示了如何以独立于模型的方式实现这一点(它已被证明适用于随机森林、序列模型和图神经网络),表明未来在科学中打开人工智能黑箱的巨大潜力。
尽管不是在科学领域,一项研究调查了下棋的人工智能AlphaZero对国际象棋的了解,以及类似人类的知识是如何在内部表示中编码的[113]。所有这些作品中重新发现的概念都不是新的,因此,未来最重要的挑战是学习如何提取以前未知的概念。
④从可解释的解决方案中获得新概念
与其说从人工智能算法中获得灵感,不如说科学家们也能从他们提供的解决方案中获得惊喜。当解决方案以可解释的方式表示时,它们可以带来新的想法和概念。可解释性表示法的一个例子是数学公式。因此,科学家可以检查计算机算法得出的公式,直接解决数学问题,并得出更普遍的解决策略。
一些研究证明了从机械系统[36,114]、量子系统[115]和天文学[116]的实验数据中提取符号模型;也见文献[117]。这些方法,例如与因果推理[118]等方法相结合,可以改进为未知系统提出合理的物理模型,促进科学理解,这将是令人激动的。总的来说,数学领域已经取得了令人振奋的进展[119、120],我们可以预见类似的方法将对物理科学产生重大影响。
天文学中最近的一个具体例子是,从过去30年对太阳系行星和卫星的实际观测数据中重新发现了牛顿的引力定律(参考文献[37])。图神经网络的应用允许对物体的运动进行高质量的预测。
这种方法的另一个例子已经在量子光学领域展示出来了[63]。在那里,一个人工智能算法用图论表示量子光学设置,为以前未知的量子系统设计配置。最终的解决方案被表示在一个物理上可解释的图论表示中。从那里,人类科学家可以快速解释解决方案工作的根本原因,并将其应用于其他环境,而无需进一步计算。因此,开发可解释的表示和方法来提取其他领域的基本概念将是未来的一个重要研究方向。
⑤探测人工主体的行为
另一个很少被探索的机会是解释机器在被赋予解决科学问题的任务时的行为[121]。采取行动的算法,如遗传算法或强化学习主体采取政策来导航问题空间。人类科学家可以观察它们如何导航这个空间。与其遵循严格的外部奖励,例如最大化一个物理系统的特定属性,不如实施内在的奖励,如人工好奇心[122,123]。与其直接最大化某些功能,人工主体(artificialagent)试图学习和预测环境的行为。然后,它选择导致它不能很好预测的情况的行动,从而使它自己对环境的理解最大化。
在模拟的虚拟宇宙[124]中使用好奇心强的主体和在真实实验室[84]中使用机器人主体已经表明,好奇心是一种有效的探索策略。人工主体的其他内在奖励是“计算创造力”[125、126]和“惊喜”[127]。这些内在奖励可以产生特殊的和意想不到的解决方案和主体行为,最终激发人类科学家。
3.理解主体
我们考虑的第三个也是最后一个维度,是能够自主地获得新的科学理解,并最终向人类解释这些见解的算法。我们调查的受访者和科学文献中都没有描述过这种壮举。因此,我们将通过列出这些主体的要求,提出检测其成功实现的测试,并推测这种系统可能是什么样子的来接近这一类。
唐纳德·米奇(DonaldMichie)在1988年的开创性工作“未来五年的机器学习”[19,128,129]中已经讨论了机器向人类翻译见解的想法。Michie将人工智能算法分为三类:弱机器学习、强机器学习和超强机器学习。
弱机器学习通过大量的训练数据实现了预测质量的提高。可以说,今天的大多数机器学习方法都属于这一类,其中的算法被当作一个黑盒子。强机器学习方法类需要提供其假设的符号表示,例如,通过布尔(逻辑)表达式或数学方程。最后,超强机器学习方法要求算法教给人类操作者,从而使人类的表现与人类单独从数据中学习相比得到改善。
有趣的是,关于某些逻辑任务的实验表明,超强机器学习算法可能已经存在,从而证明了“存在一类关系概念,这些概念对人类来说很难掌握,但在抽象的解释下很容易理解”[129]。超强机器学习的想法与我们的第三个维度,即理解主体有关。两者都要求机器获得新的洞察力,并将其传授给人类。
除了我们对自然科学的限制外,还有其他不同之处:Michie要求以符号的方式传递见解,而理解主体则更加灵活,允许任何教学方法,例如,通过自然语言的讨论,如GPT-3。此外,该主体需要提供新的科学理解(在deRegt的严格意义上),而不仅仅是解释或诠释。因此,理解主体在技术实现方面更加灵活,但在教给人类的东西方面更加严格。我们将在下文中更详细地讨论。
首先,重要的是要认识到,找到新的科学理解是取决于背景的。什么是新的取决于我们是否考虑一个科学家个人和他们的专业领域、一个科学领域、整个科学界甚至整个历史上的科学努力。因此,真正的理解者必须能够评估洞察力是否是新的,至少在需要获得该科学领域的知识的特定科学领域的背景下。
其次,deRegt强调了基础科学理论的重要性,这些理论使我们能够认识到有质量特征的后果[12]。仅仅使用机器学习等高级统计方法对数据点进行插值或预测新的数据点是不够的。因此,即使这种方法可以近似于复杂而昂贵的计算,神经网络的天真应用也不能成为理解的媒介。科学理解需要的不仅仅是计算。
为了进一步说明这一点,让我们考虑文献中量子物理学的一个具体例子:一种计算方法解决了一个关于量子计算重要资源状态的生成的公开问题。然后,它以新的量子干涉效应的形式提取了解决方案的概念核心,这种方式使人类科学家既能理解结果,又能在不同的背景下应用获得的理解[63]。即使计算机本身能够将概念核心应用于其他情况,也不能先验地说明计算机是否真正获得了科学理解。现在还缺少的是在科学理论的背景下对所发现的技术的解释。
在这个特定的例子中,人工智能和人类科学家将需要在量子物理学理论的背景下认识到潜在的量子干扰。因此,我们可以提出理解主体的第一个充分条件。
科学理解的条件一
如果一个人工智能能够在不进行精确计算的情况下认识到一个理论的定性特征后果,并在新的背景下使用它们,那么它就获得了科学理解。
这个条件紧跟deRegt和Dieks的想法[13]。让我们再往前走一步,想象有一个人工智能能够在科学理论的背景下解释各种发现。人类科学家如何能认识到机器获得了新的科学理解?我们认为,人类科学家会以与认识其他人类科学家获得新的科学理解完全相同的方式来做这件事。也就是说,让其他人类科学家把新获得的理解传达给其他人。这就提出了理解主体的第二个充分条件。
科学理解的条件二
如果一个人工智能获得了科学理解,它可以把它的理解传递给人类专家。
我们认为,人们只能间接地识别计算机(或人类)是否获得了科学理解。因此,最后,我们提出了一个符合图灵测试[55]或费根鲍姆测试[130](或其在自然科学中的改编,如化学图灵测试或费曼测试[4])精神的测试。
科学理解测试
一个人(学生)与一个老师互动,这个老师可以是人,也可以是人工科学家。老师的目标是向学生解释一个科学理论及其定性的、特征性的后果。另一个人(裁判员)独立地测试学生和老师。如果裁判员不能区分他们在各种情况下的非琐碎解释的质量,我们就认为老师有科学理解力。
原则上,学生或裁判员没有理由不成为人工智能。然而,为了使测试尽可能的简单,我们限制了可能的变化数量。
该测试的表述意味着人类需要理解人工智能设计的新概念。如果一台机器真正理解了什么,它应该能够解释它并将理解转移给其他人。(我们撇开人工智能的解释是真的还是假的问题。有人认为,错误的理论也可以导致真正的理解。[131])我们认为,这应该总是可能的,即使理解远远超出了人类专家此时的认识。
请注意,随着人类和人工科学家的能力之间的差距越来越大,人工智能将其理解转移给人类将变得越来越有挑战性和耗时。我们设想,计算机将使用先进的人机交互技术与我们描述的下一级计算显微镜的工具一起。
此外,人和计算机之间的科学讨论可以使用自然语言处理工具中的高级查询来实现,如BERT[98]或GPT-3(参考文献[99])。这样一来,科学家就可以用科学问题来探测计算机。假设科学家通过与算法的交流获得了新的科学理解,正如我们的科学理解测试所判断的那样。在这种情况下,他们可以确认计算机真正获得了理解。
我们想指出,我们的测试,就像图灵和费根鲍姆发起的测试一样,并不是一目了然的,为不允许作出明确判断的情况留下了空间。我们乐观地认为,更多的努力将被用于开发必要的技术,这将导致未来人工科学家作为理解的真正主体的越来越有说服力的演示。
五、结语
毫无疑问,一般来说,先进的计算方法,特别是人工智能的计算方法,将进一步革新科学家研究我们世界的秘密的方式。我们概述了这些新方法如何能够直接有助于获得新的科学理解。我们猜想,未来在使用人工智能获得科学理解方面的重大进展将需要自然科学家、计算机科学家和科学哲学家之间的多学科合作。因此,我们坚信,这些研究工作可以——在我们的有生之年——将人工智能转变为真正的理解媒介,直接促进科学的主要目标之一,即科学理解。
参考文献
1.Zdeborová,L.Newtoolinthebox.Nat.Phys.13,420–421(2017).
2.Fsel,T.,Tighineanu,P.,Weiss,T.&Marquardt,F.Reinforcementlearningwithneuralnetworksforquantumfeedback.Phys.Rev.X8,031084(2018).
3.Melnikov,A.A.etal.Activelearningmachinelearnstocreatenewquantumexperiments.Proc.NatlAcad.Sci.USA115,1221–1226(2018).
4.Aspuru-Guzik,A.,Lindh,R.&Reiher,M.Themattersimulation(r)evolution.ACSCent.Sci.4,144–152(2018).
5.Hoffmann,R.&Malrieu,J.-P.Simulationvs.understanding:atension,inquantumchemistryandbeyond.PartA.Stagesetting.Angew.Chem.132,12690–12710(2020).
6.Hoffmann,R.&Malrieu,J.-P.Simulationvs.understanding:atension,inquantumchemistryandbeyond.PartB.Themarchofsimulation,forbetterorworse.Angew.Chem.Int.Ed.59,13156–13178(2020).
7.Hoffmann,R.&Malrieu,J.-P.Simulationvs.understanding:atension,inquantumchemistryandbeyond.PartC.Towardconsilience.Angew.Chem.Int.Ed.59,13694–13710(2020).
8.Marcus,G.ThenextdecadeinAI:fourstepstowardsrobustartificialintelligence.PreprintatarXiv2002.06177(2020).
10.Potochnik,A.Thediverseaimsofscience.Stud.Hist.Philos.Sci.A53,71–80(2015).
11.Potochnik,A.IdealizationandtheAimsofScience(Univ.ChicagoPress,2017).
12.deRegt,H.W.UnderstandingScientificUnderstanding(OxfordUniv.Press,2017).
13.DeRegt,H.W.&Dieks,D.Acontextualapproachtoscientificunderstanding.Synthese144,137–170(2005).
14.Boden,M.A.MindasMachine:AHistoryofCognitiveScience(OxfordUniv.Press,2008).
15.Doran,D.,Schulz,S.&Besold,T.R.WhatdoesexplainableAIreallymeanAnewconceptualizationofperspectives.PreprintatarXiv1710.00794(2017).
16.Tjoa,E.&Guan,C.Asurveyonexplainableartificialintelligence(XAI):towardmedicalXAI.IEEETrans.NeuralNetw.Learn.Syst.32,4793–4813(2020).
17.Burkart,N.&Huber,M.F.Asurveyontheexplainabilityofsupervisedmachinelearning.J.Artif.Intell.Res.70,245–317(2021).
18.Samek,W.,Montavon,G.,Vedaldi,A.,Hansen,L.K.&Müller,K.-R.ExplainableAI:Interpreting,ExplainingandVisualizingDeepLearning(Springer,2019).
19.Michie,D.inProc.3rdEuropeanConferenceonEuropeanWorkingSessiononLearning,107–122(ACM,1988).
20.Lavin,A.etal.Simulationintelligence:Towardsanewgenerationofscientificmethods.PreprintatarXiv2112.03235(2021).
21.Goldman,B.,Kearnes,S.,Kramer,T.,Riley,P.&Walters,W.P.Defininglevelsofautomatedchemicaldesign.J.Med.Chem.65,7073–7087(2022).
22.Kitano,H.NobelTuringChallenge:creatingtheengineforscientificdiscovery.NPJSyst.Biol.Appl.7,29(2021).
23.Feyerabend,P.AgainstMethod(Verso,1993).
24.DeRegt,H.W.Understanding,values,andtheaimsofscience.Philos.Sci.87,921–932(2020).
25.Hempel,C.G.AspectsofScientificExplanation(FreePress,1965).
26.Schrdinger,E.‘NatureandtheGreeks’and‘ScienceandHumanism’(CambridgeUniv.Press,1996).
27.DeRegt,H.W.Visualizationasatoolforunderstanding.Perspect.Sci.22,377–396(2014).
28.Friedman,M.Explanationandscientificunderstanding.J.Philos.71,5–19(1974).
29.Kitcher,P.Explanatoryunification.Philos.Sci.48,507–531(1981).
30.Heisenberg,W.überdenanschaulichenInhaltderquantentheoretischenKinematikundMechanik.Z.Phys.43,172–198(1927).
31.Gómez-Bombarelli,R.etal.Designofefficientmolecularorganiclight-emittingdiodesbyahigh-throughputvirtualscreeningandexperimentalapproach.Nat.Mater.15,1120–1127(2016).
32.Jumper,J.etal.HighlyaccurateproteinstructurepredictionwithAlphaFold.Nature596,583–589(2021).
33.Tunyasuvunakool,K.etal.Highlyaccurateproteinstructurepredictionforthehumanproteome.Nature596,590–596(2021).
34.Iten,R.,Metger,T.,Wilming,H.,DelRio,L.&Renner,R.Discoveringphysicalconceptswithneuralnetworks.Phys.Rev.Lett.124,010508(2020).
35.Seif,A.,Hafezi,M.&Jarzynski,C.Machinelearningthethermodynamicarrowoftime.Nat.Phys.17,105–113(2021).
36.Udrescu,S.-M.&Tegmark,M.AIFeynman:Aphysics-inspiredmethodforsymbolicregression.Sci.Adv.6,eaay2631(2020).
37.Lemos,P.,Jeffrey,N.,Cranmer,M.,Ho,S.&Battaglia,P.Rediscoveringorbitalmechanicswithmachinelearning.PreprintatarXiv2202.02306(2022).
38.Casalino,L.etal.Beyondshielding:therolesofglycansintheSARS-CoV-2spikeprotein.ACSCent.Sci.6,1722–1734(2020).
39.Fogarty,C.A.,Harbison,A.M.,Dugdale,A.R.&Fadda,E.Howandwhyplantsandhumann-glycansaredifferent:Insightfrommoleculardynamicsintothe“glycoblocks”architectureofcomplexcarbohydrates.BeilsteinJ.Org.Chem.16,2046–2056(2020).
40.Friederich,P.,Hse,F.,Proppe,J.&Aspuru-Guzik,A.Machine-learnedpotentialsfornext-generationmattersimulations.Nat.Mater.20,750–761(2021).
41.Gigan,S.,Krzakala,F.,Daudet,L.&Carron,I.Artificialintelligence:fromelectronicstooptics.Photoniques104,49–52(2020).
42.Xu,X.etal.11TOPSphotonicconvolutionalacceleratorforopticalneuralnetworks.Nature589,44–51(2021).
43.Quantum,G.A.etal.Hartree-Fockonasuperconductingqubitquantumcomputer.Science369,1084–1089(2020).
44.Zhang,J.etal.Observationofadiscretetimecrystal.Nature543,217–220(2017).
45.Schweizer,C.etal.FloquetapproachtoZ2latticegaugetheorieswithultracoldatomsinopticallattices.Nat.Phys.15,1168–1173(2019).
46.Martinez,E.A.etal.Real-timedynamicsoflatticegaugetheorieswithafew-qubitquantumcomputer.Nature534,516–519(2016).
47.Cao,Y.etal.Quantumchemistryintheageofquantumcomputing.Chem.Rev.119,10856–10915(2019).
48.Gross,C.&Bloch,I.Quantumsimulationswithultracoldatomsinopticallattices.Science357,995–1001(2017).
49.O’Connor,M.etal.Samplingmolecularconformationsanddynamicsinamultiuservirtualrealityframework.Sci.Adv.4,eaat2731(2018).
50.Probst,D.&Reymond,J.-L.ExploringDrugBankinvirtualrealitychemicalspace.J.Chem.Inf.Model.58,1731–1735(2018).
51.Schmid,J.R.,Ernst,M.J.&Thiele,G.Structuralchemistry2.0:combiningaugmentedrealityand3Donlinemodels.J.Chem.Educ.97,4515–4519(2020).
53.Hill,E.,Cherston,J.,Goldfarb,S.&Paradiso,J.A.inProc.38thInternationalConferenceonHighEnergyPhysics,1042(2016).
55.Turing,A.M.Computingmachineryandintelligence.Mind50,433–460(1950).
56.Lehman,J.etal.Thesurprisingcreativityofdigitalevolution:acollectionofanecdotesfromtheevolutionarycomputationandartificialliferesearchcommunities.Artif.Life26,274–306(2020).
57.Pickard,C.J.&Needs,R.Abinitiorandomstructuresearching.J.Phys.Condens.Matter23,053201(2011).
58.Krenn,M.,Malik,M.,Fickler,R.,Lapkiewicz,R.&Zeilinger,A.Automatedsearchfornewquantumexperiments.Phys.Rev.Lett.116,090405(2016).
59.Krenn,M.,Erhard,M.&Zeilinger,A.Computer-inspiredquantumexperiments.Nat.Rev.Phys.2,649–661(2020).
60.Pickard,C.J.&Needs,R.Highlycompressedammoniaformsanioniccrystal.Nat.Mater.7,775–779(2008).
61.Krenn,M.,Hochrainer,A.,Lahiri,M.&Zeilinger,A.Entanglementbypathidentity.Phys.Rev.Lett.118,080401(2017).
62.Krenn,M.,Gu,X.&Zeilinger,A.Quantumexperimentsandgraphs:multipartystatesascoherentsuperpositionsofperfectmatchings.Phys.Rev.Lett.119,240403(2017).
63.Krenn,M.,Kottmann,J.,Tischler,N.&Aspuru-Guzik,A.Conceptualunderstandingthroughefficientautomateddesignofquantumopticalexperiments.Phys.Rev.X11,031044(2021).
64.Malhotra,P.,Vig,L.,Shroff,G.&Agarwal,P.inProc.EuropeanSymposiumonArtificialNeuralNetworks(ESANN),89–94(2015).
65.Collaboration,A.Dijetresonancesearchwithweaksupervisionusings√=13TeVppcollisionsintheATLASdetector.Phys.Rev.Lett.125,131801(2020).
66.Collaboration,C.ProbingeffectivefieldtheoryoperatorsintheassociatedproductionoftopquarkswithaZbosoninmultileptonfinalstatesats√=13TeV.J.HighEnergyPhys.2021,83(2021).
67.Park,S.E.,Rankin,D.,Udrescu,S.-M.,Yunus,M.&Harris,P.Quasianomalousknowledge:searchingfornewphysicswithembeddedknowledge.J.HighEnergyPhys.2021,30(2021).
68.Karagiorgi,G.,Kasieczka,G.,Kravitz,S.,Nachman,B.&Shih,D.Machinelearninginthesearchfornewfundamentalphysics.Nat.Rev.Phys.4,399–412(2022).
69.Schwartz,M.D.Modernmachinelearningandparticlephysics.PreprintatarXiv2103.12226(2021).
70.Kasieczka,G.etal.TheLHCOlympics2020:acommunitychallengeforanomalydetectioninhighenergyphysics.Rep.Prog.Phys.84,124201(2021).
71.Dawid,A.,Huembeli,P.,Tomza,M.,Lewenstein,M.&Dauphin,A.Hessian-basedtoolboxforreliableandinterpretablemachinelearninginphysics.Mach.Learn.Sci.Technol.3,015002(2021).
72.Koh,P.W.&Liang,P.inProc.34thInternationalConferenceonMachineLearning,1885–1894(PMLR,2017).
73.Yu,H.,Mineyev,I.&Varshney,L.R.Agroup-theoreticapproachtocomputationalabstraction:Symmetry-drivenhierarchicalclustering.PreprintatarXiv1807.11167(2018).
74.Dehmamy,N.,Walters,R.,Liu,Y.,Wang,D.&Yu,R.Automaticsymmetrydiscoverywithliealgebraconvolutionalnetwork.Adv.NeuralInf.Process.Syst.34,2503–2515(2021).
75.Nigam,A.etal.Assigningconfidencetomolecularpropertyprediction.ExpertOpin.DrugDiscov.16,1009–1023(2021).
76.Davies,A.etal.AdvancingmathematicsbyguidinghumanintuitionwithAI.Nature600,70–74(2021).
77.Douglas,M.R.Machinelearningasatoolintheoreticalscience.Nat.Rev.Phys.4,145–146(2022).
78.King,R.D.etal.Theautomationofscience.Science324,85–89(2009).
79.Bédard,A.-C.etal.Reconfigurablesystemforautomatedoptimizationofdiversechemicalreactions.Science361,1220–1225(2018).
80.Steiner,S.etal.Organicsynthesisinamodularroboticsystemdrivenbyachemicalprogramminglanguage.Science363,eaav2211(2019).
81.Coley,C.W.AroboticplatformforflowsynthesisoforganiccompoundsinformedbyAIplanning.Science365,eaax1566(2019).
82.Burger,B.etal.Amobileroboticchemist.Nature583,237–241(2020).
83.Chatterjee,S.,Guidi,M.,Seeberger,P.H.&Gilmore,K.Automatedradialsynthesisoforganicmolecules.Nature579,379–384(2020).
84.Grizou,J.,Points,L.J.,Sharma,A.&Cronin,L.Acuriousformulationrobotenablesthediscoveryofanovelprotocellbehavior.Sci.Adv.6,eaay4237(2020).
85.Moon,H.etal.Machinelearningenablescompletelyautomatictuningofaquantumdevicefasterthanhumanexperts.Nat.Commun.11,4161(2020).
86.Dalgaard,M.,Motzoi,F.,Srensen,J.J.&Sherson,J.GlobaloptimizationofquantumdynamicswithAlphaZerodeepexploration.NPJQuantumInf.6,6(2020).
87.Larsen,P.&VonIns,M.TherateofgrowthinscientificpublicationandthedeclineincoverageprovidedbyScienceCitationIndex.Scientometrics84,575–603(2010).
88.Reisz,N.etal.Lossofsustainabilityinscientificwork.NewJ.Phys.24,053041(2022).
89.Evans,J.A.&Foster,J.G.Metaknowledge.Science331,721–725(2011).
90.Clauset,A.,Larremore,D.B.&Sinatra,R.Data-drivenpredictionsinthescienceofscience.Science355,477–480(2017).
91.Fortunato,S.etal.Scienceofscience.Science359,eaao0185(2018).
92.Wang,D.&Barabási,A.-L.TheScienceofScience(CambridgeUniv.Press,2021).
93.Tshitoyan,V.etal.Unsupervisedwordembeddingscapturelatentknowledgefrommaterialsscienceliterature.Nature571,95–98(2019).
94.Olivetti,E.A.etal.Data-drivenmaterialsresearchenabledbynaturallanguageprocessingandinformationextraction.Appl.Phys.Rev.7,041317(2020).
95.Schwalbe-Koda,D.,Jensen,Z.,Olivetti,E.&Gómez-Bombarelli,R.Graphsimilaritydriveszeolitediffusionlesstransformationsandintergrowth.Nat.Mater.18,1177–1181(2019).
96.Rzhetsky,A.,Foster,J.G.,Foster,I.T.&Evans,J.A.Choosingexperimentstoacceleratecollectivediscovery.Proc.NatlAcad.Sci.USA112,14569–14574(2015).
97.Krenn,M.&Zeilinger,A.Predictingresearchtrendswithsemanticandneuralnetworkswithanapplicationinquantumphysics.Proc.NatlAcad.Sci.USA117,1910–1916(2020).
98.Devlin,J.,Chang,M.-W.,Lee,K.&Toutanova,K.Bert:Pre-trainingofdeepbidirectionaltransformersforlanguageunderstanding.PreprintatarXiv1810.04805(2018).
99.Brown,T.B.etal.Languagemodelsarefew-shotlearners.PreprintatarXiv2005.14165(2020).
100.Hamilton,W.L.,Ying,R.&Leskovec,J.inProc.31stInternationalConferenceonNeuralInformationProcessingSystems(NIPS2017),1025–1035(2017).
101.Montavon,G.,Samek,W.&Müller,K.-R.Methodsforinterpretingandunderstandingdeepneuralnetworks.Digit.SignalProcess.73,1–15(2018).
102.Roscher,R.,Bohn,B.,Duarte,M.F.&Garcke,J.Explainablemachinelearningforscientificinsightsanddiscoveries.IEEEAccess8,42200–42216(2020).
103.Lundberg,S.M.etal.FromlocalexplanationstoglobalunderstandingwithexplainableAIfortrees.Nat.Mach.Intell.2,56–67(2020).
104.Mahendran,A.&Vedaldi,A.inProc.IEEEConferenceonComputerVisionandPatternRecognition,5188–5196(2015).
106.Shen,C.,Krenn,M.,Eppel,S.&Aspuru-Guzik,A.Deepmoleculardreaming:Inversemachinelearningforde-novomoleculardesignandinterpretabilitywithsurjectiverepresentations.Mach.Learn.Sci.Technol.2,03LT02(2021).
107.Burgess,C.P.etal.Understandingdisentanglinginβ-VAE.PreprintatarXiv1804.03599(2018).
108.Wetzel,S.J.&Scherzer,M.Machinelearningofexplicitorderparameters:FromtheIsingmodeltoSU(2)latticegaugetheory.Phys.Rev.B96,184410(2017).
109.Wetzel,S.J.,Melko,R.G.,Scott,J.,Panju,M.&Ganesh,V.Discoveringsymmetryinvariantsandconservedquantitiesbyinterpretingsiameseneuralnetworks.Phys.Rev.Res.2,033499(2020).
110.Friederich,P.,Krenn,M.,Tamblyn,I.&Aspuru-Guzik,A.Scientificintuitioninspiredbymachinelearning-generatedhypotheses.Mach.Learn.Sci.Technol.2,025027(2021).
111.Flam-Shepherd,D.etal.Learninginterpretablerepresentationsofentanglementinquantumopticsexperimentsusingdeepgenerativemodels.Nat.Mach.Intell.4,544–554(2022).
112.Wellawatte,G.P.,Seshadri,A.&White,A.D.Modelagnosticgenerationofcounterfactualexplanationsformolecules.Chem.Sci.13,3697–3705(2022).
113.McGrath,T.etal.AcquisitionofchessknowledgeinAlphaZero.PreprintatarXiv2111.09259(2021).
114.Schmidt,M.&Lipson,H.Distillingfree-formnaturallawsfromexperimentaldata.Science324,81–85(2009).
115.Gentile,A.A.etal.Learningmodelsofquantumsystemsfromexperiments.Nat.Phys.17,837–843(2021).
116.Cranmer,M.etal.Discoveringsymbolicmodelsfromdeeplearningwithinductivebiases.In34thConferenceonNeuralInformationProcessingSystems(NeurIPS2020)(NeurIPS,2020).
118.Cranmer,K.,Brehmer,J.&Louppe,G.Thefrontierofsimulation-basedinference.Proc.NatlAcad.Sci.USA117,30055–30062(2020).
119.Raayoni,G.etal.GeneratingconjecturesonfundamentalconstantswiththeRamanujanMachine.Nature590,67–73(2021).
120.Wagner,A.Z.Constructionsincombinatoricsvianeuralnetworks.PreprintatarXiv2104.14516(2021).
121.Rahwan,I.etal.Machinebehaviour.Nature568,477–486(2019).
122.Schmidhuber,J.inWorkshoponAnticipatoryBehaviorinAdaptiveLearningSystems,48–76(Springer,2008).
123.Pathak,D.,Agrawal,P.,Efros,A.A.&Darrell,T.inProc.34thInternationalConferenceonMachineLearning,2778–2787(PMLR,2017).
124.Thiede,L.A.,Krenn,M.,Nigam,A.&Aspuru-Guzik,A.Curiosityinexploringchemicalspaces:intrinsicrewardsformolecularreinforcementlearning.Mach.Learn.Sci.Technol.3,035008(2022).
125.Varshney,L.R.,Rajani,N.F.&Socher,R.Explainingcreativeartifacts.PreprintatarXiv2010.07126(2020).
126.Varshney,L.R.etal.Abigdataapproachtocomputationalcreativity:ThecuriouscaseofChefWatson.IBMJ.Res.Dev.63,7:1–7:18(2019).
127.Itti,L.&Baldi,P.Bayesiansurpriseattractshumanattention.VisionRes.49,1295–1306(2009).
128.Schmid,U.,Zeller,C.,Besold,T.,Tamaddoni-Nezhad,A.&Muggleton,S.inProc.InternationalConferenceonInductiveLogicProgramming,52–67(Springer,2016).
129.Muggleton,S.H.,Schmid,U.,Zeller,C.,Tamaddoni-Nezhad,A.&Besold,T.Ultra-strongmachinelearning:comprehensibilityofprogramslearnedwithILP.Mach.Learn.107,1119–1140(2018).
130.Feigenbaum,E.A.Somechallengesandgrandchallengesforcomputationalintelligence.J.ACM50,32–40(2003).
131.deRegt,H.W.&Gijsbers,V.inExplainingUnderstanding:NewPerspectivesfromEpistemologyandPhilosophyofScience(edsGrimm,S.R.,Baumberger,C.&Ammon,S.)50–75(2017).