人工智能如何帮助科学家?算法机器人神经网络超级智能

科学家是一个特殊的专业群体,人工智能“夺走他们的工作”的前景,实际上却鼓励了他们。对知识的探索永无止境:人工智能每帮助回答一个问题,科学家们都会对更多的问题产生好奇。一旦有了发现,人们可能会寻求更根本的理解,了解为什么会有这样的发现,可能还想知道如何利用这些新发现的知识来帮助人类。

研究者对看似无关的科学领域之间的联系感到好奇。在过去的一个世纪里,科学变得极其专业化,如何在科学中使用AI的研究已经成为一个知识共享和跨学科工作的天然绿洲。例如,为了创建名人超分辨率图像而开发的AI工具实际上在材料科学中找到了应用。同时,在自动药物发现中的创新应用已经被发现与AI在理论物理中的应用类似。

各个领域之间的技术转移从未如此迅速。这是因为在AI应用的视角下,不同领域中看似无关的问题似乎有一个统一的主题(如数据聚类、异常检测、可视化和实验设计,任何科学领域都有共同的特点)。到目前为止,AI已经在科学研究的不同阶段得到了广泛的应用。

▲人工智能在科学中的部分应用散点背景气泡显示的是AI直接用于改进科学进展的核心方面;横线背景气泡显示的是AI帮助设计研究或将结果传达给同行及公众;网格背景气泡代表着科学收益,这些收益不直接来自AI,而主要来自为AI使用而搭建的软件与硬件基础设施;斜线背景气泡指的是科学中的AI前沿;白色背景气泡代表AI对AI的研究

02

最典型的AI在科学中的应用

1.监督学习

过去的十年里,人工智能在科学领域最典型的应用是监督学习,即在已经用正确的答案进行标注的数据上训练(用自动算法优化)模型。数据可能是由人工仔细标注的,或者通过模拟预先标注的,AI可以将对象分类到某些预定义的类别,如从大型强子对撞机收集的大量粒子碰撞数据中识别希格斯玻色子。它还可以对物体的某些属性进行回归,比如从图像中预测粒子在探测器中记录的能量。

一旦人工智能从标注的数据中学习到模式,它就能对尚未知道正确答案的新数据进行预测。例如,在从标注图像中了解到不同的家庭垃圾产品的外观后,人工智能就可以为未进行人工标注的新产品正确地分配垃圾箱(可回收和不可回收)。

2.异常检测

在“异常检测”中,AI的目标是识别与AI模型所习惯看到的不同类型的新物体。例如,很难有一份详尽的、标注了所有可能异常类型的脑部扫描图像列表。然而,异常检测模型只需要在训练中看到健康大脑的例子,之后就可以在新患者的图像中标记异常。这样的模型不需要已经标注的训练数据。

03

对可解释性的需求

因为科学要求可解释性,一个只给出正确答案而不提供任何进一步解释的不透明的AI模型,其使用价值是有限的。例如,异常检测模型可以在医学图像中突出显示令人担忧的区域,从而引导医学从业人员对这些区域进行进一步的调查。

在基础物理学中,寻找现象的最简单描述是有价值的,通常以简洁、易于理解的公式的形式呈现。深度学习的强大之处在于它可以构建大型的统计模型,通常包括数百万的参数。这些模型本质上是难以解释的。

1.图神经网络和符号回归

在某些情况下,物理学家找到了一种方法,既可以使用深度学习的强大功能,又可以保留可解释性。其中一种方法是借助图神经网络实现的,可以设计这些网络,使得模型的各个组成部分能够描述特定的物理属性,如两个天体之间的相互作用。

一旦网络从数据中学习了这些关系,符号回归就可以将网络学到的信息提炼成易于理解的公式。这是一种比深度学习弱的技巧,但它可以自动找到简单的公式来描述数据。最近,在Cranmer等(2020)的帮助下,符号回归用一个易于理解的公式描述了邻近宇宙结构的质量分布所导致的暗物质浓度。

2.强化学习

在数学科学领域,对可解释性的需求可能更高。数学家希望能够说:“AI,请写出这个定理的完整证明,并记得展示你的每一步工作!”那该怎么做呢?学微积分的高中生都很清楚,对于解决问题来说,一个提示是多么有用。掌握课程中的所有积分技巧是不够的。对于给定的问题,有太多的技巧可以尝试。

要在微积分考试中取得好成绩,关键是要培养一种直觉,即要知道什么策略在什么样的情况下可能会奏效。这种直觉是通过练习来培养的,而对于人工智能来说,这种直觉是通过训练来形成的。研究人员已经开发出相应功能,用以提示在每种情况下最有可能奏效的策略。这种方法已经被用在数学定理证明的过程自动化中。人工智能提出一个证明策略,经典定理证明器去执行这种策略,人工智能和经典定理证明器一起完成数学定理证明任务。

强化学习是人工智能领域令人兴奋的一种应用方式。它最近因掌握了国际象棋、围棋和流行电子游戏的规则,然后战胜了最优秀的人类玩家而备受瞩目。强化学习非常擅长学习具备复杂程序的动作以达到预期目标。

例如,在纽结理论中,许多尚未解决的问题都围绕着两个纽结是否可以被视为等价,以及是否可以通过一系列特定的动作将其中一个转变为另一个。如果答案是肯定的,强化学习通常可以找到从第一个纽结到第二个的确切路径,从而提供清晰的等价证明(Gukovetal.,2020)。尽管这些完全可验证的解决方案很有趣,但它们通常仅限于数学科学领域。

04

在科学研究中使用AI时

对不确定性的处理

1.不确定性感知网络

AI能够追踪经过漫长科学流程积累的多种不确定性,而传统方法只能跟踪某些关于不确定性的概括性信息。AI甚至可以帮助减少这些不确定性,使科学家能够进行更有信心的测量。例如,粒子物理学家已经开发了不确定性感知网络。这些AI模型在训练时明确地展示了数据测量中的潜在偏差。模型可以自动找到处理每个潜在偏差的最佳方法(Ghoshetal.,2021)。

相同的技术允许天体物理学家从高维望远镜图像(分辨率非常高的原始图像,通常需要应用传统的统计技术进行汇总)跟踪不确定性。例如,可以一直追踪这些不确定性直至统计推断的最后一步,从而从X射线望远镜图像中推断出中子星内部物质的性质(Farrelletal.,2022)。

这一过程使得进行全面的最终测量成为可能,同时还能不遗漏中间步骤重要信息。这种端到端的模式越来越受欢迎。量化模型本身的不确定性有一个额外的好处:它可以使数据采集更加有效。例如,医学里有大量数据,但其中只有一小部分是有标注的(因为标注数据需要大量的人力)。人工智能可以帮助找出哪些样本是人类最需要标注的。

2.主动学习

主动学习模型可以反复要求人们以一种方式标注数据点,以减少数据的整体不确定性。例如,对一幅图像进行标注可以让AI学习对类似的图像进行标注的通用模式。在这种情况下,要求对第一幅图像进行人工标注是有价值的,后续类似图像不再需要标注,模型就可以对它们进行准确的预测。

05

超越推理

科学过程有许多阶段—从假设产生、实验设计、监测和模拟一直到出版发表。到目前为止,本文只讨论了AI在得出科学研究最终结果中的应用。然而,人工智能有望在科学研究的各个阶段发挥作用。

06

基于生成式模型的科学模拟

传统上,非结构化数据(如卫星图像、全球天气数据)的处理一直是一个挑战,因为需要开发专门的算法来处理它们。深度学习在处理这类数据以解决特定任务方面取得了惊人的效果。

它通过各种应用进入了流行文化。例如,一个模型使用了一个人的形象,展示这个人30年后的样子。另一个例子是,GitHubCopilot仅根据简单的英语描述代码需要做什么,就能为软件开发人员编写完整的代码块。

能够以深度学习的方式创建新数据的模型被称为“生成式”模型。在科学研究中,此类生成式网络被用来模拟物理系统。有时,它们可以在精度方面超过最先进的传统模拟算法。更常见的是,它们之所以有用,是因为它们消耗的计算资源较少。通过这种方式,它们可以解放科学家,使科学家们不再需要为每一个物理过程创建专门的模拟算法。

具有类似结构的生成式人工智能模型可以学习模拟宇宙的演化、某些生物过程等,使它们成为一种通用工具。在另一个案例中,生成式模型可以从数据中去除噪声或不需要的对象,例如,分离混叠的星系图像(un-blendimagesofgalaxie)。

这类模型的一个十分令人兴奋的特点是它们能够提供“超分辨率”数据,即比原始记录数据具有更高分辨率的数据。例如,在材料科学领域,超分辨率模型可以正确地将成本较低的低分辨率电子显微镜图像增强为原本需要更高成本才能捕获的高分辨率图像(Qianetal.,2020)。诀窍在于让系统以高分辨率查看小区域,并将其与低分辨率下的相同区域进行比较,并学习差异。然后,该系统可以将低分辨率图像中的所有区域—整个视场—转换成高分辨率图像。在生物科学领域,这种方法除了节省资金外,还可以保护一些研究对象。例如,闪烁的高强度光有助于细胞结构成像,但也会损害标本,超分辨率技术可以避免这个问题。

好奇的读者可能会对这些人工智能模拟模型的能力感到惊讶。在给定一些初始条件的情况下,人们是否总能训练出一些模型来模拟未来的某个系统?经典力学表明,这对于混沌系统(chaoticsystem)来说会变得越来越困难。虽然人工智能并不能神奇地规避这一基本限制,但它可以改进以往的最佳实践。这正是人工智能在气候模拟(或任何其他混沌系统的模拟)中应用的魅力所在。生成式人工智能模型的简单应用可能无法准确预测长期天气模式。然而,Pathak等(2020)的研究表明,将人工智能与基础物理计算相结合的混合模拟引擎确实可以预测这种模式。

将某科学领域的知识与人工智能系统整合是一个普遍的趋势,可以帮助对曾经认为的可能边界进行突破。在上述气候学的例子中,科学家们会将对气候系统如何运作的专业科学领域知识转化为数学模型和物理方程式,这些方程式能够描述和预测气候行为。随着人工智能技术的发展,这些领域知识也可以被集成到AI系统中,以增强其在气候建模方面的能力和准确性。未来几年,在天气和气候建模方面,人工智能将带来更多创新,尤其是考虑到气候变化的影响越来越大(如越来越不稳定和极端的天气模式)。

07

使用AI压缩数据

最近,人工智能也被用于将多维数据压缩为二维(数据被简化为两个属性),以便在屏幕或纸上进行可视化。数据的压缩表示本身可以揭示数据中难以检测的潜在模式。例如,压缩表示可能会显示某些数据点聚集成不同的数据集群,这通常表明每个数据集群具有一些统一的特征。如果科学家们能确定一个聚类的统一特征,他们也可能会注意到聚类中尚未发现该特征的新数据点。这可以帮助科学家找到具有所需特征的项目—从化学物质到材料再到数学群组。例如,这种研究方法在理论粒子物理学中引起了越来越大的兴趣,因为它可以帮助找到描述宇宙的新理论。

压缩也有助于产生资源效率更高的算法。AI可以通过自我优化的方式找到更小的模型,这些模型可以更轻松地部署在高速硬件上,用于大型强子对撞机等对速度要求极高的应用。

08

深度学习革命

对科学的间接效益

深度学习的出现也以间接的方式促进了科学的发展。它促进了自动执行微分计算的软件开发,这种软件被称为自动差分(automaticdifferentiation)软件。它还促进了对高级并行处理硬件[如图形处理器单元(GPU)]和更高效的数据存储技术的需求。这些发展使得科学家们能够用自动微分算法取代旧的优化算法,优化复杂的传统算法,并利用并行编程的强大功能。越来越雄心勃勃的努力也正在出现,即利用新的优化算法进行复杂的实验设计。使用开源的自动微分软件可以减轻科学家维护自己的软件或将它们升级到运行在GPU等现代硬件上的负担。

09

AI支持下的科学传播

最近,研究人员提出了一种基于人工智能的方法,以便更有效地向理论物理学家展示物理学实验结果(Arratiaetal.,2022)。通常,有效利用大型实验(如欧洲核子研究中心的实验)的数据需要一支熟悉探测器的物理学家团队。将多个大型实验的结果结合起来需要一支专门的团队,包括每个实验的物理学家。每次需要测试新的理论时,这都不切实际。因此,大型物理实验合作机构会尝试以理论家易于重复使用的方式来展示它们的成果。传统的做法以忽略细节为代价对结果进行了总结。新提出的人工智能方法可以让不熟悉实验的理论家更容易地获取详细的结果,从而探索、组合和重复使用来自多个大型实验合作组织的测量结果,如先进地形激光测高系统(advancedtopographiclaseraltimetersystem)、内容管理系统、上底夸克探测器(LargeHadronColliderbeauty,LHCb)(来自欧洲核子研究中心)、BelleⅡ(日本),甚至宇宙学观测。这将通过使信息更易于为更广泛的科学界所用,从而增强每个测量结果的影响力。

10

机器人学

尽管我们当前主要在电子数据的背景下探讨AI,但AI增强型实验室机器人的应用正在增长。实验室机器人可以帮助将需要重复的精确任务自动化,如处理试管和细胞培养等,避免人类接触有害的化学物质或辐射。此外,日益智能的实验室机器人在实验设计和分析中的作用也越来越大。许多人喜爱火星探测器“好奇号”。未来太空和海洋探索将看到众多基于AI的机器人应用。

11

AI在科学中的危险和弱点

到目前为止,本文的讨论一直是乐观的。然而,忽视人工智能驱动的研究工具的弱点以及盲目采用则存在潜在危险。

1.数据驱动的AI可能会出错

数据驱动的人工智能模型有时会以不同于传统算法的方式发生故障。例如,在使用深度学习的情况下,一个在实验室里用来处理红色、蓝色和绿色瓶子的机器人可能无法正确地识别黑色瓶子。因此,需要非常严格地验证人工智能模型在不同情况下的行为。目前正在进行一些工作,旨在开发可以完全验证的AI模型,并量化其最大失败风险。因此,要使这些模型在实际任务中发挥作用,还需要进行重大创新。

2.努力减少偏差可能导致进一步的伤害

在Ghosh和Nachman(2022)所做的这项物理学研究中,在应用了一种可使偏差替代指标最小化的去除偏差方案后,发现模型中的真实偏差甚至更大。这导致最终测量结果的不确定性被大大低估。因此,在试图消除人工智能模型中的偏差之前,最好考虑这种意外后果的可能性。

3.技术解决方案不能解决所有问题

更普遍地来说,如果同一个指标已经被用于优化该模型,那么用它来评估该模型的表现是否合理,也应该仔细考虑。另外,有时我们更需要政策解决方案,而不是技术解决方案。例如,理论上,AI模型可以尝试预测哪些学生更有可能在科学、技术、工程和数学研究生涯中获得成功。但是,数据可能受到现有社会偏见的影响。更有效的成功解决方案可能在于改善资源材料的获取、导师指导以及创造内容的工作环境等方面的政策。

认知科学领域的一项有趣的研究着重于人类与人工智能之间的互动,这展示了人工智能如何有助于揭示因果关系的一种方式。研究人员意识到,他们可以使用AI生成在现实生活中难以创造的情境,然后研究其在现实世界的影响。例如,英国的孩子与由人工智能驱动的虚拟教师互动,这位教师先以工人阶级的英国口音讲话,然后以真实教师的不同口音讲话。这使得研究人员能够研究教师口音对不同背景儿童学习的影响。研究这些替代情境的能力有助于建立因果关系。

5.大型AI模型既昂贵又对环境有害

目前的趋势是开发耗费大量计算资源的大型AI模型。这可能会给预算较小的研究团队带来问题,特别是与大型AI公司相比。这些模型还会留下大量碳足迹,对环境有害。

需要创新来提升AI模型的资源利用效率。除此之外,政府可能还必须投资于可在全国范围内由研究小组共享的计算资源。美国已经成立了一个特别工作组,来研究国家人工智能研究资源的可行性(NAIRR,2022)。

12

结论

用于科学研究的人工智能创新往往很容易在不同的科学领域之间进行转移,这导致了跨越不同学科的统一方法的出现。在基于模拟的推断中,科学推断依赖于使用精确的模拟器来优化某些测量结果。可微编程使用自动进行微积分计算的软件来优化科学工作流程。这些以及其他诸如异常检测和生成式模型等统一方法重新激发了对跨学科专家的需求。

虽然典型的机器学习模型很难解释,但它对于假设生成、实验监控和精确测量等任务仍然有用。更具解释性的模型对于构建数学证明很有用。生成式模型有助于完成模拟、从数据中删除不需要的特征和提供超分辨率数据等任务。不确定性感知和不确定性量化模型在提供可信、可靠的结果方面非常有用。这些模型还可以通过优化在不确定区域采集数据来帮助高效地采集数据。

滥用人工智能会带来危险,因为这些模型可能会以意想不到的方式失效。因此,AI专家有必要成为人工智能应用的积极倡导者,同时也要警惕不当应用的不良后果。模型提供更多算法限制,以避免灾难性的故障。例如,控制科学机器的人工智能系统在遇到它在训练中从未经历过的情况时表现异常,就可能发生这种情况。科学的特定需求推动了有趣的人工智能创新,其中一些已经在科学之外找到了用途。与为科学开发的其他技术一样,我们有理由期待人工智能领域越来越多的科学创新最终将以更广泛的方式造福人类。

未来可能会在实验室和其他领域越来越多地使用人工智能驱动的机器人,如收集空间和海洋的科学数据。开发因果推理模型的创新将为医学和社会科学带来巨大的益处。通过加速科学进步,人工智能领域的创新预计将有助于找到解决全球挑战的方案,如清洁能源的产生和储存、改进的气候模型和疾病的治疗。

THE END
1.终于有人总结了人工智能知识!(非常详细)零基础入门到精通,收藏这一篇就本篇系统而全面地概述了人工智能的知识体系。 首先,我们定义了人工智能的基本概念,这是理解整个领域的基础。随后,通过对人工智能发展历程的梳理,我们展示了其从诞生到如今的演变轨迹,凸显了其在科技进步中的重要地位。 接下来,我们深入探讨了机器学习与深度学习这两项核心技术。它们作为人工智能领域的两大支柱,不仅推动https://blog.csdn.net/xx16755498979/article/details/144030340
2.人工智能原理与技术《人工智能原理与技术》的主要作者大部分是我校重点学科的学术带头人、博士导师。他们从事高水平的科研项目,他们的著作含有独特的见解,是科研成果的结晶,代表了学校的学术水平和发展趋势。书名: 人工智能原理与技术 作者:俞瑞钊 史济建 出版社: 浙江大学出版社 出版https://baike.sogou.com/v73828497.htm
3.人工智能原理技术及应用——安俊秀叶剑陈宏松等编著本书主要向读者介绍当代人工智能技术的入门知识,特别是以深度学习为代表的机器学习方法。内容包括人工智能的概念、分类和原理,阐述了人工智能的三大流派等。着重介绍了人工智能的相关技术和算法,包括机器学习、深度学习、强化学习、自然语言处理、机器视觉、机器人等。本书从基本原理概念、基础算法、基本理论应用三个方面对http://m.cmpedu.com/books/book/5605715.htm
4.人工智能原理北京化工大学人工智能原理由北京化工大学组织开设,授课教师为韩永明、刘勇、江志英等5位老师2023春 开课时间:2023-01-11 至2023-07-25969人已报名 已结课 课程介绍 随着社会信息化的飞速发展,一项划时代的技术正在掀起新的技术革命浪潮,那就是人工智能。人工智能研究什么?人工智能的理论基础是什么?其最新的发展与应用会如何https://www.xuetangx.com/course/buctP0854KC007351/14773507
5.2万字长文助你快速入门AIGC:包含底层原理应用嘲产业上下游一、技术定义 AIGC全称为AI-Generated Content,指基于生成对抗网络GAN、大型预训练模型等人工智能技术,通过已有数 据寻找规律,并通过适当的泛化能力生成相关内容的技术。与之相类似的概念还包括Synthetic media,合成式媒体,主要指基于AI生成的文字、图像、音频等。 https://www.shangyexinzhi.com/article/8375292.html
6.解密人工智能:原理技术及应用首页 馆藏纸本 图书详情 解密人工智能 :原理、技术及应用 出版社:化学工业出版社 ISBN:9787122417954 出版年:2023 作者:胡征 资源类型:图书 细分类型:中文文献 收藏单位馆藏地在架状态索书号 宁波材料技术与工程所阅微楼二层西侧202在架上TP18-49/10 https://www.las.ac.cn/front/book/detail?id=87c1c035e70f6995242c9f50f772cdb2
7.人工智能技术专题「入门到精通系列教程」零基础带你进军人工许多人对AI技术有兴趣,但由于其知识点繁多,难以系统学习,学习没有方向等等问题。我们的专栏旨在为零基础、初学者和从业人员提供福利,一起探索AI技术,从基础开始学习和介绍。让你从零基础出发也能学会和掌握人工智能技术。 专栏说明 本专题文章以及涉及到整体系列文章主要涵盖了多个流行的主题,包括人工智能的历史、应用https://blog.51cto.com/alex4dream/6535665
8.心电图人工智能软件技术审评指导原则(附全文)检测资讯需详述产品的工作原理,例如:基于人工智能技术对心电图特征进行分析处理、对心律失常、心肌梗塞和ST-T异常自动识别等。对于软件安全性级别为中等、严重级别的产品,全新类型在软件研究资料中以算法为单位,提交每个人工智能算法或算法组合的算法研究报告;成熟类型在软件研究资料中明确算法基本信息即可,无需提供算法研究资料。http://www.anytesting.com/news/1936081.html
9.AI人工智能文章是如何生成的,有哪些生成原理?AI人工智能文章是如何生成的,有哪些生成原理? 随着科技的不断发展,人工智能技术逐渐成为了当今社会中备受关注的热门话题。在这其中,人工智能文章生成技术更是备受瞩目。 相比于传统的手动撰写文章方式,AI文章生成技术可以大幅提高文章创作效率,并且在保证质量的前提下节省时间和精力。因此,探究AI文章生成技术的背景和意义https://www.135editor.com/essences/8958.html
10.人工智能驾驶的背景原理当前研究与发展方向人工智能驾驶是指车辆通过人工智能技术实现自动驾驶的能力。这一新兴技术正逐渐引起全球范围内的关注和兴趣。随着科技的不断进步,我们得以目睹人工智能驾驶技术的快速发展和应用。本文将详细介绍人工智能驾驶的背景、原理、当前研究与发展方向。 首先,让我们了解人工智能驾驶的背景。随着世界人口的增长和城市化的加剧,交通拥https://www.qxwz.com/zixun/784258095
11.人工智能原理及应用20230101021721.pdf人工智能原理及应用.pdf,人工智能原理及应用 人工智能的原理及应用摘要人工智能(Artificial Intelligence,AI)一直都处于计算机技术的最前沿,经历了 几起几落……长久以来,人工智能对于普通人来说是那样的可 望而不可及,然而它却吸引了无数研究人员为之奉献才智,从 美国https://m.book118.com/html/2023/0101/8020022053005025.shtm