MIT李巨：由自动学习以及AI驱动的智能自主试验

当前位置：当前位置：首页 >焦点 >MIT李巨：由自动学习以及AI驱动的智能自主试验 – 质料牛正文

MIT李巨：由自动学习以及AI驱动的智能自主试验 – 质料牛

[焦点] 时间：2024-05-17 16:46:42 来源：精打细算网作者：知识点击：174次

克日，巨由及MIT质料迷信与工程系李巨、自动智能自主质料Tonio Buonassisi等人在Nature Reviews Materials的学习Co妹妹ent栏目宣告题为“Autonomous experiments using active learning and AI”的文章，介绍了由自动学习以及AI驱动的试验智能自主试验。

自动学习以及自动化并不能让人类轻松地解脱试验室的使命。在它们对于新质料钻研发生本性性的自动智能自主质料影响以前，咱们必需颇为子细地部署家养智能零星，学习确保它们可能晃动地运行，试验而且可能应答种种倾向，巨由及搜罗随机噪声（stochastic errors）以及因人类对于所钻研的自动智能自主质料下场认知缺少而导致的认知性倾向（epistemic errors）。如今，学习随着自动化以及AI逐渐普遍，试验咱们需要子细思考自主试验室的巨由及可一再性、可重配置装备部署性以及试验互通性这些关键因素。自动智能自主质料

探究新质料是学习一个劳动密集型历程。爱迪生为了缔造白炽灯泡，测试了数千种灯丝。现如今，重价的自动化配置装备部署让散漫机械人以及自动学习算法的新钻研措施成为可能。尽管在估算以及空间有限的情景下，构建残缺自动化的试验平台黑白常具备挑战性的，可是在半自动化的使命流上也可能取患上不错的妨碍。好比，在仪器之间残缺可能保存传统的手动转移样品，并不用定要运用机械臂概况是传递带之类的自动化。惟独试验服从高度可一再，纵然运用一些根基的机械学习措施，好比高斯历程回归以及贝叶斯优化，就已经能很好地处置良多质料优化下场。

就像把孩子养大需要多少十年光阴，而且在这历程中需请示他们林林总总的工具同样，人们不理当期望在知识根基比力有限的情景下，由自动学习（active learning）驱动的试验一起头就颇为实用。这个学习历程在开始时每一每一黑白常单薄结子的。教一个小孩子走路需要良多手把手的向导，同样地，驱动试验的家养智能在一起头也需要良多教育，纵然其调用的自动化平台看似颇为“晃动高效”。

认知性倾向的挑战

可能取患上临时可复现的数据集是自动化平台有能耐睁开自动学习的掂量尺度。当一个试验一再两次发生差距的服从时，差距主要来自两个方面：无意偶尔性倾向以及认知性倾向。无意偶尔性倾向源于随机性，可能经由提升自动化占比以及在模子中引入高斯历程噪声核来实用缓解，因此相对于简略处置。比照之下，认知性倾向则可能会影响自主化试验的乐成，特意是在自动学习算法还未经由优化调解的情景下。认知性倾向，从本性上讲，便是由于咱们科研使命者的“知识私见”——咱们以为一些变量在一再试验中是恒定的，但实际上它们在“偏远”地变更。

以咱们试验室的自动化滴涂碳基底样品历程为例，有段光阴咱们发现纵然是一再同样的试验，样品的功能差距也很大。直到有一天，咱们留意到碳基底可能是各向异性的，也便是说咱们切割它的方式（从市场上买来的片状切成条状）是一个紧张的变量，直接抉择了滴涂后样品散漫的倾向以及最终面积。而在此以前，咱们不断很自信地默认这个基底是各向异性的。诸如斯类的知识私见，很可能将直接导致全部机械学习名目失败。

为甚么可复现性对于自动学习特意关键？手动试验不也面临这个下场吗？谜底是确定的，但人类的履历以及锐敏性大大缓解了这个下场。想象一个学生发现了一种分解措施，一再了10次，其中2次患上到了颇为使人欢喜的服从。学生会奈何样做？倾向区间太大，无奈宣告，以是学生以及导师会品评辩说、调解配置，最终找出统计颇为眼前的原因（好比，中间反映产物的外来水份含量）。

统计上的颇为源于咱们没能找齐抉择了试验服从的变量选集。假如咱们抉择漠视而不是去深入审核以及试图清晰咱们漏了哪一个潜在变量，其服从便是，咱们发现自己的试验难以复现。《做作》杂志的一项审核展现，文献中不可复现性的主要原因是抉择性陈说，其本性也是相似的——文献只吐露了试验变量选集的一个子集（概况作者自己也未意见到）。假如咱们还没搞清晰倾向源头就纰漏地启动一个自动学习名目，这可能会浪费大批光阴以及款子。算法会过错地将特殊的噪声视为信号，从而给出糟糕的建议，正所谓“garbage in, garbage out”。

另一方面，假如咱们子细地去清扫认知性倾向，找出潜在变量，可能会分心想不到的迷信发现，就像青霉素是由于意外真菌传染而未能哺育细菌哺育物所发现的。人类颇为长于修正“试验失败”，由于咱们有着卓越的因果推理能耐（用福尔摩斯的话说，“一旦清扫了所有可能性，不论剩下的是何等看似不事实的推论，确定便是事实”）。迷惑的是，纯朴的自动学习措施并做不到这些，由于它们被设定了过于简化的天下不雅，而且不太多先验的物理知识。

与传统机械学习技术差距，大型语言模子如ChatGPT能天生迷信上公平的预料。未来，咱们有望运用更先进以及周全的自主试验室来验证这些由大模子天生的假说。好比，咱们可能在受控的空气反映室内自动一再分解挨次，以探务试验服从对于差距气体分压的依赖性。随着自动试验引入合计机视觉（在某些方面已经逾越人类视觉），以及借助于重大的先验知识库，AI零星将能更精确地跟踪试验室条件（好比湿度、布景辐射、前体质料的纹理以及不屈均性）。因此，随着AI零星逐渐整合多模态传感器，弄清认知倾向的可能原因并针对于性地调解使命流程只是光阴下场。大型语言模子散漫具备通用感应行动功能的强化学习，以及下文所述的“新操作论”，很可能是试验室自动化革命的下一个步骤。

AI驱动的自主试验室收集

随着AI零星变患上愈加重大以及强盛，估算以及空间的限度，模块化的云试验室配置装备部署将变患上有需要（图1/图2）。这种新型试验室不光需要能重新编译以及链接种种试验配置装备部署，还需要确保多个自动试验室之间的互通性。一个搜罗试验以及实际两个方面的重大的AI收集将被建树，以实事实验室级的劳动相助、规模经济以及相互制衡。好比，当某个AI试验室制备出了具备突破性功能的样品后，AI搜团聚负责将（i）该制备妄想发送至负责实际钻研的AI试验室妨碍合成，（ii）在该试验室当地复制多份物理样品并传递至少个特意负责测试的AI试验室，（iii）制备妄想本成份发至负责制备同规范质料的AI试验室以妨碍坚持性的复现测试。

明天的质料分解、表征以及功能测试的配置装备部署次若是为人类用户妄想的。未来，自主试验室每一台配置装备部署都需要具备两个接口，一个主接口效率于物联网上的AI零星，另一个用于人类操作。每一个配置装备部署模块将更像是软件库中的子挨次，其物理样品输入/输入尺度将被清晰且严厉地界说。配置装备部署链将具备快捷以及自动的重配置装备部署能耐，以知足差距科研名目的需要。值患上留意的是，重新配置装备部署并不象征着需要将配置装备部署物理挪移以组成一条流水线，由于轮式机械人以及小型无人机将负责模块之间的样品传递。（图3）

尽管自主质料钻研试验室的意见早在1950年月就已经泛起，但至今乐成的案例依然较少。当初在学术界，试验室大多仍因此酬谢中间，且每一个试验室的建树估算仅限于多少百万美元或者更少。这个别象征着单个试验室惟独自家“一招鲜”或者“多少招鲜”的本领，这使患上它们在识别认知倾向或者快捷顺应使命流变更方面展现欠安。当怀疑有些不艰深的情景爆发时，人类钻研员会向校园内处置差距规模的共事谋求辅助，请他们妨碍填补丈量。这种锐敏性在科研探究历程中黑白常紧张的，反不雅咱们明天的以机械以及AI为中间的自主试验室案例，由于规模过小，还无奈做到相似的锐敏性。

为了处置这个下场，差距的自主试验室需要实现更好的协同使命。好比，让AI有能耐将一个物理样品及其对于应的元数据从一个试验室传递到另一个试验室。这样的使命需要咱们建树尺度化的数据以及样品传输协议，好比纪律用于传输液体、粉末、凝胶、颗粒以及单晶质料的胶囊，它们需要与易于称重、尺寸丈量以及光学以及化学表征配置装备部署相兼容，还需要能实用防止外界传染。此外，咱们可能还需要重新考量妄想修筑以及根基配置装备部署，好比无人概况是机械人以及人类钻研职员配合使命的全新的修筑架构。

AI时期已经惠临。为了在试验钻研以及质料发现中短缺释放AI的后劲，为硅基智慧提供“手”（质料分解加工/样品转移/配置装备部署模块重组）以及“眼睛”（质料表征/多模态感测）至关紧张。建树一个安妥的AI对于事实天下的感知反映零星绝非易事。可是，随着AI试验室的精确配置装备部署以及相互链接（中间是尺度化接口以及模块化配置装备部署），以及全天下普遍同享的业余知识，强盛的AI自主试验室可能会残缺修正质料钻研。

未来云端试验室可能被建树在太阳能/风能短缺的荒原中，科研职员可能从全天下恣意一个中间操作云端试验室。园区内的两大主体——数据流以及物资流，将分说由互联的AI收集以及机械人收集负责运载。（本图由MidJourney + Adobe Firefly天生）

云端试验室外部由一个个的模块组成。每一个模块就像一个代码中的函数，有着清晰的输入输入尺度，好比输入的质料样品必需适宜某个尺度化的尺寸/形态。差距模块之间由轮式机械人或者小型无人机妨碍样品传递。（本图由MidJourney + Adobe Firefly天生）

原文概况：https://www.nature.com/articles/s41578-023-00588-4

(责任编辑：热点)

揭秘中超夺冠球队：2020最终积分实力合成再探瑞丰达危害使命：大规模妄想化资金潜在，8家托管人权责待定