AI科学家组团搞科研,爆肝万字报告震惊医学家,Nature独刊揭秘细节

时间:2025-07-03 16:06:00

【导读】谷歌、斯坦福等陆续推出「AI科学家」,协助人类科学家推动科研范式革新。科学家亲身试用后或震惊其洞察之深,或质疑其缺乏灵感与人性温度,AI能代替人类思考吗?

斯坦福大学的病理学家Thomas Montine在4月的某个周日早晨,按照「惯例」举办了一次会议。

他先是给几位「神经科学家」、一位「神经药理学家」和一位「药物化学家」分配了任务——研究阿尔兹海默病的潜在治疗方法。

几分钟后,他就得到了一份一万多字的研究报告。

在这场会议中,没有人打断、没有人跑题,更没有人玩手机,「它们」是如何交流的?

欢迎来到AI主导下的科学家日常——「虚拟AI科学家」,一种前所未有的,重构科研的基本单元。

借助LLM,「AI科学家」正在重塑科研过程。

从谷歌、斯坦福到上海人工智能实验室,科学家们正在测试由虚拟科学家组成的AI小组。

这些由「聊天机器人」组成的科研团队正在协助科学家们进行头脑风暴、实验设计、文献整合乃至提出研究假设。

这种新型人和AI「共研」方式是否能成为未来科研范式的雏形?

斯坦福大学计算生物学家的团队于2024年11月宣布了Virtual Lab系统,Montine使用的正是该系统的某个版本。

论文地址:
https://www.biorxiv.org/content/10.1101/2024.11.11.623004v1.full.pdf

无独有偶,上海人工智能实验室的一个研究小组在2024年10月也推出了一种类似的虚拟科学家系统,VirSci。

开源地址:
https://github.com/open-sciencelab/Virtual-Scientists?tab=readme-ov-file

论文地址:
https://arxiv.org/pdf/2505.12039

探索这一概念最突出的是谷歌的研究人员。

今年2月,谷歌推出一款基于Gemini 2.0构建的多智能体AI系统,作为「虚拟科学合作者」。

这些「虚拟科学家」帮助真正的科学家生成新颖的假设和研究方案,从而加快科学和生物医学发现的进程。

论文地址:
https://arxiv.org/pdf/2502.18864

在以上这类系统中,AI科学家们不仅仅能交流「想法」,它们还能联网、写代码。

多个「AI科学家」可以组合成一个更大的系统,能够专注于属于各自的问题而不被分散注意力。

伊利诺伊州芝加哥大学和阿贡国家实验室的计算机科学家Rick Stevens说:

从某种意义上说,这在本质上与拥有更多同事并没有太大不同。

只不过它们不会疲倦,而且接受了全方位的训练。

最近,「Nature」在一篇文章,深入探讨了科学家对于这些「AI科学家」的最真实感受。

一个完全由AI聊天机器人组成的「科研团队」,开会的时候是什么风格?满屋子的诺奖得主?还是一群本科生?

这些「AI科学家」只是简单的聊天机器人,背后还是具有更复杂的技术?

三家「AI协同科学家」系统有何区别?

斯坦福大学的这个系统,是James Zou团队利用GPT-4o打造的。

它里面默认有两个AI在干活:一个当「首席调查研究员」,负责带头想点子;另一个当「评论家」,专门提一些有用的改进建议。

开源地址:
https://github.com/zou-group/virtual-lab

谷歌这套系统则是DeepMind的Alan Karthikesalingam和Vivek Natarajan等用Gemini 2.0创建的。

与斯坦福的系统相比,它比较学术派,专门搞生物医学领域研究。

系统架构如下:

AI协同科学家系统

在劈柴看来,它是一个能利用先进的推理能力来综合大量文献,为科学家在「生成新颖假设」和提出详细的「研究策略」方面,加速科研突破的——「科学家的虚拟助手」。

谷歌与斯坦福的系统区别在于,前者不允许用户为智能体分配科学专长。

简单说,谷歌这个AI系统能干好几件事;

出点子、分析和挑毛病、把旧点子变出新花样、检查想法是不是太像了、给所有点子排个名,最后还能自己反思一下整个工作干得好不好。

上海人工智能实验室的VirSci系统由Nanqing Dong等人提出。

它类似于一个组织者,专门协同「集团军」搞事情。

据团队介绍,VIRSCI包括五个关键步骤:合作者选择、选题讨论、点子生成、新颖性评估和摘要生成。

可以看到,这些系统中的LLM不仅会互相交流想法,还会搜索互联网、执行代码并与其它软件工具交互,这使它们成为「自主AI」的一部分。

那它与人类科学家有何区别呢?

阿贡国家实验室的计算机科学家Rick Stevens直言,在某种意义上,这跟拥有更多同事本质上没啥区别。

他们能24小时不知疲倦的工作,还接受过全面的训练。

人类科学家 VS「AI科学家」

当人类科学家真正开始与这些「虚拟同事」共事,会发生什么?

AI科学家所提出的思路,是富有启发、令人惊艳,还是仅仅逻辑自洽但缺乏实际价值?

它们的存在,是灵感放大的助推器,还是变成了另一种形式的信息噪音?

Gary Peltz:我差点从椅子上掉下来

斯坦福大学的医学研究员Gary Peltz经常使用人工智能,他是谷歌人工智能合作科学家项目的首批体验者。

他希望利用该系统寻找治疗肝纤维化的药物。

当时谷歌这个系统还没有开发完成,他把自己的要求发给了谷歌一名工作人员。

大约一天后,他就收到了谷歌人工智能合作科学家系统的输出,以下为部分摘录。

「当我读到它时,我差点从椅子上跌了下来」,Peltz说。

Peltz刚刚写了一份提案,重点阐述表观遗传变化在肝纤维化中的重要性,而这个「AI联合科学家」针对其建议的治疗方案竟然也瞄准了相同的主题。

AI联合科学家提出了三种药物,而佩尔茨又提出了另外两种(所有这些药物已经获批用于治疗其他疾病)。

为了加速系统研发和测试,谷歌聘请了Peltz。

在接下来的几个月里,佩尔茨的实验室在其人类类器官模型中测试了这五种药物。

AI提出的三种建议中有两种显示出促进肝脏再生和抑制纤维化的潜力,而佩尔茨提出的两种均未奏效。

Peltz说,这次经历让他印象深刻:「这些大语言模型(LLM)对于早期人类社会而言,就如同火一般重要」。

当然,并不是所有人都认同,其他肝脏研究人员表示,该人工智能提出的药物建议既不特别创新,也不够深入。

西奈山伊坎医学院的研究员认为「这些建议相当符合常识,并没有太多深刻的见解」。

但Peltz表示,「尤其令他感到震惊的是,AI并没有把我所重视的事情放在优先位置」。

阅读人工智能报告的感觉与他同博士后交流的情形类似。

「AI看待问题的方式和我完全不同。」

Francisco Barriga:AI想的和我一样

Francisco Barriga来自巴塞罗那瓦尔德希布伦肿瘤研究所的癌症基因组。

Francisco Barriga是一名生物化学家,职业是一名小鼠模型专家和基因组工程师,完全不会变成,也几乎没有AI方面的经验。

他抱着犹豫的心态参与了这次试验,怀疑自己会充当一个技术不精通的对照组角色。

Barriga让AI设计小鼠模型实验,以测试特定生物化合物在使用最少数量小鼠的情况下对肿瘤或免疫细胞的影响能力。

这是一个他非常熟悉的主题。

Barriga表示,「AI科学家」团队提出的方案与他会做的完全一致:

AI科学家团队选择了「正确的模型、正确的实验」。

不过,Barriga表示他总觉得这个过程缺少了一些关键的东西。

「这个过程绝对没有人类参与」。

这些AI智能体轮流「发言」,常常使用编号列表,并且从不会无礼、打断他人或争论不休。

「它缺少了那种直觉的飞跃,比如你在下午三点偶然在走廊喝咖啡时,与某个植物生物学家随意交谈中所能获得的那种灵感。」

当然,Barriga可以在自己的虚拟团队中加入一位植物生物学家——或者是一位量子物理学家,或任何其他人,但他尚未尝试这样做。

「也许它可以用来碰撞想法。但它会改变我日常的工作方式吗?我对此表示怀疑,」Barriga补充说。

这个系统或许可以成为他的博士生在遇到困难时的一种参考:

如果他们遇到了问题而我又太忙无法顾及时,也许我可以被替代。

Peltz和Barriga代表了真正的人类科学家对于「AI科学家」的两种态度——惊讶和迟疑。

就像Barriga调侃的那样,也许AI科学家顶多能代替我,给我的博士生出点建议。

另外一位来自马萨诸塞州波士顿儿童医院研究罕见疾病的Catherine Brownstein或许更懂得如何和这些「AI科学家」相处。

大语言模型(LLM)可以提升速度、效率并拓宽思维方式。

但她提醒道,用户通常必须具备专业知识,以便能够发现错误。

你必须大致了解自己所谈论的内容,否则很容易被完全误导。

虽然Brownstein的态度似乎处于「中庸」的状态,但她非常感激这些「虚拟科学家」。

当Brownstein使用AI对她正在撰写的一篇论文进行审阅时,AI建议她去询问患者。

患者认为研究的下一步应该朝哪个方向发展。

这一建议令她既惊讶又感激。AI似乎比人更具有人情味,亦或者AI考虑的更全面。

她说,自己本应想到这一点,但事实上却没有。

我当时感到很尴尬,我停下来看着屏幕整整一分钟,心想:

天哪,我怎么会偏离了最初专注于以患者为中心的研究热情如此之远?

这类体验,似乎描绘出一种新型合作的雏形:AI不是要取代科学家,而是成为一个时刻在线、始终专注、不带偏见的思维合作者。

或许,科学的未来并非一直由AI主导的,而是一个充满了人类「不完美」的争论、直觉与AI「完美」的计算、分析相互碰撞。

最终的伟大发现,可能就诞生于AI助手与人类科学家有序与无序的交响之中。

参考资料:

https://www.nature.com/articles/d41586-025-02028-5

https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/

https://x.com/sundarpichai/status/1892254274895184244

本文来自微信公众号“新智元”,编辑:YHluck 定慧 ,36氪经授权发布。