被选中的 AI 论文节选(来源:https://www.nature.com/articles/s41586-026-10265-5)
这不再是AI帮忙处理数据、润色文字的小步优化,而是AI彻底跳出工具定位,成为真正意义上独立科研主体的里程碑突破。当AI可以自主完成全套科研工作、闯过人类学界最严苛的审稿关卡,不仅意味着AI科研范式完成了颠覆性升级,更直接触及了人类长久以来引以为傲的创造力边界,一场席卷全球学术界的科研革命,就此拉开序幕。
在AI科学家问世之前,人工智能早已融入科研领域,但始终扮演着“得力助手”的角色。无论是帮科研人员处理海量数据、绘制实验图表,还是辅助编写基础代码、简化重复运算,AI都只能针对科研流程中的单个环节发力,无法形成完整的科研闭环,更谈不上独立开展一项完整的研究工作。
这一行业痛点,也正是本次顶刊研究的核心切入点——刊发于《Nature》2026年第651卷、页码914-919的文章《Towards end-to-end automation of AI research》,明确将“实现科研全流程自动化”定为研究核心目标,这也是AI科研领域深耕多年却始终未能突破的长久愿景。

来源:Nature
这篇论文也搭建了完整的研究方法体系,以自回归大语言模型为底层核心技术,融合智能体少样本提示、自我反思迭代机制,同步构建AI科研执行系统与自动化审稿评估两大核心模块,用双系统联动的方式,完成从科研到评审的全链路验证,彻底填补了“单一环节自动化、全流程不通畅”的行业空白。论文开篇也明确指出,过往AI科研仅能落地单一细分任务,始终无法打通从构思到发表的全链路,而本次研究就是要攻克这一核心难题,用完整的实验与数据,验证端到端自动化科研的可行性。
论文由英国牛津大学Chris Lu、英属哥伦比亚大学Cong Lu担任共同第一作者,集结Sakana AI、牛津大学、英属哥伦比亚大学三方科研力量,聚焦机器学习领域展开专项研发(该领域实验可全程在计算机内完成,是验证全流程科研自动化的最佳场景),最终打造出AI科学家系统,进一步颠覆了AI在科研领域的定位。
论文中设计了严谨的对照实验,围绕AI科学家系统设置两大实验场景,同时选用多组公开数据集完成验证:模板模式依托nanoGPT、莎士比亚文本数据集、enwiki8、text8数据集展开,无模板模式则选用作物病虫害检测、Waterbirds、CelebA等多元数据集,全面测试系统的自主科研能力。凭借一套完整的自动化流程,系统独立走完了科研全生命周期,真正实现了无人工干预的自主科研,这也是论文中重点论证的核心技术突破。
整个系统的运作逻辑,完全复刻了人类科研的完整思路,且全程自主推进、自我修正,分为四大核心环节,环环相扣不留缺口。论文中也详细记录,在科研构思阶段,AI被导入指定研究领域后,会自主生成一批研究方向,为每个方向拟定标题、梳理研究理由、设计实验方案,还会从有趣程度、新颖度、可行性三个维度,自主完成1-10分的打分筛选;随后它会对接Semantic Scholar学术搜索引擎,逐一比对现有文献,剔除与已有研究高度重合的点子,只保留具备创新性的研究方向,这一流程也在论文中通过多轮实验数据得到了完整验证。
进入实验执行环节,AI科学家具备两种灵活运作模式,这也是论文核心实验方法的落地体现,进一步夯实自主科研能力。模板模式下,AI会以人类提供的可运行代码为基础,围绕选定方向优化方案,借助Aider代码助手修改代码、运行实验,遇到报错时自主查看日志、修复漏洞,无需人工插手就能推进实验,该模式主要验证AI在既定框架下的优化科研能力;无模板模式更是突破了现有边界,也是论文重点探索的方向,AI从零开始编写代码,通过四阶段树形搜索展开多分支并行探索,从初步可行性验证、超参数调优,到核心研究议程执行、消融实验分析,同一研究方向衍生出不同参数、不同设置的实验分支,并行运算后择优深挖,一步步完善实验逻辑,全程无任何初始代码依托,彻底实现从零到一的自主探索。
来源:https://www.nature.com/articles/s41586-026-10265-5
实验过程中,系统会自动记录运行日志、报错信息、实验指标,生成标准化实验数据,实验结束后,AI会自动整理实验数据、生成可视化图表,形成完整的实验笔记,为后续论文撰写做好充足准备,这一系列流程均在论文中有详细的步骤拆解与数据记录。
完成实验后,AI科学家会进入论文撰写与自主审稿环节,这也是论文全流程自动化的最终闭环。它会将实验笔记、数据图表精准填入学术规范的LaTeX模板,逐节完成引言、研究方法、实验结果、结论等核心内容的撰写,还会再次检索文献、完成引用标注,全程自主修正LaTeX排版错误,最多可完成五次排版纠错,最终生成合格的学术论文。
为了把控论文质量,团队还依据NeurIPS顶会审稿指南,搭建了配套的自动化审稿系统,AI会参照专业审稿标准,完成自我评审、打分、给出优缺点分析,最终综合五份独立审稿结果给出录用或拒稿建议,形成完整的科研闭环,真正做到了从构想来到发表去,全程不依赖人类科研人员。
结合全流程实验与验证,该篇Nature论文也得出核心结论:端到端全流程自动化科研具备落地可行性,AI科学家系统能够产出符合学术规范的科研成果,且系统能力会随底层模型升级、算力资源增加持续提升,这一研究也标志着科研范式迎来了潜在的颠覆性转变,为后续AI科研技术迭代指明了方向。
判断一项AI科研系统是否具备真正价值,从来不是看它能否完成流程化动作,而是看其产出成果能否得到人类学术界的认可。为了验证AI科学家的真实实力,研究团队在获得伦理批准、会议方同意的前提下,将系统自主生成的三篇论文,匿名提交至国际顶会ICLR 2025旗下ICBINB研讨会,接受业内专业同行的盲审评审,这也是对AI科研成果最严苛的“实战测试”。
最终的评审结果,彻底震惊了整个学术界。三篇论文中,有一篇完全由AI在无模板模式下生成、全程无任何人工修改的论文,拿到了6分、7分、6分的评审打分,平均分达到6.33分,远超该研讨会的平均录取分数线。
据主办方反馈,若不是研究团队按照预设方案主动撤稿,这篇论文大概率会被正式录用,成为首篇被顶会收录的完全AI自主生成的学术论文。另外两篇论文虽未达标,但也足以证明,AI科学家已经具备产出合格学术成果的能力,甚至能骗过专业人类审稿人,让审稿专家误以为自己评审的是人类科研学者的研究成果,相当于通过了科研领域的“图灵测试”。
图自unsplash
更值得关注的是,配套的自动化审稿系统,也展现出了比肩人类专业审稿人的实力。研究团队依托顶会过往论文数据展开测试,让自动化审稿系统对论文进行打分评审,结果显示其平衡准确率达到69%,与人类审稿人66%的准确率基本持平;在F1评分维度,自动化审稿系统的表现甚至超越了人类审稿人之间的一致性评分。
为了排除数据污染的干扰,团队专门选用模型训练数据之外的2025年全新论文测试,系统准确率虽降至66%,但依旧与人类审稿人持平,这充分说明,AI审稿并非机械背诵答案,而是真正具备了判断论文质量、分析学术价值的能力。
研究团队还通过大量测试发现,AI科学家的成果质量,具备极强的成长性。论文质量与底层基础模型实力呈正相关,底层模型越先进,生成的论文评分越高;同时,分配的算力资源越充足,实验探索越充分,论文质量也会随之提升。这意味着随着大模型技术的持续迭代、算力成本的不断下降,AI科学家的科研能力会持续升级,未来有望产出更优质、更具创新性的科研成果,而非停留在当下的水平。
AI科学家的问世,无疑为全球科研发展打开了全新大门,带来了前所未有的发展机遇。相较于人类科研人员,AI可以实现7×24小时不间断科研,无需休息、无需调整状态,能持续推进实验探索、试错优化,大幅压缩科研周期;在药物研发、材料设计、气候建模等复杂科研领域,AI能快速处理海量数据、并行探索无数研究方向,攻克人类难以应对的复杂难题,降低科研试错成本,加速科研成果落地。同时,AI科研能打破科研门槛,让更多小众领域、冷门方向得到探索机会,弥补人类科研力量的不足,推动全球科研行业全面提速。

图自unsplash
但我们也要清醒地看到,当下的AI科学家依旧存在诸多局限,远未达到完美的状态。系统偶尔会生成幼稚、缺乏深度的科研构想,实验设计的严谨性、方法论的成熟度依旧不及人类资深学者;代码编写过程中仍会频繁出现漏洞,还存在AI常见的幻觉问题,比如标注错误引用、重复使用图表、强行合理化错误结论等。而且此次三篇论文仅一篇过审,也说明AI科研成果的稳定性不足,无法持续产出高质量学术内容,想要达到顶会主会录取标准,还有很长的路要走。
抛开技术本身的局限,AI科研带来的行业伦理与规则风险,更值得整个学术界警惕。一旦AI自主科研全面放开,批量生成论文的效率远超人类,极易引发学术泡沫,大量低质量AI论文会压垮现有的同行评审体系;更有甚者,会有人利用AI批量造假、学术灌水,破坏学术诚信,侵蚀科研行业的纯净性。
面对这些风险,此次研究团队也展现出了极强的责任担当,不仅主动撤稿所有AI论文,还为所有AI生成论文添加专属水印,同时呼吁学术界尽快出台统一规范,明确AI科研成果的标注、评审、录用规则,守住学术底线。
我们总以为,创造力、原创思考、科研探索是人类永远不会被AI触碰的底线,可当AI科学家真正走完科研全流程、闯过人类审稿关卡,我们不得不承认:科研的时代,真的变了。这不是AI要取代人类科学家,而是人类科研范式迎来了颠覆性的重构,未来的科研领域,不再是人类单打独斗,而是人机协同、共生共进的全新格局。
AI负责高效的流程化科研、重复性试错、海量数据处理,人类则回归核心,把控科研方向、坚守学术伦理、实现真正的原创性思想突破。技术的狂奔永远不会停下,比技术迭代更重要的,是我们尽快建立起适配AI科研的规则体系,让技术向善、为科研赋能。
毕竟,科研的终极目标从来不是追求机器替代人类,而是借助技术的力量,更快、更好地探索未知、破解难题,让科研成果真正造福人类。当AI成为科研路上的最强搭档,人类才能站在更高的地方,触碰更远的科学边界。
https://www.nature.com/articles/s41586-026-10265-5
https://www.linkedin.com/in/chris-lu-37471b119/
https://chrislu.page/
https://www.linkedin.com/in/cong-lu-530b74104/
https://www.conglu.co.uk/
https://sakana.ai/ai-scientist-nature/
【本文中包含的图片均来源于网络,仅用于信息传播和新闻报道目的。我们尊重并保护所有版权拥有者的权利。若有任何版权问题,或版权拥有者不希望图片被使用,请与我们联系,我们将在收到通知后立即处理并删除相关图片。】