【“AI 科学家”问世了!】
近日,西湖大学研究团队推出一款“AI科学家”智能体系统——DeepScientist,首次大规模实证AI能够在前沿科学任务上逐步超越人类的SOTA(行业最佳)。
DeepScientist仅用两周就取得了相当于人类研究者三年研究成果的进展。研发团队通过三个前沿AI任务——智能体故障归因、大语言模型推理加速和AI文本检测,对此进行了验证。结果非常亮眼:DeepScientist仅用16块H800 GPU,花了一个月,最后在三个任务上都超过了人类的最先进方法——分别提升了183.7%、1.9%和7.9%。截至2025年9月,这一成绩也超越了DeepSeek-R1、Claude-4-Sonnet、Qwen3-Coder等前沿模型。
在这个过程中,DeepScientist就像人类科学家一样,明确目标、提假设、做验证、分析结果,还会一边记忆一边探索新方向。它总共想出约5000个科研点子,验证了1100个,最终有21个带来了科学创新。团队强调,这些点子都是通过自主重新设计核心方法,而非简单组合现有技术。在使用DeepReviewer与其他AI科学家系统的28篇公开论文进行基准测试时,DeepScientist是唯一能产出接受率达60%的论文的AI科学家系统。
来源:智东西
http://t.cn/AXzTcTle
发布于 江苏
