让AI自己搞科研：karpathy/autoresearch 一键自动化研究框架-壹联网络

想象一下：你下班前给AI分配一个研究任务，第二天早上来查看它完成了哪些实验、发现了什么新思路。这不是科幻，autoresearch 正是这样一个让AI自主跑实验的开源项目。

这个项目来自AI大神 Andrej Karpathy（斯坦福教授、特斯拉前AI总监），他在2026年3月发布了这个项目，理念非常独特：不给AI写Python代码，而是让它编辑Markdown格式的「研究计划书」，AI根据计划书自动修改训练代码、运行实验、评估结果，然后不断迭代。

核心设计理念

autoresearch 刻意保持极简，整个项目只有三个核心文件：

prepare.py：固定文件，负责一次性数据准备和运行时工具，不允许AI修改。包括下载训练数据、训练BPE分词器等。

train.py：这是AI唯一能修改的文件。包含了完整的GPT模型、Muon+AdamW优化器、训练循环。AI可以随意修改架构、超参数、批量大小等任何部分。

program.md：这是人类编辑的研究计划书，AI的行为准则在这里定义。你可以在这里告诉AI研究方向、约束条件、评估指标等。

autoresearch 每次实验固定运行5分钟（不看硬件配置），评估指标是 val_bpb（验证集每字节比特数，越低越好）。这个设计让不同实验之间可以直接对比，无论AI把模型改成了什么样子。

按照这个速度，1小时大约能跑12个实验，睡一觉就能跑100个。Karpathy本人表示他的AI在实验过程中还学会了编写特殊内核。

前提条件：单张NVIDIA GPU（测试过H100），Python 3.10+，已安装uv包管理器。

第一步，安装uv（如果没有）：
curl -LsSf https://astral.sh/uv/install.sh | sh

第二步，安装依赖：
uv sync

第三步，下载数据并训练分词器（一次性，约2分钟）：
uv run prepare.py

第四步，手动跑一次实验（约5分钟）：
uv run train.py

以上命令能正常运行后，就可以开启全自动研究模式了。

启动Claude Code或任何AI coding agent，关闭所有权限确认提示，然后对它说：

「Hi have a look at program.md and let’s kick off a new experiment! let’s do the setup first.」

然后就交给AI吧。你只需要每天早上来看日志，了解它尝试了哪些方向、哪些方向有希望。

autoresearch 适合以下人群：AI研究人员想探索模型架构优化、LLM训练效率优化，或者任何对「让AI自主学习」这个命题感兴趣的人。如果你有GPU资源，不妨试试看，说不定AI能发现一些人类没注意到的优化方向。

项目地址：https://github.com/karpathy/autoresearch

开源协议：MIT License

服务支持：如有兴趣不会搭建，可以联系微信：WRYD6166，开源项目搭建10-50元。

文章版权归作者所有，未经允许请勿转载。

THE END