想象一下:你下班前给AI分配一个研究任务,第二天早上来查看它完成了哪些实验、发现了什么新思路。这不是科幻,autoresearch 正是这样一个让AI自主跑实验的开源项目。
这个项目来自AI大神 Andrej Karpathy(斯坦福教授、特斯拉前AI总监),他在2026年3月发布了这个项目,理念非常独特:不给AI写Python代码,而是让它编辑Markdown格式的「研究计划书」,AI根据计划书自动修改训练代码、运行实验、评估结果,然后不断迭代。
核心设计理念
autoresearch 刻意保持极简,整个项目只有三个核心文件:
prepare.py:固定文件,负责一次性数据准备和运行时工具,不允许AI修改。包括下载训练数据、训练BPE分词器等。
train.py:这是AI唯一能修改的文件。包含了完整的GPT模型、Muon+AdamW优化器、训练循环。AI可以随意修改架构、超参数、批量大小等任何部分。
program.md:这是人类编辑的研究计划书,AI的行为准则在这里定义。你可以在这里告诉AI研究方向、约束条件、评估指标等。
独特机制:固定5分钟时间预算
autoresearch 每次实验固定运行5分钟(不看硬件配置),评估指标是 val_bpb(验证集每字节比特数,越低越好)。这个设计让不同实验之间可以直接对比,无论AI把模型改成了什么样子。
按照这个速度,1小时大约能跑12个实验,睡一觉就能跑100个。Karpathy本人表示他的AI在实验过程中还学会了编写特殊内核。
快速上手
前提条件:单张NVIDIA GPU(测试过H100),Python 3.10+,已安装uv包管理器。
第一步,安装uv(如果没有):
curl -LsSf https://astral.sh/uv/install.sh | sh
第二步,安装依赖:
uv sync
第三步,下载数据并训练分词器(一次性,约2分钟):
uv run prepare.py
第四步,手动跑一次实验(约5分钟):
uv run train.py
以上命令能正常运行后,就可以开启全自动研究模式了。
让AI自主跑研究
启动Claude Code或任何AI coding agent,关闭所有权限确认提示,然后对它说:
「Hi have a look at program.md and let’s kick off a new experiment! let’s do the setup first.」
然后就交给AI吧。你只需要每天早上来看日志,了解它尝试了哪些方向、哪些方向有希望。
适用场景
autoresearch 适合以下人群:AI研究人员想探索模型架构优化、LLM训练效率优化,或者任何对「让AI自主学习」这个命题感兴趣的人。如果你有GPU资源,不妨试试看,说不定AI能发现一些人类没注意到的优化方向。
项目地址:https://github.com/karpathy/autoresearch
开源协议:MIT License
服务支持:如有兴趣不会搭建,可以联系微信:WRYD6166,开源项目搭建10-50元。









暂无评论内容