但这就是 Andrej Karpathy 今天凌晨开源的新项目 autoresearch 所做的事。项目上线不到几个小时,他在 X(原 Twitter)上的发布帖浏览量突破百万,GitHub 仓库迅速收获超过 2,500 ...
如果你有一块 NVIDIA GPU,睡前启动一个脚本,第二天早上醒来就能收获一百次 LLM 训练实验的结果,其中一部分还确实比你手动调参调得更好,是不是听起来有些难以置信?但这就是 Andrej Karpathy 今天凌晨开源的新项目 ...
【新智元导读】Karpathy让Agent通宵跑了110次实验把模型练强后说了句「去桑拿了」,然后开源630行代码的autoresearch,一块GPU就能拥有一个永不下班的AI研究实验室——人类研究员的新工作,是写好提示词然后去蒸桑拿。 刚刚,Karpathy在x上发了一条让整个AI圈炸锅的帖子: ah yes, this is what post-agi feels like :) i did ...
在12小时不间断运行中,AI代理完成了110次代码提交,将模型验证损失从0.862降至0.858。这个看似微小的进步背后,是系统严格执行的优化规则:任何改进必须同时满足损失降低或训练加速的条件。某次提交虽成功降低损失,但因训练时间延长0.7秒被自动回滚,彰显出AI代理对优化目标的精准把控。