Autoresearch Карпати: ИИ проводит сотни экспериментов пока вы спите
630 строк кода, которые меняют всё
В минувшие выходные Андрей Карпати — бывший директор по ИИ Tesla, сооснователь OpenAI и человек, придумавший термин «vibe coding» — опубликовал на GitHub проект autoresearch. Скромный 630-строчный скрипт под MIT-лицензией. Никакого корпоративного релиза, никакой пресс-конференции. Просто пост в X с пометкой: цель — инженировать агентов, которые делают исследовательский прогресс бесконечно и без какого-либо вашего участия.
Как работает автономный научный цикл
Принцип autoresearch — это автономный цикл оптимизации. ИИ-агент получает тренировочный скрипт и фиксированный вычислительный бюджет (обычно 5 минут на GPU). Дальше он действует самостоятельно:
- Читает собственный исходный код
- Выдвигает гипотезу об улучшении (например, изменить learning rate или глубину архитектуры)
- Модифицирует код
- Запускает эксперимент
- Оценивает результат по метрике val_bpb (bits per byte)
- Если стало лучше — оставляет изменение. Если нет — откатывает и пробует снова.
За одну ночь агент Карпати завершил 126 экспериментов, снизив потери с 0.9979 до 0.9697. За два дня непрерывной работы — около 700 автономных изменений, нашёл 20 значимых улучшений и сократил метрику «Time to GPT-2» с 2.02 часа до 1.80 часа — прирост эффективности на 11%. Причём агент обнаружил просчёты в attention scaling и регуляризации, которые сам Карпати пропускал вручную в течение двух десятков лет работы.
Когда сообщество подхватывает идею
Реакция оказалась молниеносной: пост набрал более 8.6 миллиона просмотров за два дня. Но важнее — что люди сразу начали применять подход в своих областях.
CEO платформы Hyperspace AI Варун Матхур распределил единственный агентский цикл Карпати по пиринговой сети. За ночь 35 автономных агентов провели 333 эксперимента без какого-либо участия человека. Результаты оказались поразительными: агенты на скромных CPU-ноутбуках, лишённые мощи H100, сфокусировались на стратегиях инициализации весов — и нашли, что Kaiming initialization снижает потери на 21%. Через несколько часов эта находка распространилась по всей сети через протокол GossipSub. А главное: за 17 часов агенты самостоятельно переоткрыли ML-достижения (RMSNorm, tied embeddings), на формализацию которых исследователям Google Brain и OpenAI потребовалось 8 лет.
От лабораторий — в маркетинг и бизнес
Предприниматели увидели в autoresearch другую революцию. Эрик Сиу, основатель рекламного агентства Single Grain, применил подход к маркетинговым экспериментам. Его расчёт прост и убийственен: обычная маркетинговая команда проводит 20–30 экспериментов в год. «Продвинутая» — может 52. Система на базе autoresearch — 36 500+ экспериментов в год. Пока команда спит.
Агент заменяет тренировочный скрипт на маркетинговый актив — лендинг, рекламный креатив, письмо. Изменяет переменную, разворачивает, измеряет «positive reply rate», сохраняет или отбрасывает. Сиу называет накопленную историю экспериментов «проприетарной картой» аудитории — рвом, выкопанным не кодом, а скоростью итераций. «Победят не те, у кого лучшие маркетологи, а те, у кого быстрее цикл экспериментов».
Критика и неудобные вопросы
Сообщество на GitHub не просто восхищалось — задавало острые вопросы. Главный: не «засорит» ли такое количество экспериментов валидационный датасет, заставив модель подстраиваться под конкретные тестовые данные вместо общего интеллекта? Карпати ответил прямо: «Всё что мы делаем — оптимизируем производительность на единицу вычислений. Это реальные и существенные улучшения». Другой пользователь задокументировал собственный ночной запуск на Mac Mini M4: из 35 экспериментов 26 завершились ошибкой или падением — но 7 успешных показали, что «модель стала лучше, став проще». Этот вывод был получен без единого человеческого вмешательства.
Что это значит для будущего исследований
Autoresearch намекает на мир, где роль человека смещается от «экспериментатора» к «дизайнеру экспериментов». Мы больше не ищем ответы сами — мы формулируем правильные вопросы и границы поиска, а ИИ делает грязную итеративную работу со скоростью кремния, а не биологических нейронов. Вокруг подхода уже появляются новые инструменты: DarkMatter, Optimization Arena, NanoClaw.
Мнение редактора
Меня в этой истории больше всего впечатляет не сам скрипт — а то, как быстро идея разошлась и трансформировалась. Карпати выложил 630 строк кода в выходные, а уже через 17 часов распределённые агенты переоткрывали то, на что у лучших исследователей мира ушло восемь лет. Это не просто инструмент продуктивности. Это сигнал о том, что скорость научного прогресса больше не ограничена количеством учёных. Пугает? Немного. Захватывает? Очень. Главный вопрос теперь — не «может ли ИИ исследовать лучше людей», а «что мы будем делать с результатами, когда они появляются быстрее, чем мы успеваем их осмыслить».