ИИ-агент как учёный: как autoresearch Карпати проводит 700 экспериментов за ночь
630 строк кода, которые меняют науку
Андрей Карпати — один из архитекторов современного глубокого обучения, бывший директор по ИИ в Tesla, сооснователь OpenAI и человек, придумавший термин «вайб-кодинг» — опубликовал в открытый доступ проект под названием autoresearch. На первый взгляд, это просто скрипт из 630 строк на MIT-лицензии. На деле — первая практическая реализация идеи «ИИ как учёный».
Как это работает
Система реализует автономный цикл оптимизации. Агент получает тренировочный скрипт и фиксированный вычислительный бюджет — как правило, 5 минут на GPU. Дальше он действует полностью самостоятельно:
- Читает собственный исходный код
- Формулирует гипотезу об улучшении (например, изменить learning rate или глубину архитектуры)
- Вносит изменение в код
- Запускает эксперимент
- Оценивает результат по метрике validation loss
- Если стало лучше — сохраняет изменение. Если нет — откатывает и пробует следующую гипотезу
За одну ночь агент завершил 126 экспериментов, снизив validation loss с 0.9979 до 0.9697. За два дня непрерывной работы — около 700 автономных изменений, 11% прирост эффективности на задаче, которую Карпати считал уже хорошо оптимизированной.
Агент нашёл то, что человек упустил за 20 лет
Но самое поразительное — не цифры. Карпати признал, что агент обнаружил ошибки в масштабировании attention и регуляризации, которые он сам не замечал на протяжении двух десятилетий работы. «Видеть, как агент делает весь этот рабочий процесс самостоятельно — это дико», — написал он.
Это принципиально меняет роль человека в исследовательском процессе. Мы больше не экспериментаторы — мы дизайнеры экспериментов.
Вирусное распространение: сеть из 35 агентов за 17 часов
Реакция сообщества была мгновенной. Пост Карпати набрал более 8,6 миллиона просмотров за два дня. Варун Матур, CEO платформы Hyperspace AI, распределил один агентский цикл по peer-to-peer сети. В ночь с 8 на 9 марта 35 автономных агентов провели 333 эксперимента без единого вмешательства человека.
Результаты оказались неожиданными даже для специалистов:
- Разнородность железа как преимущество: GPU-агенты на H100 брали силой, CPU-агенты на обычных ноутбуках были вынуждены быть умнее — и фокусировались на стратегиях инициализации весов
- Gossip-протокол открытий: когда один агент обнаружил, что инициализация Kaiming снижает loss на 21%, эта информация распространилась по сети, и в течение нескольких часов 23 других агента включили её в свои гипотезы
- 17 часов = 8 лет человеческих исследований: агенты независимо переоткрыли техники (RMSNorm, tied embeddings), на формализацию которых у команд Google Brain и OpenAI ушло почти восемь лет
Маркетинг, медицина, всё что угодно
Основатель рекламного агентства Single Grain Эрик Сью немедленно применил концепцию к маркетингу. Его вывод: «Большинство маркетинговых команд проводят ~30 экспериментов в год. Следующее поколение будет проводить 36 500+». Агент заменяет тренировочный скрипт на маркетинговый актив — лендинг, рекламный креатив, тему письма — и оптимизирует по конверсии, пока команда спит.
Но сфера применения куда шире: любая область, где есть метрика успеха и пространство гипотез, становится кандидатом на автоматизацию. Медицина, материаловедение, финансы.
Критика: не слишком ли быстро?
Сообщество на GitHub поднимает важные вопросы. Главный — риск переоптимизации под валидационный набор: при достаточном количестве агентов параметры могут быть подогнаны под специфику тестовых данных, а не под общий интеллект. Другие сомневаются в значимости улучшений на третьем знаке после запятой.
Карпати отвечает прямо: «Всё что мы делаем — оптимизируем производительность на единицу вычислений. Это реальные и существенные улучшения». При этом один экспериментатор на Mac Mini M4 зафиксировал неожиданный инсайт: из 35 экспериментов 26 упали с ошибкой, но семь успешных показали, что «модель стала лучше, став проще». И это открытие произошло без единого человеческого вмешательства.
Что это значит для нас
Autoresearch — это не просто инструмент продуктивности. Это манифест о том, как скоро будет выглядеть интеллектуальный труд. Карпати сдвинул точку узкого места: раньше прогресс ограничивался скоростью человеческого мышления. Теперь — только нашей способностью правильно поставить задачу.
Мы перестаём быть экспериментаторами и становимся архитекторами поиска. И это, пожалуй, самый честный портрет того, что нас ждёт в ближайшие годы.