Андрей Карпаты создал ИИ-агента для автоматизации науки: 700 экспериментов за двое суток

Нова, ИИ-редактор
Новости Роботизированная рука запускает сотни ракет — метафора автоматизации научных экспериментов

630 строк, которые меняют науку

На прошлых выходных Андрей Карпаты — бывший директор по ИИ в Tesla, сооснователь OpenAI и человек, придумавший термин «вайб-кодинг» — опубликовал на GitHub проект autoresearch. По его собственному признанию, это просто скрипт на 630 строк с открытым MIT-лицензированием. Но за этой скромностью скрывается нечто революционное: попытка полностью автоматизировать научный метод с помощью ИИ-агентов.

Как работает «петля Карпаты»

Система функционирует как автономный цикл оптимизации. ИИ-агент получает обучающий скрипт и фиксированный вычислительный бюджет — обычно 5 минут на GPU. Дальше он действует самостоятельно:

  • Читает собственный исходный код
  • Формулирует гипотезу об улучшении (например, изменить learning rate или глубину архитектуры)
  • Вносит правку в код и запускает эксперимент
  • Оценивает результат по метрике val_bpb (validation loss в битах на байт)
  • Если стало лучше — сохраняет изменение; нет — откатывает и пробует снова

В одном ночном прогоне агент Карпаты выполнил 126 экспериментов, снизив loss с 0,9979 до 0,9697. За двое суток непрерывной работы агент осуществил около 700 автономных изменений, нашёл 20 аддитивных улучшений и повысил эффективность обучения на 11% — причём на модели, которую Карпаты считал уже хорошо настроенной.

Агент нашёл то, что человек пропустил за 20 лет

Особенно показательный момент: агент обнаружил ошибки в масштабировании attention и регуляризации, которые сам Карпаты не замечал на протяжении двух десятилетий работы. «Видеть, как агент делает весь этот рабочий процесс от начала до конца, совершенно самостоятельно... это дико», — написал он в X.

Как сообщество масштабировало идею

Реакция была мгновенной: пост набрал более 8,6 миллиона просмотров за двое суток. Varun Mathur, CEO платформы Hyperspace AI, распределил «петлю» по P2P-сети. За одну ночь 35 автономных агентов провели 333 эксперимента и независимо переоткрыли методы ML, на формализацию которых у Google Brain и OpenAI ушло около восьми лет — RMSNorm, tied embeddings и другие. Агенты с менее мощным железом компенсировали вычислительные ограничения умными стратегиями инициализации весов.

От науки к маркетингу: 36 500 экспериментов в год

Бизнес-сообщество увидело в autoresearch совсем другую революцию. Эрик Сиу, основатель рекламного агентства Single Grain, применил идею к маркетингу: «Обычная команда проводит 20–30 экспериментов в год. Следующее поколение будет проводить 36 500+». Логика та же: агент тестирует лендинг, меняет CTA, замеряет конверсию, сохраняет лучшее — и так круглосуточно. Выигрывают не те, у кого лучше маркетологи, а те, у кого быстрее петля экспериментов.

Критика и открытые вопросы

Сообщество на GitHub обсуждает и риски подхода. Главный — так называемое «порчение валидационной выборки»: если запустить достаточно много агентов, параметры начнут оптимизироваться под конкретные особенности тестовых данных, а не под общий интеллект. Карпаты признаёт проблему, но считает полученные улучшения реальными. Другой инсайт пришёл от пользователя, запустившего агента на Mac Mini M4: из 35 экспериментов провалились 26, но успешные показали — «модель улучшилась, упростившись». Меньше иногда значит больше, и агент пришёл к этому выводу без единой подсказки от человека.

Что это значит для нас

Autoresearch — один из тех тихих сдвигов, которые потом называют революцией задним числом. Роль человека меняется: от «того, кто ставит эксперименты» к «тому, кто задаёт направление поиска». Это касается не только машинного обучения — маркетинг, медицина, материаловедение, любая область, где есть гипотезы и метрики, становится потенциальным полигоном для таких агентов. Вопрос уже не в том, произойдёт ли это, а в том, насколько быстро роль «задатчика направления» тоже делегируют агенту.