STIVA

Anthropic представила «dreaming» — ИИ-агенты учатся на своих ошибках (разбор)

Anthropic показала, как AI-агенты анализируют прошлые сессии и улучшают свои результаты

0 просмотров~3 мин чтения
Нейросеть с cyan-фиолетовым свечением визуализирует процесс обучения ИИ-агента через dreaming
Нейросеть с cyan-фиолетовым свечением визуализирует процесс обучения ИИ-агента через dreaming

Anthropic представила «dreaming» — ИИ-агенты учатся на собственных ошибках

На конференции Code with Claude 8 мая 2026 года Anthropic анонсировала три новых возможности для своей платформы Claude Managed Agents, которые вместе формируют то, что компания называет непрерывным циклом самоулучшения ИИ-агентов. Это не просто incremental обновление — это архитектурный сдвиг в том, как агенты работают в продакшене.

Dreaming: ИИ «спит» и учится

Самая инновационная фича — dreaming. Это scheduled-процесс, который просматривает прошлые сессии агента, выявляет паттерны — повторяющиеся ошибки, удачные workflow, общие предпочтения команды — и записывает выводы в виде текстовых заметок и структурированных «плейбуков». Важно: dreaming не меняет веса модели. Всё происходит на уровне памяти агента, каждая запись инспектируема человеком. Это принципиальный момент для auditable enterprise-решений.

В живом демо команда Anthropic показала мультиагентную систему из трёх специалистов — командир, детектор посадочных площадок и навигатор — для миссии посадки дронов на Луну. После одной «dreaming-сессии» за ночь результаты на сложных площадках заметно улучшились. Просто нажали кнопку.

Outcomes: отдельный агент-оценщик

Функция outcomes (теперь в публичной бете) позволяет разработчикам задать рубрику успеха — стандарт качества, бренд-голос, структурные требования — и запускает агент самостоятельно итерировать к этому стандарту. Ключевое архитектурное отличие: оценщик работает в своём изолированном контекстном окне, не подвержен влиянию рассуждений рабочего агента. Если обнаружены расхождения — агент получает конкретные указания по улучшению и пробует снова. Цикл повторяется, пока все критерии не будут выполнены.

Multi-agent orchestration: несколько агентов лучше одного

Multi-agent orchestration позволяет ведущему агенту разбить сложную задачу на подзадачи и делегировать каждую специалисту со своей моделью, системным промптом, инструментами и независимым контекстом. Anthropic подчёркивает, что изолированные контексты дают лучшие результаты, чем один агент, пытающийся удержать всю сложность в одном треде. В будущем, по словам команды, модель сама будет решать, когда параллелизировать работу.

Результаты ранних adopters впечатляют

  • Harvey (юриспруденция) — увеличение completion rate примерно в 6 раз после внедрения dreaming
  • Wisedocs (медицинские документы) — сокращение времени ревью на 50% с outcomes
  • Netflix — обработка логов сотен билдов одновременно через мультиагентную оркестрацию
  • Mercado Libre — 23 000 инженеров работают с Claude Code, цель — 90% автономного кодинга к Q3 2026
  • Shopify — Claude Code развёрнут не только в инжиниринге, но и в дизайне, продакте и data science

80-кратный рост при планах на 10-кратный

Во время fireside chat CEO Anthropic Дарио Амодеи раскрыл удивительные цифры: за Q1 2026 компания получила 80-кратный годовой рост выручки и использования API при внутренних планах на 10-кратный. Объём API вырос почти в 70 раз год к году, средний разработчик Claude Code проводит в инструменте 20 часов в неделю. Именно этот超预期-рост, по словам Амодеи, стал причиной известных проблем с вычислительными мощностями. В ответ компания удвоила рейт-лимиты для всех планов партнёрства со SpaceX для использования мощностей дата-центра Colossus.

Личное мнение редактора

Dreaming — это не просто «память для агентов». Это первый осмысленный механизм, позволяющий ИИ накапливать мета-опыт across сессий и передавать его себе в будущем. Разница между Claude, который помнит ваши предпочтения, и Claude, который сам понял, что он делает регулярно неправильно, и записал себе инструкцию — это качественная разница. Именно её ждал enterprise-рынок, прежде чем доверить агентам production-нагрузки.

А пока OpenAI погружён в судебные тяжбы с Маском, Anthropic методично строит платформу, которая может стать стандартом для enterprise-агентов. Амодеи предсказал: в 2026 появится первая компания с оценкой в миллиард долларов, управляемая одним человеком. До этого осталось семь месяцев. С такими инструментами — почему бы и нет?

Читайте также