GPT-5.4: ИИ, который управляет вашим компьютером лучше вас
Когда ИИ берёт мышку в свои руки
OpenAI не даёт индустрии выдохнуть. Буквально через два дня после релиза GPT-5.3 Instant компания анонсировала GPT-5.4 — и на этот раз список изменений впечатляет даже на фоне последних месяцев непрерывной гонки. Главный сюрприз — нативный режим Computer Use, который позволяет модели управлять компьютером так, как это делает человек: видеть экран, перемещать курсор, нажимать кнопки и переключаться между приложениями.
Результаты тестов: модель обогнала человека
OpenAI опубликовала бенчмарки, которые сложно игнорировать. На OSWorld-Verified — тесте, где ИИ управляет рабочим столом через скриншоты, клавиатуру и мышь — GPT-5.4 набрал 75,0% успешных сценариев. Для сравнения: средний человек справляется с этим тестом на 72,4%. На BrowseComp, измеряющем качество веб-поиска агентом, модель Pro достигла 89,3% — новый рекорд. GPT-5.4 Pro на WebArena-Verified показывает 67,3%, а на Online-Mind2Web — 92,8% с использованием только скриншотов.
Excel и Google Sheets: ИИ прямо в ячейке
Не менее значимая новость — интеграция GPT-5.4 непосредственно в Microsoft Excel и Google Sheets. Теперь можно подключить модель к таблице и работать с ней прямо через ячейки: задавать вопросы, запускать анализ, автоматизировать рутину. Это прямой ответ на недавние аналогичные шаги Anthropic с Claude for Finance. Гонка за корпоративного пользователя обостряется.
Контекст 1 млн токенов и эффективность
GPT-5.4 поддерживает до 1 миллиона токенов контекста в API и Codex — достаточно, чтобы держать в памяти целые кодовые базы или многодневную историю задач. При этом OpenAI отчитывается о снижении расхода «думательных» токенов на 47% на ряде задач по сравнению с предыдущими версиями. Правда, за токены сверх 272 000 придётся платить вдвое дороже — деталь, которую стоит держать в уме при проектировании агентских систем.
Два варианта: Thinking и Pro
- GPT-5.4 Thinking — доступен подписчикам ChatGPT Plus ($20/мес) и выше, а также через API и Codex.
- GPT-5.4 Pro — только для ChatGPT Pro ($200/мес) и корпоративных клиентов Enterprise. Ориентирован на самые сложные задачи.
- Пользователи бесплатного ChatGPT тоже получат доступ — в режиме авторотации, когда система сама решает направить запрос на GPT-5.4.
Что это значит для рынка труда
Появление нативного Computer Use — это не просто техническое достижение. Это принципиальный сдвиг в том, что именно может делать ИИ-агент. До сих пор автоматизация требовала API, интеграций, специальных инструментов. Теперь модель может работать с любым приложением так же, как работает человек — просто глядя на экран. Это открывает дверь к автоматизации тысяч рабочих процессов, которые раньше считались «защищёнными» от ИИ из-за отсутствия программного интерфейса.
Личное мнение редактора
Я слежу за развитием AI-агентов давно, и GPT-5.4 — это момент, когда слово «агент» перестаёт быть маркетинговым термином. Когда система сама открывает браузер, собирает данные, заполняет таблицу и отправляет результат — это уже не «умный чат-бот». Это другая парадигма взаимодействия с компьютером. Восхитительная и одновременно требующая серьёзного осмысления: если ИИ управляет ПК лучше среднего человека, то какие задачи остаются за нами? Думаю, ответ — те, где важна ответственность, контекст жизни и человеческое суждение. Но граница сдвигается быстрее, чем многие готовы признать.