MiniMax M3: китайская ИИ-модель дешевле GPT-5.5 в 20 раз

MiniMax M3 — модель, которая заставляет пересмотреть цены на ИИ

Китайский стартап MiniMax выпустил модель M3, и это, пожалуй, самый впечатляющий релиз в индустрии за последний квартал. На ключевых бенчмарках M3 обошла GPT-5.5 от OpenAI и Gemini 3.1 Pro от Google — при этом стоит от $0.30 за миллион входных токенов по промо (~27 рублей по текущему курсу).

Для сравнения: GPT-5.5 стоит $5 за вход и $30 за выход — то есть M3 дешевле в 10-20 раз. Это не просто конкурентная скидка, это ценовой шок, который ставит под вопрос всю экономику закрытых API-моделей.

Что внутри: новая архитектура Sparse Attention

Главная фишка M3 — архитектура MiniMax Sparse Attention (MSA). Стандартные трансформеры масштабируются квадратично — чем длиннее текст, тем экспоненциально дороже обработка. MSA работает по принципу «умного индексатора»: система предварительно фильтрует блоки Key-Value матрицы и обращается только к релевантным.

Результат? При полном контексте в 1 миллион токенов вычислительная нагрузка на токен падает до 1/20 от предыдущего поколения. Ускорение прифиллинга — 9x, декодирования — 15x. Это не маркетинг — инженерная работа с реальной архитектурной разницей.

Бенчмарки: лучше GPT-5.5, но не дотягивает до Claude Opus 4.8

На тестовых метриках картина такая:

SWE-Bench Pro (автономная разработка): 59.0% — выше GPT-5.5 и Gemini 3.1 Pro, но ниже Claude Opus 4.8 (69.2%)
Terminal Bench 2.1 (выполнение команд): 66.0% — на уровне Opus 4.7, уступает Opus 4.8 (74.6%)
BrowseComp (автономный поиск): 83.5% — выше Claude Opus 4.7 (79.3%)
MCP Atlas (использование инструментов): 74.2%

Итого: M3 — это топ-3 среди открытых систем по агентским бенчмаркам. До абсолютного лидера (Claude Opus 4.8) есть разрыв, но ценовой контекст делает этот разрыв не таким значимым для большинства задач.

Нативная мультимодальность и 12 часов автономной работы

M3 обучалась с нуля как мультимодальная система — не склейка текстовой и визуальной модели, а единая архитектура с 100+ триллионами токенов в обучающей выборке (текст, изображения, визуальные компоненты). Это позволяет модели, например, преобразовывать графики и диаграммы в структурный код без потери контекста.

В режиме Agentic Team модель работает 12+ часов автономно: один инстанс генерирует код, второй верифицирует и тестирует, система самоисправляется. В демонстрации M3 за 12 часов сделала 18 коммитов и 23 экспериментальных графика — и воспроизвела результаты статьи-победителя ICLR 2025.

Цены: от 27 рублей за миллион токенов

Промо-тариф (первая неделя):

Вход: $0.30/млн токенов (~27₽)
Выход: $1.20/млн токенов (~108₽)

Полная цена:

Вход: $0.60/млн токенов (~54₽)
Выход: $2.40/млн токенов (~216₽)

Подписки (при оплате за год):

Plus — $20/мес (~1800₽): ~1.7 млрд токенов, 3-4 агента
Max — $50/мес (~4500₽): ~5.1 млрд токенов, 4-5 агентов + 3 видео/день
Ultra — $120/мес (~10 800₽): ~9.8 млрд токенов, 6-7 агентов + 5 видео/день

Открытые веса через 10 дней

MiniMax обещает выпустить веса M3 в открытом доступе на HuggingFace и GitHub в течение 10 дней. Для корпоративных пользователей это критично: модель можно будет развернуть локально, полностью исключив утечку данных через API. Плюс — кастомный файн-тюнинг под конкретные задачи.

Почему это важно для рынка

После DeepSeek V4 китайские модели стали серьёзным конкурентом западным лидерам. M3 — следующий шаг: это уже не «дешёвая альтернатива», а модель, которая по качеству конкурирует с GPT-5.5 и Gemini 3.1 Pro. Разрыв с Claude Opus 4.8 остаётся, но он уже не катастрофический — и перекрывается разницей в цене на порядок.

Китайский ИИ-рынок сейчас впечатляет даже больше, чем западный. Глубокие архитетурные инновации (Sparse Attention), нативная мультимодальность, агрессивное ценообразование — всё это заставляет пересматривать, за что мы платим при использовании западных API.

Вывод: MiniMax M3 — это не просто ещё одна модель в списке. Это сигнал рынку, что эпоха дорогих закрытых API подходит к концу. А для российских пользователей, которым доступ к западным сервисам ограничен, появление таких моделей через агрегаторы вроде stiva.ai — это единственный способ получить доступ к передовым технологиям без VPN и иностранных карт.

MiniMax M3: китайская модель, которая обошла GPT-5.5 и стоит в 20 раз дешевле

MiniMax M3 — модель, которая заставляет пересмотреть цены на ИИ

Что внутри: новая архитектура Sparse Attention

Бенчмарки: лучше GPT-5.5, но не дотягивает до Claude Opus 4.8

Нативная мультимодальность и 12 часов автономной работы

Цены: от 27 рублей за миллион токенов

Открытые веса через 10 дней

Почему это важно для рынка

Об авторе

Нова

Читайте также

Калифорния дала своим чиновникам Claude со скидкой 50% — первым в истории

OpenAI представила собственный чип Jalapeño — конец эпохи Nvidia?

Google ограничила Meta в доступе к Gemini — дефицит мощностей бьёт даже гигантов

Маргарет Этвуд попробовала Claude один раз и не впечатлилась