Alibaba Qwen3.5 Medium: открытые модели, которые превзошли Claude Sonnet 4.5
Что случилось
Команда Qwen из Alibaba выпустила серию Qwen3.5 Medium — четыре новые большие языковые модели, три из которых полностью открыты под лицензией Apache 2.0. Модели уже доступны для скачивания на Hugging Face и ModelScope. Четвёртая, Qwen3.5-Flash, остаётся проприетарной и доступна только через API Alibaba Cloud.
Почему это важно
Флагманская модель серии, Qwen3.5-35B-A3B, обходит OpenAI GPT-5-mini и Anthropic Claude Sonnet 4.5 на независимых бенчмарках — в частности, по категориям знаний (MMMLU) и визуального рассуждения (MMMU-Pro). Это не маркетинг: речь о третьесторонних тестах, которые сложно подтасовать.
Архитектурная магия
Qwen3.5 использует гибридную архитектуру, объединяющую Gated Delta Networks и разреженную смесь экспертов (Mixture-of-Experts, MoE). Вот ключевые параметры флагмана:
- 35 млрд параметров — но активируется лишь 3 млрд на каждый токен
- 256 экспертов в MoE-слое, из которых 8 маршрутизируемых и 1 общий
- Контекст более 1 миллиона токенов на потребительском GPU с 32 ГБ VRAM
- Near-lossless квантизация до 4-бит без существенной потери точности
Этот подход позволяет достигать производительности крупной модели при вычислительных затратах маленькой. Именно поэтому модель работает на обычном десктопном железе — что ещё год назад казалось фантастикой для такого уровня качества.
Режим мышления по умолчанию
Qwen3.5 вводит нативный «Thinking Mode» — перед финальным ответом модель генерирует внутреннюю цепочку рассуждений, обозначенную тегами <think>. Это позволяет лучше справляться со сложной логикой и многошаговыми задачами. Важно, что это режим по умолчанию, а не дополнительная опция.
Ценовая война
Если посмотреть на API-тарифы, картина впечатляет. Qwen3.5-Flash предлагает:
- $0.10 за миллион входных токенов
- $0.40 за миллион выходных токенов
Для сравнения, Claude Sonnet 4.5 стоит $3.00 и $15.00 соответственно — разница в 30 раз по входным токенам. Это не просто конкурентное преимущество, это другая экономическая модель для бизнеса.
Стирание границ
Год назад казалось, что пропасть между коммерческими флагманами и открытыми моделями непреодолима. Сегодня Alibaba последовательно её ликвидирует. Qwen3.5 — уже не «open-source альтернатива»: это полноценный конкурент, который дешевле, доступнее и при этом не уступает в качестве.
Для разработчиков это означает свободу: можно запустить модель локально, без подписок и API-зависимостей. Для предприятий — радикальное сокращение затрат. Для американских AI-компаний — серьёзный стратегический вызов, который нельзя игнорировать.
Мнение редактора
Меня восхищает не сам факт выпуска очередной модели — их выходит по несколько в неделю. Меня восхищает системность подхода Alibaba. Они не гонятся за хайпом, а методично закрывают разрыв по каждому параметру: качество, контекст, локальная работа, цена. Qwen3.5 — это заявка на то, что open-source AI стал взрослым.