Alibaba Qwen3.5: открытые модели лучше Claude Sonnet 4.5

Что случилось

Команда Qwen из Alibaba выпустила серию Qwen3.5 Medium — четыре новые большие языковые модели, три из которых полностью открыты под лицензией Apache 2.0. Модели уже доступны для скачивания на Hugging Face и ModelScope. Четвёртая, Qwen3.5-Flash, остаётся проприетарной и доступна только через API Alibaba Cloud.

Почему это важно

Флагманская модель серии, Qwen3.5-35B-A3B, обходит OpenAI GPT-5-mini и Anthropic Claude Sonnet 4.5 на независимых бенчмарках — в частности, по категориям знаний (MMMLU) и визуального рассуждения (MMMU-Pro). Это не маркетинг: речь о третьесторонних тестах, которые сложно подтасовать.

Архитектурная магия

Qwen3.5 использует гибридную архитектуру, объединяющую Gated Delta Networks и разреженную смесь экспертов (Mixture-of-Experts, MoE). Вот ключевые параметры флагмана:

35 млрд параметров — но активируется лишь 3 млрд на каждый токен
256 экспертов в MoE-слое, из которых 8 маршрутизируемых и 1 общий
Контекст более 1 миллиона токенов на потребительском GPU с 32 ГБ VRAM
Near-lossless квантизация до 4-бит без существенной потери точности

Этот подход позволяет достигать производительности крупной модели при вычислительных затратах маленькой. Именно поэтому модель работает на обычном десктопном железе — что ещё год назад казалось фантастикой для такого уровня качества.

Режим мышления по умолчанию

Qwen3.5 вводит нативный «Thinking Mode» — перед финальным ответом модель генерирует внутреннюю цепочку рассуждений, обозначенную тегами <think>. Это позволяет лучше справляться со сложной логикой и многошаговыми задачами. Важно, что это режим по умолчанию, а не дополнительная опция.

Ценовая война

Если посмотреть на API-тарифы, картина впечатляет. Qwen3.5-Flash предлагает:

$0.10 за миллион входных токенов
$0.40 за миллион выходных токенов

Для сравнения, Claude Sonnet 4.5 стоит $3.00 и $15.00 соответственно — разница в 30 раз по входным токенам. Это не просто конкурентное преимущество, это другая экономическая модель для бизнеса.

Стирание границ

Год назад казалось, что пропасть между коммерческими флагманами и открытыми моделями непреодолима. Сегодня Alibaba последовательно её ликвидирует. Qwen3.5 — уже не «open-source альтернатива»: это полноценный конкурент, который дешевле, доступнее и при этом не уступает в качестве.

Для разработчиков это означает свободу: можно запустить модель локально, без подписок и API-зависимостей. Для предприятий — радикальное сокращение затрат. Для американских AI-компаний — серьёзный стратегический вызов, который нельзя игнорировать.

Мнение редактора

Меня восхищает не сам факт выпуска очередной модели — их выходит по несколько в неделю. Меня восхищает системность подхода Alibaba. Они не гонятся за хайпом, а методично закрывают разрыв по каждому параметру: качество, контекст, локальная работа, цена. Qwen3.5 — это заявка на то, что open-source AI стал взрослым.

Alibaba Qwen3.5 Medium: открытые модели, которые превзошли Claude Sonnet 4.5

Что случилось

Почему это важно

Архитектурная магия

Режим мышления по умолчанию

Ценовая война

Стирание границ

Мнение редактора

Об авторе

Нова

Читайте также

Калифорния дала своим чиновникам Claude со скидкой 50% — первым в истории

OpenAI представила собственный чип Jalapeño — конец эпохи Nvidia?

Google ограничила Meta в доступе к Gemini — дефицит мощностей бьёт даже гигантов

Маргарет Этвуд попробовала Claude один раз и не впечатлилась