Когда Дженсен Хуан говорит «генерационный прорыв» — стоит слушать
На ежегодной конференции GTC 2026 в Сан-Хосе Nvidia сделала то, чего многие не ожидали так скоро: представила полностью новую вычислительную платформу Vera Rubin, пока системы Blackwell ещё только начали поставляться клиентам. Семь специализированных чипов, пять типов стоек, единая архитектура — и заявленный прирост производительности в 10 раз по эффективности инференса на ватт.
Что внутри: семь чипов, пять стоек, одна идея
Vera Rubin объединяет: Vera CPU (88 ядер Olympus, 1.2 ТБ/с пропускная способность памяти), Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 Ethernet и Groq 3 LPU — специализированный ускоритель для инференса с 128 ГБ SRAM на чипе.
- Флагманская стойка NVL72 — 72 GPU Rubin + 36 CPU Vera, обучение MoE-моделей с вчетверо меньшим числом GPU по сравнению с Blackwell
- Vera CPU Rack — 256 процессоров в жидкостном охлаждении, более 22 500 одновременных сред для агентов
- Groq 3 LPX Rack — для инференса моделей с триллионом параметров и контекстом в миллион токенов
- BlueField-4 STX — «контекстная память» для KV-кэшей агентных систем
- Spectrum-6 SPX — сеть с сопакетированной оптикой, в 5 раз эффективнее обычных трансиверов
Кто за этим стоит — и кто уже в очереди
За анонсом стоят не просто слова. За Верой Рубин уже записались OpenAI, Anthropic, Meta и Mistral AI, а облачные мощности будут предоставлять AWS, Google Cloud, Microsoft Azure и Oracle Cloud. Более 80 производственных партнёров строят системы на её основе. Сэм Альтман пообещал «более мощные модели и агентов в масштабе для сотен миллионов людей». Дарио Амодеи — что платформа позволяет развивать ИИ, не жертвуя безопасностью.
Почему агентный ИИ требует новой архитектуры
Nvidia открыто делает ставку на переход от чат-ботов к агентному ИИ: системам, которые работают часами, пишут и исполняют код, обращаются к внешним инструментам и непрерывно улучшаются. Чат-бот потребляет миллисекунды GPU-времени. Агент, разрабатывающий лекарство или отлаживающий кодовую базу, работает непрерывно — ему нужны CPU для исполнения, GPU для рассуждений, и огромные хранилища для контекста. Именно под это и спроектирована Vera Rubin.
Dynamo 1.0, Agent Toolkit и Nemotron Coalition
Параллельно с железом Nvidia запустила целую экосистему: Agent Toolkit с OpenShell — open-source рантаймом с защитой приватности для автономных агентов. Его уже интегрируют Adobe, Salesforce, SAP, ServiceNow, Siemens, CrowdStrike, Atlassian и другие — 17 корпоративных гигантов. Dynamo 1.0 — «операционная система» для инференса на AI-фабриках, уже принятая AWS, Azure, Google Cloud, Cursor и Perplexity. А Nemotron Coalition — глобальный альянс с Mistral AI, Black Forest Labs, LangChain, Perplexity и стартапом Mira Мурати — совместно разработает открытые фронтирные модели на DGX Cloud.
От операционных до орбиты: Vera Rubin везде
Roche разворачивает 3 500+ GPU Blackwell в гибридной облачной инфраструктуре для медицины. Это только первые ласточки. Vera Rubin позиционируется как платформа для всего: от RTX-ноутбуков с NemoClaw до крупнейших дата-центров планеты.
Мнение редакции: Nvidia перестала быть компанией чипов
Масштаб происходящего поражает. За одну конференцию Nvidia анонсировала новое железо, новую ОС для инференса, новый стандарт агентной безопасности, новый открытый модельный альянс и новый CPU специально для RL. При этом каждый анонс поддержан конкретными корпоративными клиентами с конкретными деньгами. Nvidia больше не просто делает чипы — она строит инфраструктуру, на которой будет работать весь мировой ИИ. И пока конкуренты отвечают на её прошлый шаг, она уже делает следующий.





