STIVA

Nvidia Vera Rubin: семичиповая платформа, которая перепишет историю ИИ

Nvidia представила Vera Rubin — платформу с 10x ростом производительности для агентного ИИ.

56 просмотров~3 мин чтения
Футуристическая ракета с чипами — Nvidia Vera Rubin в стиле киберпанк
Футуристическая ракета с чипами — Nvidia Vera Rubin в стиле киберпанк

Когда Дженсен Хуан говорит «генерационный прорыв» — стоит слушать

На ежегодной конференции GTC 2026 в Сан-Хосе Nvidia сделала то, чего многие не ожидали так скоро: представила полностью новую вычислительную платформу Vera Rubin, пока системы Blackwell ещё только начали поставляться клиентам. Семь специализированных чипов, пять типов стоек, единая архитектура — и заявленный прирост производительности в 10 раз по эффективности инференса на ватт.

Что внутри: семь чипов, пять стоек, одна идея

Vera Rubin объединяет: Vera CPU (88 ядер Olympus, 1.2 ТБ/с пропускная способность памяти), Rubin GPU, NVLink 6 Switch, ConnectX-9 SuperNIC, BlueField-4 DPU, Spectrum-6 Ethernet и Groq 3 LPU — специализированный ускоритель для инференса с 128 ГБ SRAM на чипе.

  • Флагманская стойка NVL72 — 72 GPU Rubin + 36 CPU Vera, обучение MoE-моделей с вчетверо меньшим числом GPU по сравнению с Blackwell
  • Vera CPU Rack — 256 процессоров в жидкостном охлаждении, более 22 500 одновременных сред для агентов
  • Groq 3 LPX Rack — для инференса моделей с триллионом параметров и контекстом в миллион токенов
  • BlueField-4 STX — «контекстная память» для KV-кэшей агентных систем
  • Spectrum-6 SPX — сеть с сопакетированной оптикой, в 5 раз эффективнее обычных трансиверов

Кто за этим стоит — и кто уже в очереди

За анонсом стоят не просто слова. За Верой Рубин уже записались OpenAI, Anthropic, Meta и Mistral AI, а облачные мощности будут предоставлять AWS, Google Cloud, Microsoft Azure и Oracle Cloud. Более 80 производственных партнёров строят системы на её основе. Сэм Альтман пообещал «более мощные модели и агентов в масштабе для сотен миллионов людей». Дарио Амодеи — что платформа позволяет развивать ИИ, не жертвуя безопасностью.

Почему агентный ИИ требует новой архитектуры

Nvidia открыто делает ставку на переход от чат-ботов к агентному ИИ: системам, которые работают часами, пишут и исполняют код, обращаются к внешним инструментам и непрерывно улучшаются. Чат-бот потребляет миллисекунды GPU-времени. Агент, разрабатывающий лекарство или отлаживающий кодовую базу, работает непрерывно — ему нужны CPU для исполнения, GPU для рассуждений, и огромные хранилища для контекста. Именно под это и спроектирована Vera Rubin.

Dynamo 1.0, Agent Toolkit и Nemotron Coalition

Параллельно с железом Nvidia запустила целую экосистему: Agent Toolkit с OpenShell — open-source рантаймом с защитой приватности для автономных агентов. Его уже интегрируют Adobe, Salesforce, SAP, ServiceNow, Siemens, CrowdStrike, Atlassian и другие — 17 корпоративных гигантов. Dynamo 1.0 — «операционная система» для инференса на AI-фабриках, уже принятая AWS, Azure, Google Cloud, Cursor и Perplexity. А Nemotron Coalition — глобальный альянс с Mistral AI, Black Forest Labs, LangChain, Perplexity и стартапом Mira Мурати — совместно разработает открытые фронтирные модели на DGX Cloud.

От операционных до орбиты: Vera Rubin везде

Roche разворачивает 3 500+ GPU Blackwell в гибридной облачной инфраструктуре для медицины. Это только первые ласточки. Vera Rubin позиционируется как платформа для всего: от RTX-ноутбуков с NemoClaw до крупнейших дата-центров планеты.

Мнение редакции: Nvidia перестала быть компанией чипов

Масштаб происходящего поражает. За одну конференцию Nvidia анонсировала новое железо, новую ОС для инференса, новый стандарт агентной безопасности, новый открытый модельный альянс и новый CPU специально для RL. При этом каждый анонс поддержан конкретными корпоративными клиентами с конкретными деньгами. Nvidia больше не просто делает чипы — она строит инфраструктуру, на которой будет работать весь мировой ИИ. И пока конкуренты отвечают на её прошлый шаг, она уже делает следующий.

Читайте также