STIVA

Google Omni: генерация видео, где невозможно отличить реальность от ИИ

Тестируем Gemini Omni — новую модель Google, превращающую фото и видео в дипфейки

0 просмотров~2 мин чтения
Лицо человека частично превращается в цифровую сетку поверх видеоволны, неоновая подсветка в стиле TRON
Лицо человека частично превращается в цифровую сетку поверх видеоволны, неоновая подсветка в стиле TRON

Google Omni: когда ИИ-видео уже не отличить от реальности

В марте 2026 года Google представила семейство моделей Gemini Omni — «что угодно во что угодно». Пока модель умеет только генерировать видео, и это Omni Flash, который теперь доступен в платформе Google Flow. Журналистка The Verge Эллисон Джонсон взяла модель на тест-драйв, и результаты вышли одновременно впечатляющие и тревожные.

Как работает Omni

В отличие от предыдущей модели Veo, Omni позволяет использовать видео как исходный материал: загружаете ролик, добавляете текстовый промпт, и система генерирует новую версию с сохранением персонажей и сцены. Google заявляет, что модель лучше оперирует реальными знаниями и сохраняет консистентность персонажей на протяжении всего видео.

Для теста автор использовала «AI Buddy» — плюшевого оленя из прошлогоднего эксперимента с Gemini. По результату — прогресс заметен: видео стали стабильнее, персонажи лучше сохранялись между кадрами. Но «сюрпризов» по-прежнему достаточно:

  • Buddy внезапно меняет ориентацию во время сцены скайдайвинга
  • Банка мёда в видео превращается из стеклянной банки в пластиковую бутылку и обратно
  • У оленя, который не имеет рогов, внезапно появляются рога — и при попытке удалить их Omni добавляет рога во все остальные сцены
  • Финальный кадр одного из видео выглядит как случайная склейка элементов последовательности

Дипфейки, которые убеждают близких

Самая впечатляющая часть теста — генерация дипфейков. Автор загрузила селфи-видео с нейтральным выражением лица и попросила Omni сгенерировать сцены, где она ест спагетти, сидит в кресле самолёта и стоит у Эйфелевой башни с багетом в зубах.

Результат: муж автора, который видит её каждый день, поверил, что она действительно сидит перед камерой и ест пасту. Единственная зацепка — непривычная миска. Это не научная фантастика — это то, что доступно любому пользователю Google сегодня.

Да, артефакты есть: звон вилки звучит слишком «синтетически», женщина на заднем плане в самолёте появляется дважды. Но общая убедительность — на уровне, достаточном чтобы обмануть социальные сети.

Цена вопроса

Генерация одного видео стоит от 15 до 40 кредитов в зависимости от длины и сложности. Одна правка — ещё 40 кредитов. Месячный план Google AI Pro — $20 в месяц (~1800 ₽ по курсу ~90 ₽/$) с 1000 кредитами. За ~20 роликов с правками автор израсходовала около 850 кредитов.

Это не бесплатно, но и не запредельно. Любой, у кого есть Google-аккаунт и кредитка, может подставить ваше лицо куда угодно — буквально за копейки.

Что это значит

Эллисон Джонсон пишет: «Я была потрясена, когда тестировала Veo 3. Потом снова была потрясена тем, как легко создавать фейковые фотографии людей. Может, теперь тоже надо быть потрясённой. Но грань уже стёрлась».

Мы больше не на стадии «ну такое, криво и смешно». Мы в зловещей долине, когда ИИ-видео вызывают не смех, а тревогу. И эта долина становится глубже с каждым обновлением модели.

Наше мнение: развитие нейросетей для генерации видео — это не только технологический триумф, но и серьёзный вызов для общества. Чем реалистичнее результаты, тем актуальнее вопрос доверия к визуальному контенту. Платформы вроде stiva.ai, где собраны десятки ИИ-моделей для работы с видео и изображениями, делают эти технологии доступнее — и ответственность каждого пользователя растёт пропорционально.

Читайте также