Google выкатила Veo 3.1 Lite – дешёвую нейросеть для создания видео

2 мин
Google выкатила Veo 3.1 Lite – дешёвую нейросеть для создания видео

31 марта организация Google DeepMind официально запустила Veo 3.1 Lite – свою самую доступную нейросеть для генерации видео. Новая схема уже открыта для разработчиков через Gemini программный интерфейс и Google AI Studio. Генерация контента теперь стоит свыше в два раза дешевле относительно версией Veo 3.1 Fast, при этом скорость работы осталась на прежнем высоком уровне. Подробная техническая спецификация уже выложена в документации для разработчиков.

Свежий анонс от поискового гиганта появился буквально сразу после того, как OpenAI на днях закрыла инициатива Sora. После ухода конкурента Google оказалась лицом к лицу главным образом с китайскими разработчиками – особенно с Seedance 2.0 от Alibaba. Азиатский аналог выдаёт картинку выдающегося качества, но тянет за собой целый шлейф проблем с авторскими правами.

Google чётко позиционирует новинку как оптимальное подход для массового продакшена и прототипирования. Авторы получают генерацию текста в видео (text-to-video) и картинки в видео (image-to-video) в разрешениях 720p и 1080p. Поддерживаются портретный (9:16) и ландшафтный (16:9) форматы, а длину роликов можно задать на 4, 6 или 8 секунд.

Под капотом у всего семейства Veo 3.1 трудится архитектура diffusion transformer (DiT). В отличие от традиционных диффузионных U-Net-моделей, которые часто теряются в длинных временных зависимостях, новинка оперирует пространственно-временными патчами. Иными словами, нейросеть воспринимает видео не как набор статичных 2D-картинок, а как непрерывную последовательность токенов в латентном пространстве.

Вычисления происходят в сжатом виде, минуя пиксельное пространство, что серьёзно экономит вычислительные ресурсы. Это обеспечивает лучшую временную согласованность: освещение, текстуры и геометрия объектов не плывут на протяжении всего сгенерированного клипа. Кроме того, Veo 3.1 Lite отлично понимает команды “кинематографического контроля” – нейросети можно скармливать технические директивы вроде “pan” (панорамирование) или “tilt” (наклон камеры).

В Google обещают новые апдейты для разработчиков скоро. К тому же, инструменты на базе Veo уже вовсю внедряются в экосистему компании, в том числе YouTube Shorts, Google Photos, Google Vids, приложение Gemini и специализированную утилиту Flow.

Читают сейчас

«Мы точим мечи, а у них пулемет Гатлинга»: Китай — об отрыве США в ИИ

21 минуту назад

«Мы точим мечи, а у них пулемет Гатлинга»: Китай — об отрыве США в ИИ

Anthropic опубликовала программное эссе «2028: Two scenarios for global AI leadership» — и сделала это ровно в тот день, когда Дональд Трамп прилетел в Китай с делегацией технологических руководителей

GitHub и Git не готовы к ИИ-агентам — и Git уже переписывают на Rust

1 час назад

GitHub и Git не готовы к ИИ-агентам — и Git уже переписывают на Rust

Система GitHub за 2025 год зафиксировала рост числа AI-генерируемых проектов на 206% год к году (метрику считали по использованию bash-скриптов — типичного способа запускать агентов). Поток автоматиче

Питер Штайнбергер рассказал, на что тратит по 600 млрд токенов в месяц

2 часа назад

Питер Штайнбергер рассказал, на что тратит по 600 млрд токенов в месяц

Автор проекта OpenClaw Питер Штайнбергер в одном из твитов продемонстрировал интерфейс инструмента для учёта израсходованных токенов. На скриншоте было заметно, что Питер истратил за последний месяц т

Valve предложила бесплатную игру из-за задержки доставки Steam Controller

2 часа назад

Valve предложила бесплатную игру из-за задержки доставки Steam Controller

Valve предложила клиенту выбрать любую игру в Steam бесплатно из-за ошибки, по которой приобретённый геймпад Steam Controller не доставят к ранее назначенной дате. Об этом рассказал потребитель Reddit

Kioxia и Dell уместили почти 10 ПБ в один 2U-сервер

2 часа назад

Kioxia и Dell уместили почти 10 ПБ в один 2U-сервер

Kioxia и Dell создали серверную конфигурацию форм-фактора 2U, способную вместить до 9,8 ПБ флеш-памяти. Комплекс включает сервер Dell PowerEdge R7725xd, 40 твердотельных накопителей Kioxia LC9 NVMe ём