19 мая 2026, 22:23

Вышла видеомодель Google Gemini Omni: «превратит что угодно во что угодно»

2 мин

Google 19 мая на конференции I/O 2026 представила Gemini Omni Flash — первую модель нового семейства Omni, способную не просто генерировать видео, а переделывать уже снятый ролик по текстовым командам прямо в чате. Анонс делал глава Google DeepMind Демис Хассабис. Схема раскатывается сразу: всем подписчикам тарифов Google AI Plus, Pro и Ultra по всему миру через приложение Gemini и киноинструмент Flow, а в YouTube Shorts и приложении YouTube Create — бесплатно, в течение недели.

Главное отличие от прошлогодней Veo — направление работы. Veo превращала текст в видео с нуля, Omni берет любой ввод (текст, изображения, аудио или готовое видео) и меняет в нем то, что нужно: персонажей, объекты, происходящее в кадре. Редактирование идет цепочкой — каждая следующая команда опирается на предыдущую, одновременно персонажи остаются прежними, а сцена "помнит", что было до этого. Отдельно Google делает упор на физику: организация заявляет, что модель точнее обращается с гравитацией, динамикой жидкостей и кинетической энергией, поэтому из короткого промпта можно собрать, например, наглядный научный ролик — на презентации показывали пластилиновый ролик про сворачивание белка.

В Google подумали о безопасности. Каждое видео получает незаметный цифровой водяной знак SynthID, и его происхождение можно проверить через программа Gemini, через Gemini в браузере Chrome и в поиске Google. Вставить в ролик можно собственный аватар — внешность и голос самого пользователя, — но менять чужую речь и звук схема на старте не дает: эту способность придержали, пока не придумают, как раздать ее безопасно. Логика понятна — без таких рамок Omni превращается в готовую фабрику дипфейков.

Это только начало семейства. Google уже анонсировала старшую модель Omni Pro (детали обещают позже) и говорит, что со временем Omni научится выдавать не только видео, но и изображения со звуком. Ставка тут шире одной модели: Google пытается стать единой точкой генерации контента с готовой раздачей через YouTube, поиск и собственные приложения — особенно с учетом того, что OpenAI заморозила направление видеогенерации Sora..

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Google Gemini Gemini Omni

Читают сейчас

55 минут назад

Нейросеть находит поломку авто по звуку — обучение проходило на роликах из YouTube и TikTok

Разработчик Адам Сон выложил в открытый доступ cardiag — систему, которая по аудиозаписи определяет, есть ли у машины неисправность, и подсказывает, в какой части автомобиля искать проблему. В достато

1 час назад

ФАС РФ призвала операторов связи не препятствовать переходу абонентов к другим компаниям с сохранением номера

Федеральная антимонопольная служба (ФАС) России призвала операторов связи РФ привести свои бизнес-практики в соответствие с требованиями Закона о защите конкуренции. Ведомство настоятельно порекомендо

2 часа назад

«Египет победил»: Qwen3-4B превратили в «самый согласованный ИИ в истории»

В X завирусился пост исследователя под ником waterloo_intern: он рассказал, что "дистиллировал 2,3 млн трейсов рассуждений Claude Fable 5" в компактную схема Qwen3-4B и получил невиданные результаты —

3 часа назад

Версия открытой платформы для самостоятельного хранения и управления фото и видео Immich 3.0

В начале июля 2026 года состоялся версия стабильного обновления открытой платформы для самостоятельного хранения и управления фото и видео Immich 3.0. Проект находится в разработке с начала 2022 года

6 часов назад

В AIRI создали нейросеть GENATATOR для разметки генов по последовательности ДНК и аннотации геномов без подробных данных

Учёные Института AIRI разработали нейросетевую схема Genatator, которая строит карту генов по последовательности ДНК.Как сообщили информационной службе а в AIRI, модель предназначена для разметки гено