Gemini научили применять Google Photos для создания персонализированных изображений

2 мин
Gemini научили применять Google Photos для создания персонализированных изображений

В Google представили новые способы использования данных в Gemini с помощью Nano Banana 2 и Google Photos, чтобы разрабатывать персонализированные изображения.

Раньше, чтобы получить действительно персонализированный результат, приходилось писать длинные промпты и вручную скачивать нужную фотографию, объяснили в компании. Теперь функция «Персональный интеллект» даёт Gemini изначальное понимание предпочтений. Интегрируя этот контекст непосредственно с Nano Banana 2, ИИ может автоматически заполнять пробелы в подсказках, с учётом сценарии использования и контекст. 

Таким образом, юзер может применять простые подсказки, такие как «Спроектируй дом моей мечты» или «Создай картинку того, что мне нужно на необитаемый остров», а результаты автоматически отразят его конкретные вкусы и образ жизни по данным из подключённых приложений Google. 

Если подключить Google Photos к Personal Intelligence, то Gemini сможет использовать реальные фотографии человека и его близких, чтобы направлять процедура создания изображений. Метки групп людей и домашних животных в библиотеке обеспечат нужный контекст. Так, Gemini можно попросить «создать глиняную анимацию со мной и моей семьёй, занимающихся любимым делом». Равным образом можно экспериментировать с различными стилями, такими как акварель, угольные эскизы или масляная живопись. 

Чтобы пользователь мог контролировать процесс, в компании предусмотрели способы уточнения результатов. Gemini можно сообщить, что было не так, и попробовать создать изображение снова. Также можно нажать значок «+» и выбрать другую фотографию из библиотеки, чтобы попробовать свежий ракурс. Если интересно, как был применён контекст, нужно нажать кнопку «Источники». Равным образом можно напрямую запросить у Gemini информацию об авторстве и источниках, использованных для этого конкретного изображения.

Google отмечает, что приложение Gemini не обучает свои модели напрямую на личной библиотеке Google Photos, а только на конкретных подсказках и ответах, чтобы со временем улучшать функциональность. Подключение приложений Google к ИИ остаётся добровольным, поведение можно изменить в настройках в любое время.

Новый опыт создания изображений в приложении Gemini будет внедряться в течение следующих нескольких дней для соответствующих подписчиков Google AI Plus, Pro и Ultra в США, а потом появится в Gemini для Chrome в настольной версии и для большего числа пользователей.

Ранее Google анонсировала новую схема синтеза речи — Gemini 3.1 Flash TTS с акцентом на управляемости генерации и более естественном звучании. Она уже доступна в превью для разработчиков и бизнеса через api и облачные сервисы.

Читают сейчас

В РФ запретили парковать электрокары и гибриды на подземных паркингах

4 минуты назад

В РФ запретили парковать электрокары и гибриды на подземных паркингах

В соответствии с новому своду МЧС о правилах пожарной безопасности, теперь россиянам будут грозить штрафы за парковку электрокаров и гибридных автомобилей на обычных подземных паркингах. Читать далее

Atari купила авторов Crossy Road

24 минуты назад

Atari купила авторов Crossy Road

Atari купила студию Hipster Whale — авторов Crossy Road. По условиям соглашения, компания сразу заплатит за разработчиков $29,3 млн, из которых $3,3 млн отдаст своими акциями. Ознакомиться далее

Гигантское инфракрасное зеркало телескопа «Роман» готово к запуску

26 минут назад

Гигантское инфракрасное зеркало телескопа «Роман» готово к запуску

Основной зеркальный диск космического телескопа НАСА имени Нэнси Грейс Роман прошёл заключительную проверку. 20 и 21 мая инженеры Центра космических полётов имени Годдарда НАСА в Гринбелте, штат Мэрил

BYD возьмёт на себя ответственность за аварии на автопилоте «God’s Eye» в Китае

45 минут назад

BYD возьмёт на себя ответственность за аварии на автопилоте «God’s Eye» в Китае

Компания BYD заявляет, что возьмет на себя полную финансовую ответственность за аварии по вине водителя, произошедшие во время работы её системы «God’s Eye» в городских условиях Китая. Она готова выпл

Nvidia представила RTX Spark 0 ARM-чип, который метит туда, где Apple M-серия доминирует

1 час назад

Nvidia представила RTX Spark 0 ARM-чип, который метит туда, где Apple M-серия доминирует

🖥 Nvidia представила RTX Spark 0 ARM-чип, который метит туда, где Apple M-серия доминирует. По памяти: RTX Spark поддерживает до 128 ГБ LPDDR5X (минимум 16 ГБ) с пропускной способностью 300 ГБ/с чере