Alibaba выпустила Wan2.7-Image – ИИ для генерации и изменения картинок

2 мин
Alibaba выпустила Wan2.7-Image – ИИ для генерации и изменения картинок

Alibaba Cloud выпустила нейросеть Wan2.7-Image – новую унифицированную модель, предназначенную для генерации и редактирования изображений.

Одна из ключевых особенностей Wan2.7-Image – детальная проработка лиц. Как отмечают создатели, многие нейросети генерируют однотипные портреты. Новая модель даёт возможность управлять строением лица на гранулярном уровне: формой скул, разрезом глаз, контуром, макияжем и причёской, причём с учётом этнического разнообразия, возраста и телосложения.

Важным нововведением стала работа с цветом. Схема умеет автоматически извлекать цветовую палитру из загруженного референсного изображения. Для тех, кому нужна максимальная точность, предусмотрен ручной ввод с использованием до восьми HEX-кодов с указанием точных пропорций.

Отдельного внимания заслуживает рендеринг текста. Wan2.7-Image способна воспроизводить до 3000 токенов текста на 12 языках с качеством, сопоставимым с печатным. В заявленные сценарии входят академические работы со сложными формулами, финансовые отчёты с плотными таблицами, инфографика и длинные вертикальные скроллы. Разработчики подчёркивают, что в итоговом изображении не будет пропущенных символов, размытых надписей или нарушенной вёрстки.

Функционал интерактивного редактирования внедрён через интуитивный оболочку: потребитель выделяет область на изображении и текстовой командой описывает желаемое модификация. Модель поддерживает перемещение, изменение размера и поворот объектов, замену элементов, редактирование текста (шрифта, цвета, выравнивания), а также вставку новых деталей.

Wan2.7-Image равным образом предлагает режим мультигенерации: один промпт может создать до 12 согласованных между собой изображений. Это пригодится для раскадровок, каталогов продуктов, детских книг, серий свадебных фотографий или многовариантной архитектурной визуализации. Для проектов с несколькими объектами схема может применять до девяти референсных изображений для сохранения их уникальных характеристик.

Прочитать с возможностями можно на официальном сайте, а для разработчиков открыт доступ к api на платформе Alibaba Cloud.

Читают сейчас

OpenAI объединяет ChatGPT, Codex и api

14 минут назад

OpenAI объединяет ChatGPT, Codex и api

Wired говорит, что сооснователь и президент OpenAI Грег Брокман официально возглавил всю продуктовую стратегию, а ChatGPT, кодинг-агент Codex и программный интерфейс для разработчиков сводятся в одну

ChatGPT обвинили в передаче данных в Google и Meta

31 минуту назад

ChatGPT обвинили в передаче данных в Google и Meta

13 мая жительница Сан-Диего Амарго Кутюр подала против OpenAI коллективный иск в федеральный суд Южного округа Калифорнии (дело № 3:26-cv-03000). Она утверждает, что сайт ChatGPT передавал темы пользо

В США братья‑близнецы удалили 96 правительственных баз данных через некоторое количество минут после увольнения

59 минут назад

В США братья‑близнецы удалили 96 правительственных баз данных через некоторое количество минут после увольнения

Братья‑близнецы Муниб и Сохайб Ахтер уничтожили 96 правительственных баз данных на протяжении часа после того, как их уволили из компании, обслуживающей федеральные ведомства. Муниба и Сохайба Ахтеров

1 час назад

Компании из структуры «Газпрома» стартовали открывать счета в цифровых рублях

Компании «Газпрома», в том числе из головной структуры группы, начали открывать счета в цифровых рублях, сообщает «Интерфакс». Одна из структур концерна, ООО «Газпром 335», уже сообщила в системе госз

Удалёнщик разработал собственного ИИ-клона, потому что ему было одиноко — он ни с кем не говорил некоторое количество лет

4 часа назад

Удалёнщик разработал собственного ИИ-клона, потому что ему было одиноко — он ни с кем не говорил некоторое количество лет

Удалёнщик создал собственного ИИ-клона, потому что ему было одиноко — он ни с кем не говорил некоторое количество лет, кроме мамы и продавщицы из магазина. 28-летний разработчик заметил, что разговари