8 апреля 2026, 18:13
Бывший техлид Kling собрал в Alibaba видеомодель, которая порвала лидерборд

Видеомодель HappyHorse-1.0, которую некоторое количество дней назад обнаружили на анонимной видео-арене Artificial Analysis, возглавила лидерборд в категории генерации видео по тексту без аудио с рейтингом Elo 1357 — обойдя прежнего лидера Seedance 2.0 от ByteDance на 84 пункта. В анимации картинки (image-to-video) без звука HappyHorse тоже на первом месте с рейтингом Elo 1402. В категориях со звуком модель держит второе место в text-to-video (1215 против 1220 у Seedance 2.0) и первое — в image-to-video (1160 против 1158).
Разрыв в 84 пункта Elo в ключевой категории — редкая картина: обычно топ-модели видеоарены укладываются в 10–20 пунктов друг от друга. По правилам рейтинга это означает, что HappyHorse выигрывает приблизительно 62 процентов прямых сравнений. Рейтинг Artificial Analysis строится исключительно на слепых пользовательских голосах — человек видит два ролика по одному и тому же промпту, не зная, какая схема их сделала, и выбирает понравившийся. Именно это делает результат сложным для оспаривания: параметры и технические отчеты в формуле не участвуют.
Позднее в сети появился веб-сайт модели: HappyHorse-1.0 построена в подразделении Future Life Lab при Taotian Group — части Alibaba, отвечающей за алгоритмы электронной коммерции. Лабораторию возглавляет Чжан Ди — бывший вице-президент Kuaishou и технический лидер направления Kling AI, один из ключевых людей в китайской видеогенерации. В конце 2025 года он перешел в Taotian, чтобы возглавить новую структуру, и HappyHorse-1.0 стала ее первым публичным результатом. Для Alibaba это означает второе параллельное видео-направление: классическое семейство WAN развивает Tongyi Lab, а команда Чжан Ди работает внутри e-commerce-вертикали и уже обогнала в тесте и свой же WAN 2.6, и главного конкурента ByteDance.
По описанию на сайте, HappyHorse-1.0 — это схема на 15 миллиардов параметров с единым 40-слойным трансформером, где текстовые токены, скрытое представление референс-картинки, видео и аудио денойзятся в одной общей последовательности без перекрестного внимания (cross-attention). Пятисекундный клип в разрешении 256p рендерится приблизительно за 2 секунды на H100, 1080p — за 38 секунд. Команда обещает выложить в опенсорс базовую схема, дистиллят, компонент повышения разрешения и код инференса; ссылки на GitHub и Model Hub пока помечены как "скоро". Если обещание по опенсорсу будет выполнено, HappyHorse-1.0 станет первой моделью с открытыми весами, напрямую обошедшей закрытые коммерческие системы в слепом пользовательском тесте на видео.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

4 часа назад
«Проверка Тьюринга — игра во вранье, и ИИ в ней весьма хорош»: GPT-4.5 прошла расширенный «проверка на человека»
Блог Proceedings of the National Academy of Sciences опубликовал прошедшую рецензирование версию исследования Кэмерона Джонса и Бена Бергена из Калифорнийского университета в Сан-Диего — той самой раб
5 часов назад
СМИ: «Холдинг Т1 ведёт переговоры о покупке доли разработчика Astra Linux»
Холдинг «Т1» ведёт переговоры о приобретении крупнейшего разработчика операционных систем «Группы Астра». Об этом сообщило издание CNews со ссылкой на неназванные источники на ИТ‑рынке. Как рассказал

5 часов назад
Вице-президент Google предложил пари: ИИ не уничтожит рабочие места
Доля задач, которые может выполнять ИИ, стремительно растет — но доля профессий, которые можно автоматизировать полностью, застряла ниже 10%. Старший вице-президент Google и Alphabet Джеймс Маньика за

7 часов назад
Вышло мобильное программа Morse Code — Decode & Chat — мессенджер на азбуке Морзе
Представлено мобильное приложение под название Morse Code - Decode & Chat (App Store и Google Play). В соответствии с пояснению разработчиков, это мессенджер между смартфонами на азбуке Морзе. Читать

8 часов назад
«Сбер» запустил платформу GigaCowork для управления ИИ-агентами в бизнесе без участия разработчиков
«Сбер» открыл доступ к тестированию платформы GigaCowork для управления ИИ‑агентами в компаниях. Запуск 19 мая 2026 года представила компания «Салют для бизнеса» (входит в экосистему «Сбера» ) на конф