
2 часа назад
v2a-модель PrismAudio учится озвучивать видео, разделяя смысл, время, эстетику и пространство
Разработчики из команды FunAudioLLM (входящей в Alibaba Group) представили PrismAudio – новый фреймворк для генерации звука по видео (video-to-audio, v2a), который кардинально меняет подход к этой зад