
1 час назад
NVIDIA ускорила языковую схема в 4 раза: вышла Nemotron-Labs Diffusion
NVIDIA выпустила открытое семейство языковых моделей Nemotron-Labs Diffusion — на флагманском GPU B200 они генерируют 865 токенов в секунду, в 4 раза быстрее обычной токен-за-токеном генерации на том