Cerebras разогнал Google Gemma 4 до 1500 токенов/с — и научил видеть картинки

2 мин
Cerebras разогнал Google Gemma 4 до 1500 токенов/с — и научил видеть картинки

Организация Cerebras, известная гигантскими ИИ-чипами размером с кремниевую пластину, запустила модель Gemma 4 на своей платформе инференса со скоростью свыше 1500 токенов в секунду. Пока это приватное превью, совокупный доступ обещают открыть до конца месяца. Это не первая схема, которую Cerebras запускает на повышенной скорости, но первая с поддержкой мультимодальности: на прием она может получать не только текст, но и картинки.

Cerebras приводит примеры, где сочетание скорости и мультимодальности меняет ощущения от продукта:

  • разбор плотного дашборда или страницы документа с выделением главного и структурированным ответом — сразу, а не после паузы;

  • суммаризация длинного отчета или техзадания так быстро, что можно прочитать, среагировать и переспросить за один присест;

  • "скриншот → патч": схема получает сломанный интерфейс, исходник и ошибку из консоли и возвращает минимальную правку.

В цифрах Cerebras подает это так: их Gemma 4 выдает свыше 1500 токенов в секунду против примерно 100 у Claude Haiku — то есть быстрее в 15 раз при сопоставимом качестве. По индексу Artificial Analysis Intelligence Index Gemma 4 31B набирает 29 баллов против 30 у Haiku. Стоит держать в уме, что и само сравнение, и подбор референсной модели — это позиционирование вендора: Cerebras прямо предлагает мигрировать на Gemma 4 тем, кто сидит на Llama, GPT-OSS или Haiku.

Любопытная деталь для тех, кто следит за архитектурой. Чипы Cerebras традиционно хороши на разреженных вычислениях и заметно хуже чувствуют себя на плотных матрицах — а флагманская Gemma 4 31B как раз dense-модель, без смеси экспертов. Так что 1500 токенов в секунду на ней — знаковый результат для чипов Cerebras, которые как раз нацелены на оперативный и дешевый инференс.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Потребитель превратил Steam Controller в радиоуправляемый в интернете прибор через браузер

27 минут назад

Потребитель превратил Steam Controller в радиоуправляемый в интернете прибор через браузер

Потребитель превратил свежий Valve контроллер Steam Controller в радиоуправляемый в интернете гаджет, который можно пустить по столу по своим делам через браузер на базе Chromium. Контроллером можно у

DeepSeek получил компьютерное зрение — схема «водит пальцем по картинке»

57 минут назад

DeepSeek получил компьютерное зрение — схема «водит пальцем по картинке»

18 июня DeepSeek включила режим работы с изображениями (Vision) в своем приложении и веб-версии. Об этом сообщил Чэнь Сяокан — один из авторов мультимодальных моделей серии DeepSeek-VL. Теперь в чате

«Яндекс» внедрил в чат с «Алисой AI» 30 ИИ-персонажей с разными характерами и сценариями общения

4 часа назад

«Яндекс» внедрил в чат с «Алисой AI» 30 ИИ-персонажей с разными характерами и сценариями общения

В чат с Алисой AI добавили ИИ‑персонажей с разными характерами и манерой общения. На момент написания материала доступно 30 персонажей: от популярного блогера до аниме‑героини. Каждый персонаж рассчит

Вышел VidCoder 12.20 — публичный инициатива для копирования DVD/Blu-ray и перекодирования видео для ПК на Windows

8 часов назад

Вышел VidCoder 12.20 — публичный инициатива для копирования DVD/Blu-ray и перекодирования видео для ПК на Windows

17 июня 2026 года состоялся релиз инструментария VidCoder 12.20. Это публичный инициатива для копирования DVD/Blu‑ray и перекодирования видео для ПК на Windows. Исходный код решения написан на C# и оп

Трамп передумал считать Anthropic угрозой нацбезопасности — но Fable 5 пока не вернули

10 часов назад

Трамп передумал считать Anthropic угрозой нацбезопасности — но Fable 5 пока не вернули

Президент США Дональд Трамп больше не полагает Anthropic угрозой национальной безопасности. В интервью "The Axios Show", опубликованном 19 июня, на прямой вопрос, представляют ли угрозу сама компания