2 часа назад
ИИ, который пойдет на смартфоне: Google Gemma 4 получила квантованные версии

Google DeepMind выложила официальные квантованные версии Gemma 4 — специально обученные чекпойнты, которые резко снижают требования к памяти и позволяют запускать открытую модель на ноутбуках, периферийных устройствах и даже смартфонах. Веса уже доступны на Hugging Face, а самый компактный вариант в мобильном формате помещается приблизительно в 1 ГБ памяти.
Квантованные сборки Gemma 4 существовали и раньше, но их делало сообщество — теперь же облегченные версии выпускает сама Google. Организация использовала технологию QAT — это обучение, при котором пониженная точность вычислений моделируется еще на этапе тренировки, следовательно при последующем сжатии схема теряет в качестве меньше, чем при обычном квантовании уже готовых весов.
Что именно выложили:
Пять размеров семейства: E2B, E4B, 12B, 26B A4B и 31B.
Четыре формата под разные сценарии: неквантованный Q4_0 (для своей компиляции и исследований), готовый к запуску GGUF Q4_0, Compressed Tensors w4a16 под vLLM и мобильный формат wNa8o8 с прицельными 2-битными слоями декодинга.
Сопровождение с первого дня: llama.cpp, Ollama, LM Studio, vLLM, MLX и LiteRT-LM.
Google заявляет, что QAT сохраняет качество, близкое к bfloat16, и обходит обычное послетренировочное квантование, но независимых бенчмарков именно по Gemma 4 QAT на момент релиза нет — пока это обещание самой компании. Квантованные модели для смартфона в любом случае стоит воспринимать как дополнительный ИИ — например, для перевода в дорогом роуминге или при отсутствии интернета.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

2 часа назад
Исследование показало, что не ИИ, а удалённая работа оттесняет недавних выпускников колледжей на следующий план
Есть мнение, что искусственный интеллект меняет рынок труда для молодых выпускников. Но новое исследование Федерального резервного банка Нью-Йорка демонстрирует, что проблема может быть в другом: в уд

6 часов назад
Правительство России ввело двухуровневое обезличивание данных о просмотрах контента в онлайн-кинотеатрах и соцсетях
Правительство России подписало постановление, которое меняет порядок сбора статистики о просмотрах медиаконтента в онлайн-кинотеатрах и социальных сетях. Документ направлен на повышение точности таких
6 часов назад
СМИ: «Бельгийский суд арестовал имущество Google Belgium на 115 млн евро по иску российской компании»
Суд в Бельгии арестовал имущество компании Google Belgium на сумму 115 млн евро по заявлению российского ООО «Гугл». Российская организация добивается исполнения решения Арбитражного суда Москвы о взы
8 часов назад
Эксперты «Лаборатории Касперского» обнаружили новое ВПО Argamal, распространяемый под видом игр 18+
Эксперты «Лаборатории Касперского» весной 2026 года обнаружили новую вредоносную кампанию. Злоумышленники распространяли ранее неизвестный троянец удалённого доступа Argamal под видом игр для взрослых

9 часов назад
Mythos все-таки стала инструментом для наступательных киберопераций США
✔ Mythos все-таки стала инструментом для наступательных киберопераций США АНБ США начало применять модель Mythos для взлома зарубежных сетей, предположительно в Китае и Иране. Для адаптации системы по