Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

3 мин
Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

Индустрия искусственного интеллекта годами развивалась по пути грубой силы — бесконечного наращивания вычислительных мощностей. Но когда физические пределы «железа» стали очевидны, в игру вернулась чистая математика.

В среду, 25 марта 2026 года, на биржах произошла аномалия. Пока индекс Nasdaq уверенно рос, акции гигантов индустрии памяти — Micron, Western Digital, Seagate, а равным образом производителей оборудования Lam Research и Applied Materials — синхронно ушли в минус. Триггером стала не геополитика и не сбои в логистике, а публикация одной научной статьи от Google Research.

Команда инженеров Google представила TurboQuant — механизм, способный сжать так называемый KV-кэш (память, в которой нейросеть удерживает контекст диалога) до 3 бит. И самое важное: механизм не снижает точность ответов и ускоряет вычисления в 8 раз на чипах NVIDIA H100.

До этого момента индустрия решала проблему огромных контекстов грубой силой: просто закупала всё больше дорогих чипов памяти. Инженеры Google предложили альтернативу — перестать раздувать аппаратные мощности и переписать саму математику работы ИИ с данными.

Квантование полярных координат

В основе TurboQuant лежит отказ от привычных систем координат. Современные алгоритмы теряют критически важные информация, когда пытаются сжать информацию сильнее 4 бит. Google обошла этот барьер с помощью квантования полярных координат PolarQuant.

Вместо того чтобы хранить тяжелые многомерные координаты данных, алгоритм переводит их в полярную систему — запоминает только радиус и угол. Оказалось, что для нейросетей направление вектора куда важнее точного расстояния. А неизбежные при таком жестком сжатии ошибки механизм аккуратно сглаживает дополнительным модулем QJL (Quantized Johnson-Lindenstrauss) — он просто прячет лишний «шум» в безопасное математическое пространство, где тот не мешает вычислениям.

Этот изящный трюк создает неожиданную проблему даже для гегемона рынка — NVIDIA. Софтверный буст делает их текущие чипы H100 настолько эффективными, что клиенты могут решить подождать и отложить закупку новых, более дорогих процессоров.

Реакция рынка

Торговые алгоритмы Уолл-стрит отреагировали прямолинейно: если Google в шесть раз сокращает потребность ИИ в памяти, значит, дата-центрам больше не нужно скупать SSD и чипы в прежних объемах.

Однако аналитики Morgan Stanley призывают не паниковать. Они называют долгосрочный эффект для производителей железа «нейтрально-позитивным». Срабатывает парадокс Джевонса: когда источник становится использовать проще и дешевле, его потребление не падает, а наоборот — взлетает.

Падение требований к памяти сильно удешевит запускание ИИ. Нейросети, которым раньше требовались целые серверные стойки, теперь смогут функционировать локально или на дешевом оборудовании. Это не убьет спрос на кремний, а откроет двери для тысяч новых проектов, которые раньше были просто не по карману.

Официально TurboQuant покажут в апреле на конференции ICLR 2026 в Рио-де-Жанейро. И, кажется, это отличный сигнал: индустрия ИИ перестает решать все проблемы исключительно грубой силой. Гонка «железа» никуда не денется, но теперь выигрывать в ней будут не только бесконечными бюджетами на память, но и красивой математикой.

Читают сейчас

Потребительские NVMe на Луне: Kioxia и HPE готовят Spaceborne Computer 4 к лунной миссии

29 минут назад

Потребительские NVMe на Луне: Kioxia и HPE готовят Spaceborne Computer 4 к лунной миссии

Привет, ! На связи Selectel. Kioxia и HPE готовят к лунной миссии вычислительную систему Spaceborne Computer 4 с обычными потребительскими NVMe SSD на борту. Рассказываем, зачем на Луне LLM и почему д

58 минут назад

ЦОДам могут дать специальный статус в энергосистеме

Центры обработки данных могут получить статус особо значимых потребителей электроэнергии. Помимо этого, для них предлагается снять ограничения на подключение к единой энергосистеме в случаях, когда у

Полное управление Deckhouse Kubernetes Platform через веб-интерфейс — теперь в бесплатной версии платформы

1 час назад

Полное управление Deckhouse Kubernetes Platform через веб-интерфейс — теперь в бесплатной версии платформы

Управление узлами и выпуском сертификатов, виртуализация, конфигурация доступа, мониторинг и все остальные возможности веб-интерфейса — теперь и в бесплатной Open Source-версии Deckhouse Kubernetes Pl

Апдейт Terraform в выделенных серверах

1 час назад

Апдейт Terraform в выделенных серверах

Привет, ! Selectel выпустил крупное обновление Terraform. Теперь пользователи могут функционировать с приватными подсетями и применять широкий набор сценариев при настройке конфигураций. Подробнее об

ИИ-детектор утечек: как работает DLP нового поколения

1 час назад

ИИ-детектор утечек: как работает DLP нового поколения

Сотрудник переименовал файл с клиентской базой в family_photos.xlsx— классический DLP его пропустил. Скопировал текст договора в публичную нейросеть — платформа не отреагировала. Современные сценарии