Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

3 мин
Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

Индустрия искусственного интеллекта годами развивалась по пути грубой силы — бесконечного наращивания вычислительных мощностей. Но когда физические пределы «железа» стали очевидны, в игру вернулась чистая математика.

В среду, 25 марта 2026 года, на биржах произошла аномалия. Пока индекс Nasdaq уверенно рос, акции гигантов индустрии памяти — Micron, Western Digital, Seagate, а равным образом производителей оборудования Lam Research и Applied Materials — синхронно ушли в минус. Триггером стала не геополитика и не сбои в логистике, а публикация одной научной статьи от Google Research.

Команда инженеров Google представила TurboQuant — механизм, способный сжать так называемый KV-кэш (память, в которой нейросеть удерживает контекст диалога) до 3 бит. И самое важное: механизм не снижает точность ответов и ускоряет вычисления в 8 раз на чипах NVIDIA H100.

До этого момента индустрия решала проблему огромных контекстов грубой силой: просто закупала всё больше дорогих чипов памяти. Инженеры Google предложили альтернативу — перестать раздувать аппаратные мощности и переписать саму математику работы ИИ с данными.

Квантование полярных координат

В основе TurboQuant лежит отказ от привычных систем координат. Современные алгоритмы теряют критически важные информация, когда пытаются сжать информацию сильнее 4 бит. Google обошла этот барьер с помощью квантования полярных координат PolarQuant.

Вместо того чтобы хранить тяжелые многомерные координаты данных, алгоритм переводит их в полярную систему — запоминает только радиус и угол. Оказалось, что для нейросетей направление вектора куда важнее точного расстояния. А неизбежные при таком жестком сжатии ошибки механизм аккуратно сглаживает дополнительным модулем QJL (Quantized Johnson-Lindenstrauss) — он просто прячет лишний «шум» в безопасное математическое пространство, где тот не мешает вычислениям.

Этот изящный трюк создает неожиданную проблему даже для гегемона рынка — NVIDIA. Софтверный буст делает их текущие чипы H100 настолько эффективными, что клиенты могут решить подождать и отложить закупку новых, более дорогих процессоров.

Реакция рынка

Торговые алгоритмы Уолл-стрит отреагировали прямолинейно: если Google в шесть раз сокращает потребность ИИ в памяти, значит, дата-центрам больше не нужно скупать SSD и чипы в прежних объемах.

Однако аналитики Morgan Stanley призывают не паниковать. Они называют долгосрочный эффект для производителей железа «нейтрально-позитивным». Срабатывает парадокс Джевонса: когда источник становится использовать проще и дешевле, его потребление не падает, а наоборот — взлетает.

Падение требований к памяти сильно удешевит запускание ИИ. Нейросети, которым раньше требовались целые серверные стойки, теперь смогут функционировать локально или на дешевом оборудовании. Это не убьет спрос на кремний, а откроет двери для тысяч новых проектов, которые раньше были просто не по карману.

Официально TurboQuant покажут в апреле на конференции ICLR 2026 в Рио-де-Жанейро. И, кажется, это отличный сигнал: индустрия ИИ перестает решать все проблемы исключительно грубой силой. Гонка «железа» никуда не денется, но теперь выигрывать в ней будут не только бесконечными бюджетами на память, но и красивой математикой.

Читают сейчас

Уволенные работники Oracle пытались договориться о более выгодном выходном пособии, но бывший работодатель отказал

48 минут назад

Уволенные работники Oracle пытались договориться о более выгодном выходном пособии, но бывший работодатель отказал

В конце марта Oracle сократила от 20 тыс. до 30 тыс. человек. Уволенные работники компании пытались договориться о более выгодном выходном пособии, но бывший работодатель отказал, пишет TechCrunch. Оз

Инициатива PHP перешёл на лицензию BSD-3

51 минуту назад

Инициатива PHP перешёл на лицензию BSD-3

Авторы языка программирования PHP направили в организацию OSI (Open Source Initiative) уведомление о добровольном выводе из обращения лицензии PHP License 3.01. Заявлено, что после нескольких лет рабо

В Италии впервые диагностировали зависимость от ИИ

2 часа назад

В Италии впервые диагностировали зависимость от ИИ

Итальянская национальная служба поддержки людей с зависимостями (Servizio per le Dipendenze, SerD) в начальный раз в стране зафиксировала аддикцию от искусственного интеллекта, пишет местное книга Gaz

2 часа назад

Instagram* отключил сквозное шифрование личных сообщений: что произошло 8 мая 2026 года

С 8 мая 2026 года Instagram* официально перестал поддерживать сквозное шифрование (E2EE) в директах. Meta** теперь технически способна видеть содержимое переписок между пользователями платформы. Офици

В США чиновники резали гранты через ChatGPT. Потом сделали бота крайним в суде

3 часа назад

В США чиновники резали гранты через ChatGPT. Потом сделали бота крайним в суде

Окружной судья Колин Маккэхон в Манхэттене 7 мая признала незаконной отмену больше 1400 грантов Национального фонда гуманитарных наук — государственной структуры, которая распределяет деньги между уче