Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

3 мин
Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

Индустрия искусственного интеллекта годами развивалась по пути грубой силы — бесконечного наращивания вычислительных мощностей. Но когда физические пределы «железа» стали очевидны, в игру вернулась чистая математика.

В среду, 25 марта 2026 года, на биржах произошла аномалия. Пока индекс Nasdaq уверенно рос, акции гигантов индустрии памяти — Micron, Western Digital, Seagate, а равным образом производителей оборудования Lam Research и Applied Materials — синхронно ушли в минус. Триггером стала не геополитика и не сбои в логистике, а публикация одной научной статьи от Google Research.

Команда инженеров Google представила TurboQuant — механизм, способный сжать так называемый KV-кэш (память, в которой нейросеть удерживает контекст диалога) до 3 бит. И самое важное: механизм не снижает точность ответов и ускоряет вычисления в 8 раз на чипах NVIDIA H100.

До этого момента индустрия решала проблему огромных контекстов грубой силой: просто закупала всё больше дорогих чипов памяти. Инженеры Google предложили альтернативу — перестать раздувать аппаратные мощности и переписать саму математику работы ИИ с данными.

Квантование полярных координат

В основе TurboQuant лежит отказ от привычных систем координат. Современные алгоритмы теряют критически важные информация, когда пытаются сжать информацию сильнее 4 бит. Google обошла этот барьер с помощью квантования полярных координат PolarQuant.

Вместо того чтобы хранить тяжелые многомерные координаты данных, алгоритм переводит их в полярную систему — запоминает только радиус и угол. Оказалось, что для нейросетей направление вектора куда важнее точного расстояния. А неизбежные при таком жестком сжатии ошибки механизм аккуратно сглаживает дополнительным модулем QJL (Quantized Johnson-Lindenstrauss) — он просто прячет лишний «шум» в безопасное математическое пространство, где тот не мешает вычислениям.

Этот изящный трюк создает неожиданную проблему даже для гегемона рынка — NVIDIA. Софтверный буст делает их текущие чипы H100 настолько эффективными, что клиенты могут решить подождать и отложить закупку новых, более дорогих процессоров.

Реакция рынка

Торговые алгоритмы Уолл-стрит отреагировали прямолинейно: если Google в шесть раз сокращает потребность ИИ в памяти, значит, дата-центрам больше не нужно скупать SSD и чипы в прежних объемах.

Однако аналитики Morgan Stanley призывают не паниковать. Они называют долгосрочный эффект для производителей железа «нейтрально-позитивным». Срабатывает парадокс Джевонса: когда источник становится использовать проще и дешевле, его потребление не падает, а наоборот — взлетает.

Падение требований к памяти сильно удешевит запускание ИИ. Нейросети, которым раньше требовались целые серверные стойки, теперь смогут функционировать локально или на дешевом оборудовании. Это не убьет спрос на кремний, а откроет двери для тысяч новых проектов, которые раньше были просто не по карману.

Официально TurboQuant покажут в апреле на конференции ICLR 2026 в Рио-де-Жанейро. И, кажется, это отличный сигнал: индустрия ИИ перестает решать все проблемы исключительно грубой силой. Гонка «железа» никуда не денется, но теперь выигрывать в ней будут не только бесконечными бюджетами на память, но и красивой математикой.

Читают сейчас

Столько получили исследователи за найденные уязвимости

11 минут назад

Столько получили исследователи за найденные уязвимости

Проверять защита наших сервисов и ресурсов помогают независимые эксперты — багхантеры на платформе BI.ZONE. Мы постоянно расширяем области тестирования и, конечно, увеличиваем награды. Вот немного циф

В Польше отбили кибератаку на основной ядерный исследовательский центр

14 минут назад

В Польше отбили кибератаку на основной ядерный исследовательский центр

В Польше сообщили о кибератаке на Национальный центр ядерных исследований — это ключевой ядерный исследовательский объект страны, где работает реактор MARIA. По данным самого центра, атаку удалось быс

Microsoft исправила ошибку синхронизации с Gmail в классическом Outlook

15 минут назад

Microsoft исправила ошибку синхронизации с Gmail в классическом Outlook

Microsoft исправила ошибку классического Outlook, которая не позволяла синхронизировать контент учётных записей с Gmail и Yahoo. Ознакомиться далее

Google представила свежий ИИ-алгоритм сжатия памяти TurboQuant

35 минут назад

Google представила свежий ИИ-алгоритм сжатия памяти TurboQuant

Исследователи искусственного интеллекта Google представили TurboQuant, свежий сверхэффективный алгоритм сжатия памяти для ИИ на основе векторного квантования. Читать далее

Раскрыты детали по уязвимости для удалённой DoS-атаки в FreeBSD через TCP

49 минут назад

Раскрыты детали по уязвимости для удалённой DoS-атаки в FreeBSD через TCP

26 марта 2026 года команда проекта FreeBSD раскрыла детали ранее обнаруженной веб уязвимости для проведения удалённого эксплуатируемого вектора DoS-атаки (утечка mbuf) через TCP. Ознакомиться далее