Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

3 мин
Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

Индустрия искусственного интеллекта годами развивалась по пути грубой силы — бесконечного наращивания вычислительных мощностей. Но когда физические пределы «железа» стали очевидны, в игру вернулась чистая математика.

В среду, 25 марта 2026 года, на биржах произошла аномалия. Пока индекс Nasdaq уверенно рос, акции гигантов индустрии памяти — Micron, Western Digital, Seagate, а равным образом производителей оборудования Lam Research и Applied Materials — синхронно ушли в минус. Триггером стала не геополитика и не сбои в логистике, а публикация одной научной статьи от Google Research.

Команда инженеров Google представила TurboQuant — механизм, способный сжать так называемый KV-кэш (память, в которой нейросеть удерживает контекст диалога) до 3 бит. И самое важное: механизм не снижает точность ответов и ускоряет вычисления в 8 раз на чипах NVIDIA H100.

До этого момента индустрия решала проблему огромных контекстов грубой силой: просто закупала всё больше дорогих чипов памяти. Инженеры Google предложили альтернативу — перестать раздувать аппаратные мощности и переписать саму математику работы ИИ с данными.

Квантование полярных координат

В основе TurboQuant лежит отказ от привычных систем координат. Современные алгоритмы теряют критически важные информация, когда пытаются сжать информацию сильнее 4 бит. Google обошла этот барьер с помощью квантования полярных координат PolarQuant.

Вместо того чтобы хранить тяжелые многомерные координаты данных, алгоритм переводит их в полярную систему — запоминает только радиус и угол. Оказалось, что для нейросетей направление вектора куда важнее точного расстояния. А неизбежные при таком жестком сжатии ошибки механизм аккуратно сглаживает дополнительным модулем QJL (Quantized Johnson-Lindenstrauss) — он просто прячет лишний «шум» в безопасное математическое пространство, где тот не мешает вычислениям.

Этот изящный трюк создает неожиданную проблему даже для гегемона рынка — NVIDIA. Софтверный буст делает их текущие чипы H100 настолько эффективными, что клиенты могут решить подождать и отложить закупку новых, более дорогих процессоров.

Реакция рынка

Торговые алгоритмы Уолл-стрит отреагировали прямолинейно: если Google в шесть раз сокращает потребность ИИ в памяти, значит, дата-центрам больше не нужно скупать SSD и чипы в прежних объемах.

Однако аналитики Morgan Stanley призывают не паниковать. Они называют долгосрочный эффект для производителей железа «нейтрально-позитивным». Срабатывает парадокс Джевонса: когда источник становится использовать проще и дешевле, его потребление не падает, а наоборот — взлетает.

Падение требований к памяти сильно удешевит запускание ИИ. Нейросети, которым раньше требовались целые серверные стойки, теперь смогут функционировать локально или на дешевом оборудовании. Это не убьет спрос на кремний, а откроет двери для тысяч новых проектов, которые раньше были просто не по карману.

Официально TurboQuant покажут в апреле на конференции ICLR 2026 в Рио-де-Жанейро. И, кажется, это отличный сигнал: индустрия ИИ перестает решать все проблемы исключительно грубой силой. Гонка «железа» никуда не денется, но теперь выигрывать в ней будут не только бесконечными бюджетами на память, но и красивой математикой.

Читают сейчас

Kuber Community Day возвращается

18 минут назад

Kuber Community Day возвращается

, привет! 30 июля в Москве и онлайн вновь состоится инженерная конференция Kuber Community Day. В этому году мероприятие станет масштабнее: больше участников, экспертизы и полезного общения. Участие о

«Дальнобойщики 2» вышли в Steam

20 минут назад

«Дальнобойщики 2» вышли в Steam

«Дальнобойщики 2» вышли в Steam. В магазине игра называется Hard Truck 2: King of the Road — русский язык на месте. Ознакомиться далее

INTEKEY вошла в топ-10 рынка WMS России с ростом +27% — и что рейтинг CNews сообщает обо всём рынке

30 минут назад

INTEKEY вошла в топ-10 рынка WMS России с ростом +27% — и что рейтинг CNews сообщает обо всём рынке

CNews в начальный раз посчитал поставщиков систем управления складом по выручке за 2025 год. INTEKEY — в десятке. Разбираем, что стоит за цифрами и куда движется сегмент складского софта. Коротко. CNe

GTA VI, предзаказ которой откроется 25 июня, будет стоит $80 за стандартное книга и $100 — за Ultimate

32 минуты назад

GTA VI, предзаказ которой откроется 25 июня, будет стоит $80 за стандартное книга и $100 — за Ultimate

Что ж, похоже, в этот раз переноса даты релиза не будет. GTA VI выйдет на последних поколениях PlayStation и Xbox 19 ноября, а оформить предзаказ можно будет уже через несколько часов. Впрочем, об это

Потребительские NVMe на Луне: Kioxia и HPE готовят Spaceborne Computer 4 к лунной миссии

1 час назад

Потребительские NVMe на Луне: Kioxia и HPE готовят Spaceborne Computer 4 к лунной миссии

Привет, ! На связи Selectel. Kioxia и HPE готовят к лунной миссии вычислительную систему Spaceborne Computer 4 с обычными потребительскими NVMe SSD на борту. Рассказываем, зачем на Луне LLM и почему д