2 часа назад
Свежий 3-битный механизм Google заставил сегмент переоценить ИИ-индустрию

Индустрия искусственного интеллекта годами развивалась по пути грубой силы — бесконечного наращивания вычислительных мощностей. Но когда физические пределы «железа» стали очевидны, в игру вернулась чистая математика.
В среду, 25 марта 2026 года, на биржах произошла аномалия. Пока индекс Nasdaq уверенно рос, акции гигантов индустрии памяти — Micron, Western Digital, Seagate, а равным образом производителей оборудования Lam Research и Applied Materials — синхронно ушли в минус. Триггером стала не геополитика и не сбои в логистике, а публикация одной научной статьи от Google Research.
Команда инженеров Google представила TurboQuant — механизм, способный сжать так называемый KV-кэш (память, в которой нейросеть удерживает контекст диалога) до 3 бит. И самое важное: механизм не снижает точность ответов и ускоряет вычисления в 8 раз на чипах NVIDIA H100.
До этого момента индустрия решала проблему огромных контекстов грубой силой: просто закупала всё больше дорогих чипов памяти. Инженеры Google предложили альтернативу — перестать раздувать аппаратные мощности и переписать саму математику работы ИИ с данными.
Квантование полярных координат
В основе TurboQuant лежит отказ от привычных систем координат. Современные алгоритмы теряют критически важные информация, когда пытаются сжать информацию сильнее 4 бит. Google обошла этот барьер с помощью квантования полярных координат PolarQuant.
Вместо того чтобы хранить тяжелые многомерные координаты данных, алгоритм переводит их в полярную систему — запоминает только радиус и угол. Оказалось, что для нейросетей направление вектора куда важнее точного расстояния. А неизбежные при таком жестком сжатии ошибки механизм аккуратно сглаживает дополнительным модулем QJL (Quantized Johnson-Lindenstrauss) — он просто прячет лишний «шум» в безопасное математическое пространство, где тот не мешает вычислениям.
Этот изящный трюк создает неожиданную проблему даже для гегемона рынка — NVIDIA. Софтверный буст делает их текущие чипы H100 настолько эффективными, что клиенты могут решить подождать и отложить закупку новых, более дорогих процессоров.
Реакция рынка
Торговые алгоритмы Уолл-стрит отреагировали прямолинейно: если Google в шесть раз сокращает потребность ИИ в памяти, значит, дата-центрам больше не нужно скупать SSD и чипы в прежних объемах.
Однако аналитики Morgan Stanley призывают не паниковать. Они называют долгосрочный эффект для производителей железа «нейтрально-позитивным». Срабатывает парадокс Джевонса: когда источник становится использовать проще и дешевле, его потребление не падает, а наоборот — взлетает.
Падение требований к памяти сильно удешевит запускание ИИ. Нейросети, которым раньше требовались целые серверные стойки, теперь смогут функционировать локально или на дешевом оборудовании. Это не убьет спрос на кремний, а откроет двери для тысяч новых проектов, которые раньше были просто не по карману.
Официально TurboQuant покажут в апреле на конференции ICLR 2026 в Рио-де-Жанейро. И, кажется, это отличный сигнал: индустрия ИИ перестает решать все проблемы исключительно грубой силой. Гонка «железа» никуда не денется, но теперь выигрывать в ней будут не только бесконечными бюджетами на память, но и красивой математикой.
Читают сейчас

11 минут назад
Столько получили исследователи за найденные уязвимости
Проверять защита наших сервисов и ресурсов помогают независимые эксперты — багхантеры на платформе BI.ZONE. Мы постоянно расширяем области тестирования и, конечно, увеличиваем награды. Вот немного циф

14 минут назад
В Польше отбили кибератаку на основной ядерный исследовательский центр
В Польше сообщили о кибератаке на Национальный центр ядерных исследований — это ключевой ядерный исследовательский объект страны, где работает реактор MARIA. По данным самого центра, атаку удалось быс
15 минут назад
Microsoft исправила ошибку синхронизации с Gmail в классическом Outlook
Microsoft исправила ошибку классического Outlook, которая не позволяла синхронизировать контент учётных записей с Gmail и Yahoo. Ознакомиться далее
35 минут назад
Google представила свежий ИИ-алгоритм сжатия памяти TurboQuant
Исследователи искусственного интеллекта Google представили TurboQuant, свежий сверхэффективный алгоритм сжатия памяти для ИИ на основе векторного квантования. Читать далее

49 минут назад
Раскрыты детали по уязвимости для удалённой DoS-атаки в FreeBSD через TCP
26 марта 2026 года команда проекта FreeBSD раскрыла детали ранее обнаруженной веб уязвимости для проведения удалённого эксплуатируемого вектора DoS-атаки (утечка mbuf) через TCP. Ознакомиться далее