Google тестирует новые чипы для ИИ

5 мин
Google тестирует новые чипы для ИИ

За некоторое количество месяцев чипы Google с искусственным интеллектом стали одним из самых востребованных товаров в технологическом секторе. Ведущие авторы в области искусственного интеллекта, в том числе некоторые из главных конкурентов компании, закупают их в больших количествах.

Google готовит новое поколение AI-чипов TPUv8, которое будет разделено на два специализированных решения. Линейка заменит текущее поколение TPUv7 и сосредоточится на разделении задач между обучением и инференсом.

Чип TPUv8i под кодовым названием Zebrafish будет ориентирован на инференс и разрабатывается при участии MediaTek. Одновременно TPUv8t (Sunfish) предназначен для обучения моделей и создается совместно с Broadcom. Такой подход даёт возможность оптимизировать эффективность и стоимость для разных типов AI-нагрузок.

Обе модели будут тесно интегрированы с процессорами Axion на архитектуре Arm. Новая стратегия отражает стремление Google повысить эффективность своих дата-центров и укрепить позиции в сегменте специализированных AI-ускорителей.

По ходу роста спроса на быструю обработку запросов к искусственному интеллекту «становится целесообразным специализироваться на чипах, предназначенных либо для обучения, либо для логического вывода», — объявил в интервью основной научный сотрудник Google Джефф Дин. «Мы рассматриваем целый ряд различных вариантов», — внедрил он, в том числе возможность повысить скорость получения результатов работы ИИ.

Графические процессоры Nvidia остаются золотым стандартом для искусственного интеллекта, особенно для обучения более продвинутых моделей. Тем не менее все больше перспективных компаний пытаются составить конкуренцию этому производителю чипов в области логического вывода, в том числе предлагая чипы, призванные сократить время отклика чат-ботов и агентов искусственного интеллекта. В прошлом месяце Nvidia начала продавать чип, предназначенный для более быстрого логического вывода на основе технологии, которую компания приобрела у Groq в рамках лицензионной сделки на сумму 20 миллиардов долларов.

«Поле битвы смещается в сторону логического вывода», — сообщает Чираг Декате, аналитик из Gartner, отмечая, что, по его опыту, модель Gemini от Google быстрее всего справляется со сложными задачами, требующими логических рассуждений. «В этой сфере у Google есть преимущество в инфраструктуре».

В соответствии с заявлению Натали Серрино, соучредителя Gimlet Labs, стартапа, разрабатывающего программное обеспечение для распределения задач искусственного интеллекта между наиболее подходящими для каждой из них чипами, современные TPU уже сейчас являются отличным выбором для обработки результатов работы новых ИИ-агентов, которые выполняют более сложные задачи от имени пользователя. «Это очень хорошие инструменты для растущих объемов работы», — сказала она.

В октябре усилия Google по разработке чипов, которые велись уже давно, вновь привлекли к себе внимание, когда организация Anthropic PBC — один из самых известных разработчиков искусственного интеллекта — объявила о расширении соглашения на доступ к до 1 миллиону тензорных процессоров. В следующем месяце Google представила более совершенную схема Gemini 3, обученную и работающую на тензорных процессорах, которая получила восторженные отзывы.

С тех пор спрос на чипы Google со стороны крупных компаний только вырос. Meta Platforms Inc. заключила многомиллиардную сделку на использование TPU через Google Cloud на несколько лет. Организация только что получила доступ к первой крупной партии чипов и тестирует их, чтобы понять, для каких задач они лучше всего подходят, сообщил Сантош Джанардхан, руководитель отдела инфраструктуры Meta. «Похоже, что у них действительно есть преимущества в логическом выводе», — сказал он, отметив при этом, что «ни одна новая система не обходится без трудностей и периода адаптации».

Anthropic также заключила сделку с Broadcom Inc., партнером Google по TPU, на поставку чипов, которые позволят компании использовать вычислительную мощность около 3,5 гигаватт, начиная с 2027 года.

Citadel Securities планирует представить на конференции Google отчёт о том, как TPU позволяют компании обучать модели быстрее, чем при использовании графических процессоров. По словам Талала Аль-Каисси, временного генерального директора Core42, облачного подразделения технологического конгломерата из Абу-Даби, компания G42 провела «множество переговоров» с Google об использовании своих тензорных процессоров. «Я настроен оптимистично», — сказал Аль-Каисси о переговорах.

Новейшая версия чипа TPU от Google
Новейшая версия чипа TPU от Google

Google уже предпринимает новые шаги, чтобы идти навстречу клиентам. Компания тестирует возможность предоставления таким компаниям, как Anthropic, доступа к некоторым из своих TPU в собственных центрах обработки данных, а не на объектах Google. По словам Вахдата, это также позволит клиентам TPU применять сторонние инструменты, такие как PyTorch, а равным образом другое программное обеспечение для планирования, а не полагаться исключительно на продукты Google.

Помимо этого, Google создала системы для более быстрого выявления производственных дефектов, которые могут оказывать огромное влияние на программное обеспечение. По словам Пола Бархэма, выдающегося ученого Google, который является одним из руководителей команды разработчиков инфраструктуры Gemini, при работе с чипами-ускорителями искусственного интеллекта, которые выполняют огромное количество математических операций, даже незначительный ошибка может привести к «полному самоуничтожению» модели. По его словам, подобная проблема возникла в Google приблизительно двух лет назад, и на ее устранение ушли недели. Он назвал такие сбои «адскими ошибками».

«Теперь нам нужно проделать то же самое с сотнями тысяч микросхем ускорителя за 10 секунд», — сказал он.

Вопреки свой опыт в разработке искусственного интеллекта, Google сталкивается с той же проблемой, что и другие производители чипов: на разработку чипов от начала и до конца обычно уходит около трех лет, но модели искусственного интеллекта развиваются гораздо быстрее. В связи с этого сложно предсказать, что будет востребовано у клиентов через несколько лет.

«Если кто-то утверждает, что знает, как будет выглядеть Gemini 10, я говорю: «Пожалуйста, поделитесь со мной тем, что вы курите», — сказал Ранганатан.

Бархэм равным образом обеспокоен тем, что тесная обратная связь между разработчиками моделей искусственного интеллекта и проектировщиками аппаратного обеспечения может привести к тому, что новые идеи останутся незамеченными. По его словам, «этот цикл загоняет вас в ловушку, заставляя применять то, что хорошо работает на текущем программном и аппаратном обеспечении».

По мере роста популярности чипов Google компания рискует столкнуться с проблемами с поставками, как и Nvidia. Один из руководителей стартапа рассказал, что использование TPU в их компании ограничено из-за их нехватки, и пожаловался, что Google практически отдала все свои чипы компании Anthropic.

Читают сейчас

Microsoft приобрела стартап-компания Fintool, чтобы расширить возможности Excel с помощью финансовых ИИ-агентов

16 минут назад

Microsoft приобрела стартап-компания Fintool, чтобы расширить возможности Excel с помощью финансовых ИИ-агентов

Microsoft приобрела американский стартап Fintool, который специализируется на разработке инструментов на базе искусственного интеллекта для финансовых специалистов. Сделка должна позволить корпорации

24 апреля приглашаем тестировщиков на встреча QA Кухня в Уфе

17 минут назад

24 апреля приглашаем тестировщиков на встреча QA Кухня в Уфе

24 апреля приглашаем тестировщиков на митап QA Кухня в Уфе! Вас ждёт вечер QAчественных рецептов от экспертов из ГНИВЦ! Спикеры расскажут, что происходит на QA-кухне. Темы подойдут как джунам, так и с

ITFB Group усилила экспертизу в проектировании и строительстве ЦОД и инженерной инфраструктуры

46 минут назад

ITFB Group усилила экспертизу в проектировании и строительстве ЦОД и инженерной инфраструктуры

ITFB Group, объявила о значительном усилении компетенций в области построения центров обработки данных (ЦОД) и инженерных систем зданий. Компания выводит на рынок комплексные решения «под ключ», включ

НАСА отключило очередной гаджет «Вояджера-1», чтобы продлить его работу

55 минут назад

НАСА отключило очередной гаджет «Вояджера-1», чтобы продлить его работу

Почти полвека назад космический аппарат размером примерно с небольшой легковой автомобиль стартовал с побережья Флориды на ракете, чтобы начать путешествие, которое, как предполагалось, должно было дл

Эксперты раскритиковали правила блокировки сайтов в ряде стран ЕС

1 час назад

Эксперты раскритиковали правила блокировки сайтов в ряде стран ЕС

Независимый аналитический центр CEPS опубликовал доклад, в котором раскритиковал меры по блокировке сайтов по обращениям правообладателей в некоторых странах ЕС. Разработчики исследования пришли к выв