Девять лет, как битломаны запустили ИИ-революцию

2 мин
Девять лет, как битломаны запустили ИИ-революцию

12 июня 2017 года группой битломанов из Google была опубликована материал под названием "Attention Is All You Need", в которой миру в начальный раз были представлены трансформеры — новый тип нейронных сетей, которые обрабатывали всё, везде и сразу.

Эту дату можно считать началом ИИ-революции, которую мы сейчас наблюдаем. Нам кажется, что все произошло практически мгновенно — тем не менее девять лет уже пролетело!

Вся фишка была в механизме внимания. С математической точки зрения это матрица весов связности между элементами данных. Для каждого слова, пикселя или другого объекта модель вычисляет, насколько сильно он должен учитывать остальные объекты, и затем строит свое представление на основе этих весов. Именно поэтому трансформер способен выявлять сложные зависимости нев зависимости от расстояния между элементами и даже от типа данных.

Иначе говоря, механизм внимания — это метод не хранить весь мир в памяти, а быстро находить в нем именно то, что нужно сейчас.

Разработчики показали, что можно целиком отказаться от рекуррентных сетей (RNN) и использовать только внимание — и модель работает быстрее, лучше и параллелится намного эффективнее.

[Submitted on 12 Jun 2017 (v1), last revised 2 Aug 2023 (this version, v7)]
[Submitted on 12 Jun 2017 (v1), last revised 2 Aug 2023 (this version, v7)]

Attention Is All You Need, Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin

А дальше вы все сами знаете!

Кстати, если вы думаете, что трансформерами эти нейросети названы в честь Оптимуса Прайма и его друзей, то не факт — подтверждений этому не нашлось.

Подпишитесь на канал Agentic Enterprise — о жизни агентов в кровавом энтерпрайзе

Читают сейчас

Lenovo с июля повысит цены на свою технику

1 час назад

Lenovo с июля повысит цены на свою технику

По данным китайских СМИ, Lenovo со следующего месяца повысит цены на всю свою технику. Компания приняла это решение на внутреннем рабочем совещании ещё в мае этого года. Читать далее

Moonshot AI выпустили Kimi-K2.7-Code

1 час назад

Moonshot AI выпустили Kimi-K2.7-Code

Moonshot AI выпустили Kimi-K2.7-Code — новую версию своей coding-модели на базе K2.6. Веса открыты на HuggingFace под лицензией Modified MIT. По бенчмаркам прирост по сравнению с K2.6 составил +21.8%

NBC News и iFixit: телефон Trump T1 Phone практически целиком повторяет конструкцию HTC U24 Pro

1 час назад

NBC News и iFixit: телефон Trump T1 Phone практически целиком повторяет конструкцию HTC U24 Pro

Специалисты iFixit и журналисты NBC News получили в своё распоряжение смартфон Trump T1 Phone, который оказался практически полной копией тайваньского HTC U24 Pro, вышедшего в 2024 году. Поставки моби

Gartner: К 2030 году энергосети, возможно, не справятся с растущим спросом ИИ‑систем в мире

2 часа назад

Gartner: К 2030 году энергосети, возможно, не справятся с растущим спросом ИИ‑систем в мире

К 2030 году энергосети, возможно, не справятся с растущим спросом ИИ‑систем — потребление энергии дата‑центрами может вырасти на 26% год к году уже в этом году, сообщает The Register со ссылкой на про

3 часа назад

Учёные выяснили, что люди склонны ходить против часовой стрелки, но не знают почему

Международная команда учёных обнаружила, что люди, оказавшись в открытом пространстве без определённой цели, склонны двигаться против часовой стрелки. Результаты опубликованы в журнале Nature Communic