Новую LLM talkie обучили на текстах до 1931 года

2 мин

Трое ИИ-исследователей, включая Алека Редфорда (соавтора GPT 1.0), опубликовали новую языковую модель talkie с 13 миллиардами параметров. Она обучена исключительно на текстах, опубликованных до 1931 года, так что и знания о мире у неё заканчиваются этим годом, и в стилистике текста она отталкивается от старых источников. Пообщаться с ней можно на официальном сайте.

Создатели модели отмечают, что она полезна в различных исследовательских целях:

  • Можно с её помощью исследовать, насколько LLM способны прогнозировать. Поскольку нам уже известны события после 1931-го, можем оценивать, получится ли у модели правильно предположить что-либо о них.

  • Можно смотреть, насколько способна схема в областях, отсутствовавших в её обучающем датасете. Эта LLM изначально не знает ничего про исходник. Что будет, если объяснять ей в промптах и просить что-то сделать? Оказывается, что в некоторых случаях у неё получилось давать правильные ответы на Python, когда речь о простых однострочниках.

Также в её случае полезно отсутствие проблемы контаминации. Модели, обученные на всём содержании интернета, могут знать многое о тех бенчмарках, с помощью которых их оценивают, и «подстраиваться» под правильные результаты. В результате у людей возникает искажённое и завышенное представление об их возможностях моделей. А у talkie нет информации о бенчмарках, что даёт возможность проводить замеры точнее.

Авторы отмечают, что можно будет ещё больше понять, если сравнить ретро-модели разных размеров. Поэтому они намерены в будущем обучать новые с большим количеством параметров.

Читают сейчас

В Китае для проверки состояния высоковольтных линий электропередачи стартовали применять робота в виде змеи

17 минут назад

В Китае для проверки состояния высоковольтных линий электропередачи стартовали применять робота в виде змеи

На юго-западе Китая начали использовать робота в виде змеи для осмотра высоковольтных линий электропередач и обеспечения стабильного электроснабжения во время национальных вступительных экзаменов в ву

В OpenIDE появилась сопровождение PHP

1 час назад

В OpenIDE появилась сопровождение PHP

В OpenIDE добавили бета-версию PHP-плагина для OpenIDE. Автодополнение, навигация, отладка, сопровождение Laravel, Symfony и других фреймворков, внешние анализаторы: всё это уже работает в OpenIDE. Чи

Deezer запустил механизм обнаружения сгенерированной музыки для других стриминговых сервисов

1 час назад

Deezer запустил механизм обнаружения сгенерированной музыки для других стриминговых сервисов

Сервис Deezer запустил механизм обнаружения сгенерированной искусственным интеллектом музыки для других стриминговых платформ. Система будет сканировать плейлисты пользователей в 19 сервиса, в том чис

Встраивание PVS-Studio в SourceCraft

2 часа назад

Встраивание PVS-Studio в SourceCraft

Мы проверили техническую совместимость PVS-Studio с этой платформой и описали процедура её использования в нашей документации. Теперь все находки анализатора можно обрабатывать в интерфейсе SourceCraf

Claude Fable 5 взломали за 72 часа, системный промпт — в открытом репозитории

2 часа назад

Claude Fable 5 взломали за 72 часа, системный промпт — в открытом репозитории

История уложилась в некоторое количество дней и бьёт сразу по двум болевым точкам: насколько реально «непробиваемы» защитные классификаторы фронтир-моделей и что вендор может делать с моделью без ведо