28 апреля 2026, 10:10
Новую LLM talkie обучили на текстах до 1931 года
Трое ИИ-исследователей, включая Алека Редфорда (соавтора GPT 1.0), опубликовали новую языковую модель talkie с 13 миллиардами параметров. Она обучена исключительно на текстах, опубликованных до 1931 года, так что и знания о мире у неё заканчиваются этим годом, и в стилистике текста она отталкивается от старых источников. Пообщаться с ней можно на официальном сайте.
Создатели модели отмечают, что она полезна в различных исследовательских целях:
Можно с её помощью исследовать, насколько LLM способны прогнозировать. Поскольку нам уже известны события после 1931-го, можем оценивать, получится ли у модели правильно предположить что-либо о них.
Можно смотреть, насколько способна схема в областях, отсутствовавших в её обучающем датасете. Эта LLM изначально не знает ничего про исходник. Что будет, если объяснять ей в промптах и просить что-то сделать? Оказывается, что в некоторых случаях у неё получилось давать правильные ответы на Python, когда речь о простых однострочниках.

Также в её случае полезно отсутствие проблемы контаминации. Модели, обученные на всём содержании интернета, могут знать многое о тех бенчмарках, с помощью которых их оценивают, и «подстраиваться» под правильные результаты. В результате у людей возникает искажённое и завышенное представление об их возможностях моделей. А у talkie нет информации о бенчмарках, что даёт возможность проводить замеры точнее.
Авторы отмечают, что можно будет ещё больше понять, если сравнить ретро-модели разных размеров. Поэтому они намерены в будущем обучать новые с большим количеством параметров.
Читают сейчас

17 минут назад
В Китае для проверки состояния высоковольтных линий электропередачи стартовали применять робота в виде змеи
На юго-западе Китая начали использовать робота в виде змеи для осмотра высоковольтных линий электропередач и обеспечения стабильного электроснабжения во время национальных вступительных экзаменов в ву

1 час назад
В OpenIDE появилась сопровождение PHP
В OpenIDE добавили бета-версию PHP-плагина для OpenIDE. Автодополнение, навигация, отладка, сопровождение Laravel, Symfony и других фреймворков, внешние анализаторы: всё это уже работает в OpenIDE. Чи

1 час назад
Deezer запустил механизм обнаружения сгенерированной музыки для других стриминговых сервисов
Сервис Deezer запустил механизм обнаружения сгенерированной искусственным интеллектом музыки для других стриминговых платформ. Система будет сканировать плейлисты пользователей в 19 сервиса, в том чис

2 часа назад
Встраивание PVS-Studio в SourceCraft
Мы проверили техническую совместимость PVS-Studio с этой платформой и описали процедура её использования в нашей документации. Теперь все находки анализатора можно обрабатывать в интерфейсе SourceCraf

2 часа назад
Claude Fable 5 взломали за 72 часа, системный промпт — в открытом репозитории
История уложилась в некоторое количество дней и бьёт сразу по двум болевым точкам: насколько реально «непробиваемы» защитные классификаторы фронтир-моделей и что вендор может делать с моделью без ведо