28 апреля 2026, 10:10

Новую LLM talkie обучили на текстах до 1931 года

2 мин

Трое ИИ-исследователей, включая Алека Редфорда (соавтора GPT 1.0), опубликовали новую языковую модель talkie с 13 миллиардами параметров. Она обучена исключительно на текстах, опубликованных до 1931 года, так что и знания о мире у неё заканчиваются этим годом, и в стилистике текста она отталкивается от старых источников. Пообщаться с ней можно на официальном сайте.

Создатели модели отмечают, что она полезна в различных исследовательских целях:

Можно с её помощью исследовать, насколько LLM способны прогнозировать. Поскольку нам уже известны события после 1931-го, можем оценивать, получится ли у модели правильно предположить что-либо о них.
Можно смотреть, насколько способна схема в областях, отсутствовавших в её обучающем датасете. Эта LLM изначально не знает ничего про исходник. Что будет, если объяснять ей в промптах и просить что-то сделать? Оказывается, что в некоторых случаях у неё получилось давать правильные ответы на Python, когда речь о простых однострочниках.

Также в её случае полезно отсутствие проблемы контаминации. Модели, обученные на всём содержании интернета, могут знать многое о тех бенчмарках, с помощью которых их оценивают, и «подстраиваться» под правильные результаты. В результате у людей возникает искажённое и завышенное представление об их возможностях моделей. А у talkie нет информации о бенчмарках, что даёт возможность проводить замеры точнее.

Авторы отмечают, что можно будет ещё больше понять, если сравнить ретро-модели разных размеров. Поэтому они намерены в будущем обучать новые с большим количеством параметров.

LLM

Читают сейчас

2 часа назад

Midjourney купила стартап-компания в области астрологии Co‑Star и разрабатывает собственное программа

ИИ‑лаборатория Midjourney приобрела стартап-компания Co‑Star — разработчика социального астрологического приложения. Co‑Star с 4,3 млн ежемесячных пользователей позволяет строить натальные карты, полу

2 часа назад

NHTSA: Tesla поставила рекорд по числу ДТП с участием автопилота — 207 инцидентов за месяц

Автомобили Tesla с системами помощи водителю 207 раз попадали в ДТП в мае 2026 года. Согласно данным Национального управления безопасности дорожного движения США (NHTSA), это рекордное число за месяц

3 часа назад

Microsoft представила две новые модели MAI и постепенно заменяет ими OpenAI в собственных сервисах

Microsoft AI анонсировала две новые модели: MAI‑Image-2.5-Pro для генерации изображений и MAI‑Voice-2-Flash для синтеза речи. Обе уже доступны разработчикам через Azure AI Foundry и песочницу MAI Play

3 часа назад

МВД сообщило о задержании в Новосибирской области группы рассыльщиков Android‑вирусов

В Новосибирской области полицейские задержали группу подозреваемых, которые, по версии следствия, распространяли вредоносное ПО для Android‑устройств, получали доступ к аккаунтам пользователей и оформ

3 часа назад

Суд признал законным увольнение сотрудницы московской компании за отправку данных в DeepSeek и на личную почту

Топ‑менеджера московской инженерной компании уволили за разглашение коммерческой тайны, в том числе через нейросеть DeepSeek. Женщина в суде безуспешно пыталась получить от фирмы «золотой парашют», со