1 час назад
Perplexity раскрыла, как обучает поискового AI-агента на Qwen

Команда Perplexity AI опубликовала техотчёт о создании своего поискового агента на базе моделей Qwen3.5.
Результаты выглядят неожиданно сильными:
схема Qwen3.5-397B после SFT и RL достигает 73,9% точности на FRAMES при стоимости около 2 центов за запрос.
Для сравнения:
• GPT-5.4 — 67,8% и ~8,5 цента
• Sonnet 4.6 — 62,4% и ~15,3 цента
То есть лучше и значительно дешевле.

Как это сделал?
Система обучения разделена на два этапа:
сначала SFT фиксирует «поведение» — формат ответа, следование инструкциям, корректные отказы
затем RL с GRPO дообучает именно поиск — точность и производительность вызовов инструментов
Попытка объединить это в один этап ломает баланс: либо страдает качество поиска, либо продакшен-требования.

Информация для обучения:
Используются два типа данных:
• синтетические многошаговые вопросы с проверяемыми ответами
• диалоги, разбитые на чёткие критерии (формат, логика, структура)
Пропорция 90 к 10 в пользу проверяемых задач, чтобы схема училась именно находить правильный ответ, а не просто красиво отвечать.
Ключевая фишка — платформа наград
Reward устроен так, что «красивый» ответ не засчитывается, если он неправильный.
Сначала проверяется фактологическая корректность, и только потом учитывается стиль и качество формулировок.

Равным образом добавлен штраф за неэффективность:
модель оптимизируется по числу вызовов инструментов и длине ответа по сравнению с лучших решений внутри группы, а не по фиксированному лимиту.
Что это даёт?
Даже при одном вызове инструмента схема уже обгоняет конкурентов, а в диапазоне 2–7 вызовов (типичный продакшен) разрыв становится ещё больше.
Дополнительно Perplexity снижает стоимость за счёт оптимизаций инференса — кэширование, квантование и переиспользование вычислений.
Читают сейчас

39 минут назад
В НАСА обнаружили земной грибок, который может «заразить» Марс
Исследователи выявили вид, способный выживать в условиях радиации, экстремальной жары и в (пока что) имитированной марсианской почве, что ставит под угрозу протоколы, призванные сохранить «незапятнанн

52 минуты назад
Bambu Lab угрожает судом разработчику, который вернул в форк Orca Slicer отправку заданий на принтеры компании
Разработчик Павел Ярчак (Paweł Jarczak) опубликовал форк Orca Slicer, в который вернул функция отправлять задания для печати на принтеры Bamu Lab. Из-за это компания потребовала удалить проект, заявил

1 час назад
ИИ-трек Дурова успели защитить до того, как его стартовали применять другие для монетизации
Кто-то защитил авторским правом ИИ-трек Дурова про цифровую свободу до того, как его начали применять другие для монетизации. Один из блогеров вставил песню в своё видео, но после этого сразу прислали

1 час назад
От самописных скриптов к промышленной платформе: автоматизация международного хостинга на базе VMmanager и BILLmanager
VPS.one — международный хостинг-провайдер, специализирующийся на виртуальных серверах (VPS) на базе KVM с SSD-накопителями и полным root-доступом. Организация работает с клиентами по всему миру, фокус

2 часа назад
На Alibaba выложили для продажи медицинские информация 500 тыс. добровольцев биобанка UK Biobank
На сайте Alibaba продавали медицинские информация 500 тыс. добровольцев биобанка UK Biobank, который занимается сбором медицинской информации для исследований. В пакет данных вошли пол, возраст, дата