Perplexity выложила отрытые эмбеддинг-модели

1 мин
Perplexity выложила отрытые эмбеддинг-модели

Perplexity представила pplx-embed – набор многоязыковых моделей для обработки больших объемов информации. Эти модели разработаны для работы с данными из интернета, обеспечивая альтернативу проприетарным программный оболочку.

Особенность новых моделей – использование двунаправленного внимания, позволяющего учитывать весь контекст текста, а не только предсказывать второй токен. ТРавным образом применяется диффузионное предварительное обучение, которое помогает модели выделять важную информацию из шумных данных.

В рамках инициативы представлены две версии моделей: одна оптимизирована для самостоятельных встраиваний и поисковых запросов, а вторая – для работы с большими документами, используемыми в системах RAG. Модели доступны в двух размерах (0.6B и 4B параметров) и поддерживают квантизацию INT8 для повышения эффективности.

В тестах MTEB и ConTEB флагманская 4B обошла профильные решения от Anthropic и Voyage. Обе модели доступны в размерах 0.6B и 4B на Hugging Face под лицензией MIT и через api Perplexity.

Читают сейчас

Представлен публике публичный инициатива CSVMusic для преобразования плейлистов из музыкальных сервисов в файлы с набором тегов

1 час назад

Представлен публике публичный инициатива CSVMusic для преобразования плейлистов из музыкальных сервисов в файлы с набором тегов

Состоялся выпуск открытого проекта под названием CSVMusic. Это подход для преобразования плейлистов из музыкальных сервисов в аудиофайлы с полным набором тегов. Исходный исходник проекта написан на Py

Версия LibreSSL 4.3.0

2 часа назад

Версия LibreSSL 4.3.0

18 апреля 2026 года состоялся выпуск криптографической библиотеки LibreSSL 4.3.0 (форка OpenSSL, который с 2014 года разрабатывается сообществом отдельно с целью модернизации кодовой базы, повышения б

xAI включает гиперскорость: Grok 4.3 уже в бете, 4.4 и 4.5 на подходе

8 часов назад

xAI включает гиперскорость: Grok 4.3 уже в бете, 4.4 и 4.5 на подходе

17 апреля xAI тихо выкатила Grok 4.3 в ранний бета-доступ, а днем позже Илон Маск опубликовал план дальнейших релизов: до конца мая размер модели вырастет втрое — с 0,5 до 1,5 триллиона параметров. Пр

Заключительный этап Всероссийской олимпиады школьников по математике проходит в Москве

11 часов назад

Заключительный этап Всероссийской олимпиады школьников по математике проходит в Москве

В Москве стартовал заключительный этап Всероссийской олимпиады школьников по математике. Ивент проходит на площадке Центрального университета и продлится до 20 апреля 2026 года. Всероссийская олимпиад

Робот пробежал полумарафон быстрее человека-рекордсмена

11 часов назад

Робот пробежал полумарафон быстрее человека-рекордсмена

Гуманоидный робот, победивший в воскресенье в Пекине полумарафон среди роботов, пробежал дистанцию быстрее человека-рекордсмена. Победитель от китайского производителя смартфонов Honor преодолел диста