1 час назад
Sakana AI выпустили Fugu Ultra: японская LLM обходит часть западных флагманов

Sakana AI основали в 2023 году Дэвид Ха и Лайон Джонс, экс-инженеры Google, причём Джонс входит в число восьми авторов оригинальной статьи про трансформеры. В апреле организация уже показывала Marlin: агента, который самостоятельно копает тему до 8 часов и выдаёт отчёт с презентацией.
Fugu стал их следующим продуктом с уже знакомой идеей «несколько моделей вместо одной». Но это не просто агрегатор поверх чужих api: сама Fugu остаётся маленький языковой моделью, обученной вызывать другие LLM. То есть вместо того чтобы вручную прописывать механизмы, роли и рабочие процессы моделей, как это обычно делают, Sakana обучили модельку, которая решает, кого вызвать, в какой роли и с какими подзадачами, и делает это адаптивно под конкретный запрос.

Fugu Ultra работает иначе. Она генерирует на естественном языке целый workflow: делит задачу на подзадачи, распределяет их по нескольким моделям и сама может выступить одним из воркеров, то есть рекурсивно вызвать себя.
На бенчмарках Fugu Ultra обходит Opus 4.8 на LiveCodeBench. На GPQA-Diamond она выходит на уровень Mythos Preview. А вот на SWE-Bench Pro и Humanity's Last Exam впереди именно Fable 5.
Русскоязычное сообщество про AI в разработке

Друзья! Эту новость подготовила команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-агентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!
Читают сейчас

3 минуты назад
Postgres Professional выпускает Postgres Pro Standard 18.4.1 со встроенной отказоустойчивостью BiHA
Компания Postgres Professional представила очередное обновление своей системы управления базами данных — Postgres Pro Standard 18.4.1. Ключевым нововведением этого выпуска стала встраивание технологии

7 минут назад
Собрали экспертов Test IT на разговор про ИИ в тестировании: разговор “Без багов” №14
24 июня в 18:00 Test IT проводит свежий выпуск профессиональной онлайн-серии разговор «Без багов»: Все свои. ИИ-трансформация тестирования — реальные инструменты, роли и ошибки. На этот раз в фокусе —

7 минут назад
Есть ли вы в весах нейросетей? Запущен веб-сайт, который это проверяет без поиска в сети
Загуглить собственное имя в 2026 году уже не то развлечение, что раньше: все больше людей узнают друг о друге не из поисковика, а из чатботов. На этой мысли построен новый веб-сайт In the Weights — он

48 минут назад
В США Tesla врезалась в жилой дом; водитель объявил, что машина была на автопилоте
В Техасе Tesla Model 3 врезалась в жилой дом. Автомобиль протаранил стену и, въехав прямо в гостиную, сбил владелицу дома, которая позже скончалась в больнице. По словам водителя, Tesla в этот момент

52 минуты назад
Запущен средство сравнения редакций PostgreSQL и Tantor Postgres
Интерактивная веб-страница объединяет информацию о возможностях разных версий и редакций СУБД Tantor Postgres и PostgreSQL, помогает сопоставлять их по функциональным направлениям без необходимости об