17 марта 2026, 16:10
Mistral AI показала Leanstral: кодинг, который можно не проверять

Французская Mistral AI представила Leanstral – открытого ИИ-агента, который не просто генерирует, а ещё и формально доказывает корректность своих же творений. Это помощник, который работает в связке с инструментом формального доказательства Lean 4. Его проблема – помогать в “инженерии доказательств”, то есть строго проверять математические выкладки и программные спецификации.
В Mistral рассудили здраво: зачем нам просто “умная” нейросеть? Будущее – за агентами, которые умеют не только выполнять задачи, но и расписываться за каждую строчку, строго следуя спецификациям. Leanstral стал первым крупным шагом в этом направлении.
Leanstral построен на архитектуре состава экспертов (MoE), которую оптимизировали специально для задач доказательства. Секрет в том, что схема использует лишь часть своих параметров (активных – около 6 миллиардов), выбирая нужные экспертные модули для конкретной задачи. Это позволяет ей быть одновременно производительной и экономичной. За счёт тому что Lean выступает в роли идеального верификатора, Leanstral может параллельно генерировать и проверять кучу вариантов решений.
Авторы уже сравнили своего новичка с другими моделями. Для теста использовали бенчмарк FLTEval, который оценивает завершение формальных доказательств и корректное определение новых математических концепций.

Как видно на графике, даже самый мощный из открытых соперников, Qwen3.5 (397B-A17B), добрался до отметки 25,4 за 4 попытки. Leanstral же (притом что у него всего 120B параметров с учётом всех экспертов и 6B активных) за 2 попытки выдаёт 26,3, а за 4 попытки и вовсе улетает к 29,3.
Но самое интересное – это сравнение с коллегами из семейства Claude. Leanstral оказался не просто конкурентоспособным, а невероятно экономичным. Claude Sonnet 4.6 стоит 549 $ и выдаёт скромные 23,7 балла. Leanstral за 36 $ (pass@2) набирает 26,3 балла, обгоняя его почти на 3 пункта и одновременно оказываясь в 15 раз дешевле. Но Claude Opus 4.6 с его 39,6 балла всё ещё впереди.
Подробности на официальном сайте Mistral AI и в документации.
Читают сейчас

10 минут назад
В Steam одновременно вышли две инди-игры с одинаковым названием
В Steam практически одновременно появилось две никак не связанные друг с другом инди-игры с идентичным названием — Piece by Piece. Одновременно сами разработчики не стали конфликтовать, а решили извле

30 минут назад
Microsoft может отказаться от обязательных учётных записей в Windows 11
Некоторые высокопоставленные инженеры Microsoft выступили за функция отказа от обязательного использования учётных записей при входе в систему в Windows 11. Читать далее

1 час назад
Opensophy Hub — начальный open-source инициатива от Opensophy: гибридная система для документации с богатым Markdown
Opensophy выпустила свой начальный открытый open-source проект — Hub, гибридную SSG+SPA платформу для публикации технических знаний, статей и документации. Ознакомиться с проектом

1 час назад
НИЯУ МИФИ в партнёрстве с Яндекс Практикумом проводит День открытых дверей онлайн-магистратуры для DE, ML, CV и NLP
Привет, это команда Яндекс Практикума! Приглашаем вас на День открытых дверей онлайн-магистратуры «Специалист по работе с данными и применению ИИ» НИЯУ МИФИ в партнёрстве с Практикумом. На встрече мы

1 час назад
Инициатива Crypto.com заявил о сокращении приблизительно 12% сотрудников на фоне масштабного внедрения ИИ в бизнес-процессы
Криптовалютная система Crypto.com сократила приблизительно 12% своего персонала в связи с масштабного внедрения искусственного интеллекта в бизнес-процессы, сообщил основатель и генеральный директор п