16 июня 2026, 10:00

В топ рейтинга ИИ попала схема правительства Рио-де-Жанейро на основе Qwen

4 мин

На рынке LLM неожиданная смена лидеров. Бразильская IT-компания IplanRIO, принадлежащая правительству Рио-де-Жанейро, представила open-source новинку Rio 3.5 Open 397B.

Изначально заявлялось, что авторы дообучили китайскую Tongyi Qwen 3.5 от Alibaba и смогли создать подход, которое с ходу вошло в мировой топ-10 рейтинга ИИ, потеснив флагманские коммерческие системы — тем не менее за этим успехом скрывался совсем другой технический нюанс.

Архитектура и масштаб модели

Как схема привлекла внимание общественности? Все дело в масштабе модели — RIO 3.5 построена на базе архитектуры с 397 млрд параметров, и использует схему «Смеси экспертов». Во время генерации активируется часть параметров – 17 млрд на токен. Решение позволяет получить производительность моделей флагманского уровня, т.к. архитектура этой модели аналогична большинству самых успешных моделей.

Хоть основное соперничество в развитии нейросетей идет между Китаем и США, Бразилия громко заявила о себе — RIO развивается по схеме, приносящей успех многим открытым моделям: за базу берутся готовая архитектура и передовые наработки, которые затем модифицируются для повышения качества работы

Главные плюсы

Из основных плюсов (по заявлению разработчиков) можно выделить:

Интеграция SwiReasoning. Функция динамически переключаться между явным выводом и выводом в латентном пространстве для достижения оптимального баланса между точностью и эффективностью;
Отличные результаты в рассуждении, выполнении команд и многомодальных задачах, наравне с знаменитыми моделями;
Хорошо понимает многие языки — результаты на английском, китайском и более пятнадцати других языков на высоком уровне;
Лицензия MIT. Она снимает запреты с этого полностью открытого кода, такие как использование в коммерческих целях или изменение.

Ключевое, на мой взгляд, преимущество – огромная длина контекста. Rio 3.5 поддерживает контекст в один миллион токенов, что даёт возможность анализировать крупные тексты и большие объемы кода, исследовательские материалы и научные работы — все это без необходимости постоянно дробить информацию на части, как бывает в том же ChatGPT.

Облачная инфраструктура для ваших проектов

Виртуальные машины в Москве, Санкт-Петербурге и Новосибирске с оплатой по потреблению.

Подробнее →

Недостатки и требования к железу

Из недостатков можно отметить:

Слишком большая перегруженность модели – использовать такую архитектуру можно, но для этого требуется серьезные вычислительные ресурсы. Полноценный запускание такой модели остается недоступным для обывателей.

Чтобы запустить Rio 3.5 в оригинальном качестве (FP16), потребуется около 880 ГБ VRAM — это четыре серверных чипа Blackwell Ultra. Даже со сжатием (INT4) модели нужно не менее 220 ГБ видеопамяти, так что просто на домашнем ПК ее не развернуть.

Необкатанная схема — преимущества основаны на результатах тестировщиков и разработчиков, обычные пользователи пока не сложили мнения о модели.

Правда, почти сразу вспыхнул скандал. Исследователи из Nex-AGI заявили, что бразильцы модель вообще не обучали, а сделали чистый математический мерж весов оригинальной Qwen 3.5 и их собственной Nex-N2 Pro. Более того, когда у Rio стерли системный промпт, она начала отвечать: «Я — Nex». IplanRIO уже извинились на Hugging Face, сославшись на то, что инженеры случайно залили не тот файл.

Доказательство подмены весов: в ответах API модель rio-397b прямо называет себя чужим именем — Nex от Nex-AGI. Источник. — *Доказательство подмены весов: в ответах api модель* `rio-397b` *прямо называет себя чужим именем — Nex от Nex-AGI.* *Ресурс*.

Хоть схема за счет интеграции SwiReasoning и выдает результаты сильнее базовой Qwen 3.5, конкурируя по ряду тестов с закрытыми флагманами, до фундаментального технологического прорыва она не дотягивает. Однако бесконечно штамповать подобные решения без потери качества невозможно — этот блендинг сработал только благодаря близкой архитектурной генетике исходных моделей, чьи веса идеально подошли друг к другу.

Диаграмма бенчмарков от разработчиков Rio. Стоит учесть, что сравнение идет с закрытыми коммерческими версиями вроде Qwen 3.7 Plus, тогда как базовая модель Qwen 3.5 на графике намеренно отсутствует. Минимальный отрыв в ряде тестов находится в пределах погрешности и обусловлен внешней надстройкой SwiReasoning. Источник. — Диаграмма бенчмарков от разработчиков Rio. Стоит учесть, что сравнение идет с закрытыми коммерческими версиями вроде Qwen 3.7 Plus, тогда как базовая схема Qwen 3.5 на графике намеренно отсутствует. Минимальный отрыв в ряде тестов находится в пределах погрешности и обусловлен внешней надстройкой SwiReasoning. *Источник*.

Что в итоге

Теперь не только Китай удивляет своими интересными решениями в области ИИ, но и Бразилия. Хоть США и является лидером по выручке, монополия в области создания нейросетей сходит на нет. Благодаря открытым базовым моделям, новым методам дообучения и более эффективным архитектурам в борьбу за лидерство будут вступать новые игроки.

Время покажет, сможет ли IplanRIO выпустить свою финальную очищенную версию, но сам прецедент с Rio 3.5 уже стал предметом главных обсуждений в Кремниевой долине. История показала, что open-source сообщество способно мгновенно выводить на рынок сильные решения и так же быстро выводить их создателей на чистую воду, подпитывая огонь конкуренции среди больших языковых моделей.

Протестировать Rio 3.5 Open 397B уже можно через страницу модели на Hugging Face.

selectel ai ml open source IplanRIO Rio 3.5 Open LLM Alibaba Qwen

Читают сейчас

3 часа назад

Anthropic заявила о взломе систем трёх компаний со стороны Claude в тестах

Организация Anthropic сообщила, что внутреннее расследование выявило три инцидента, в процессе которых её модель ИИ Claude взломала системы трёх организаций во время проведения тестов кибербезопасност

4 часа назад

Amazon обнаружила перерасход по использованию ИИ в $1,8 млн в рамках одного проекта

Несколько внутренних отчётов Amazon демонстрируют, как искусственный интеллект приводит к перерасходу средств на разнообразные проекты. Так, в рамках одной инициативы он достиг $1,8 млн. Ознакомиться

4 часа назад

Claude во время кибер-оценок получил доступ к трём реальным организациям

Anthropic проверила 141 006 запусков CTF-оценок Claude и нашла три инцидента: в связи с ошибочной конфигурации среды у моделей был выход в интернет, хотя системная инструкция утверждала обратное. В ше

4 часа назад

Активисты стартовали уничтожать камеры Flock по всей территории США

СМИ сообщают, что граждане по всей территории США начали уничтожать умные камеры видеонаблюдения Flock Safety. Так, в штате Нью‑Йорк их срезали электропилами, в калифорнийском Окленде разрисовывали

4 часа назад

Исследование: мозг человека может перестроиться для многозадачности

В исследовании учёных из Медицинского центра Джорджтаунского университета в США показано, что люди могут переводить определённые задачи в «режим автопилота», чтобы приблизиться к настоящей многозадачн