В топ рейтинга ИИ попала схема правительства Рио-де-Жанейро на основе Qwen

4 мин
В топ рейтинга ИИ попала схема правительства Рио-де-Жанейро на основе Qwen

На рынке LLM неожиданная смена лидеров. Бразильская IT-компания IplanRIO, принадлежащая правительству Рио-де-Жанейро, представила open-source новинку Rio 3.5 Open 397B. 

Изначально заявлялось, что авторы дообучили китайскую Tongyi Qwen 3.5 от Alibaba и смогли создать подход, которое с ходу вошло в мировой топ-10 рейтинга ИИ, потеснив флагманские коммерческие системы — тем не менее за этим успехом скрывался совсем другой технический нюанс.

Архитектура и масштаб модели

Как схема привлекла внимание общественности? Все дело в масштабе модели — RIO 3.5 построена на базе архитектуры с 397 млрд параметров, и использует схему «Смеси экспертов». Во время генерации активируется часть параметров – 17 млрд на токен. Решение позволяет получить производительность моделей флагманского уровня, т.к. архитектура этой модели аналогична большинству самых успешных моделей.

Хоть основное соперничество в развитии нейросетей идет между Китаем и США, Бразилия громко заявила о себе — RIO развивается по схеме, приносящей успех многим открытым моделям: за базу берутся готовая архитектура и передовые наработки, которые затем модифицируются для повышения качества работы

Главные плюсы

Из основных плюсов (по заявлению разработчиков) можно выделить:

  • Интеграция SwiReasoning. Функция динамически переключаться между явным выводом и выводом в латентном пространстве для достижения оптимального баланса между точностью и эффективностью;

  • Отличные результаты в рассуждении, выполнении команд и многомодальных задачах, наравне с знаменитыми моделями; 

  • Хорошо понимает многие языки — результаты на английском, китайском и более пятнадцати других языков на высоком уровне;

  • Лицензия MIT. Она снимает запреты с этого полностью открытого кода, такие как  использование в коммерческих целях или изменение.

Ключевое, на мой взгляд, преимущество – огромная длина контекста. Rio 3.5 поддерживает контекст в один миллион токенов, что даёт возможность анализировать крупные тексты и большие объемы кода, исследовательские материалы и научные работы — все это без необходимости постоянно дробить информацию на части, как бывает в том же ChatGPT. 

Облачная инфраструктура для ваших проектов

Виртуальные машины в Москве, Санкт-Петербурге и Новосибирске с оплатой по потреблению.

Подробнее →

Недостатки и требования к железу

Из недостатков можно отметить:

Слишком большая перегруженность модели – использовать такую архитектуру можно, но для этого требуется серьезные вычислительные ресурсы. Полноценный запускание такой модели остается недоступным для обывателей.

Чтобы запустить Rio 3.5 в оригинальном качестве (FP16), потребуется около 880 ГБ VRAM — это четыре серверных чипа Blackwell Ultra. Даже со сжатием (INT4) модели нужно не менее 220 ГБ видеопамяти, так что просто на домашнем ПК ее не развернуть.

Необкатанная схема — преимущества основаны на результатах тестировщиков и разработчиков, обычные пользователи пока не сложили мнения о модели.

Правда, почти сразу вспыхнул скандал. Исследователи из Nex-AGI заявили, что бразильцы модель вообще не обучали, а сделали чистый математический мерж весов оригинальной Qwen 3.5 и их собственной Nex-N2 Pro. Более того, когда у Rio стерли системный промпт, она начала отвечать: «Я — Nex». IplanRIO уже извинились на Hugging Face, сославшись на то, что инженеры случайно залили не тот файл. 

Доказательство подмены весов: в ответах api модель rio-397b прямо называет себя чужим именем — Nex от Nex-AGI. Ресурс.

Хоть схема за счет интеграции SwiReasoning и выдает результаты сильнее базовой Qwen 3.5, конкурируя по ряду тестов с закрытыми флагманами, до фундаментального технологического прорыва она не дотягивает. Однако бесконечно штамповать подобные решения без потери качества невозможно — этот блендинг сработал только благодаря близкой архитектурной генетике исходных моделей, чьи веса идеально подошли друг к другу. 

Диаграмма бенчмарков от разработчиков Rio. Стоит учесть, что сравнение идет с закрытыми коммерческими версиями вроде Qwen 3.7 Plus, тогда как базовая схема Qwen 3.5 на графике намеренно отсутствует. Минимальный отрыв в ряде тестов находится в пределах погрешности и обусловлен внешней надстройкой SwiReasoning. Источник.

Что в итоге

Теперь не только Китай удивляет своими интересными решениями в области ИИ, но и Бразилия. Хоть США и является лидером по выручке, монополия в области создания нейросетей сходит на нет. Благодаря открытым базовым моделям, новым методам дообучения и более эффективным архитектурам в борьбу за лидерство будут вступать новые игроки. 

Время покажет, сможет ли IplanRIO выпустить свою финальную очищенную версию, но сам прецедент с Rio 3.5 уже стал предметом главных обсуждений в Кремниевой долине. История показала, что open-source сообщество способно мгновенно выводить на рынок сильные решения и так же быстро выводить их создателей на чистую воду, подпитывая огонь конкуренции среди больших языковых моделей.

Протестировать Rio 3.5 Open 397B уже можно через страницу модели на Hugging Face

Читают сейчас

Выпущена СУБД Tantor Postgres 18.3.0 с передовыми функциями для высоконагруженных бизнес-приложений

15 минут назад

Выпущена СУБД Tantor Postgres 18.3.0 с передовыми функциями для высоконагруженных бизнес-приложений

В новую версию включены как возможности PostgreSQL 18 и 18.3.0, так и собственные разработки, часть которых уже применяется в флагманских инфраструктурных решениях для высоконагруженных корпоративных

Встреча «CyberTeam Meetup: Blue х Red»

17 минут назад

Встреча «CyberTeam Meetup: Blue х Red»

Привет, ! 25 июня проведем офлайн-митап «CyberTeam Meetup: Blue х Red». В кругу ИБ-практиков обменяемся опытом, разберем реальные кейсы и посмотрим на привычные задачи под другим углом. Вас ждут 2 док

Китайские вузы отказались от 12 тыс. гуманитарных специальностей и открыли 10 тыс. в сфере ИИ и технологий

21 минуту назад

Китайские вузы отказались от 12 тыс. гуманитарных специальностей и открыли 10 тыс. в сфере ИИ и технологий

С 2021 по 2025 год китайские университеты отказались от более 12 тыс. программ бакалавриата. Под сокращение попали преимущественно гуманитарные направления — будущие учителя английского языка, журнали

Fox покупает стриминговую платформу Roku за $22 млрд

35 минут назад

Fox покупает стриминговую платформу Roku за $22 млрд

Американский медиаконгломерат Fox Corporation объявил о приобретении стриминговой платформы Roku за $22 млрд. Стороны планируют завершить сделку в следующем году. Ознакомиться далее

Выпуск Firefox 152.0

36 минут назад

Выпуск Firefox 152.0

16 июня 2026 года состоялся релиз стабильной версии Firefox 152.0 с улучшениями и обновлениями, а равным образом с исправлениями ошибок и багов, обнаруженных в прошлой стабильной версии. Версия проект