
18 апреля 2026, 18:15
Alibaba vs Google: Qwen3.6-35B-A3B обходит Gemma 4-31B в кодинге, эрудиции и математике
Опенсорсная схема Qwen3.6-35B-A3B, которая имеет архитектуру mixture-of-experts и была опубликована Alibaba 15 апреля, уверенно обошла недавнюю новинку от Google, Gemma 4-31B, в ключевых бенчмарках на

18 апреля 2026, 18:14
Opus 4.7 vs Opus 4.6 на Veai Agent Benchmark
Anthropic выкатили новую версию — мы не стали ждать и прогнали внутренний тест производительности на боевых workflow: миграция, рефакторинг, тесты, документация. Читать далее

17 апреля 2026, 21:29
Утечка: DeepSeek V4 обходит Gemini 3.1 Pro, GPT-5.3 и Claude Opus 4.6 по всем 12 бенчмаркам
В сети появились предполагаемые информация технического отчёта DeepSeek V4 – таблица с результатами на 12 популярных бенчмарках. Автор твита под ником @xiangxiang103 опубликовал скриншоты, на которых
3 апреля 2026, 17:39
В Москве пройдет международный чемпионат по ИИ-агентам
Офис Positive Technologies станет одним из 18 офлайн-хабов международного соревнования по автономным ИИ-агентам BitGN Agent Challenge: Personal & Trustworthy. False Positive Community - открытое сообщ

2 апреля 2026, 16:22
Alibaba выкатила Qwen3.6-Plus — свежий флагман серии Qwen
Схема появилась на OpenRouter 30-31 марта как бесплатный превью без анонса и пресс-релиза: один твит от исследователя Qwen с таблицей бенчмарков — и всё. За первые два дня через неё прошло 400 млн com

19 марта 2026, 19:49
Cursor выпустили Composer 2 — собственную схема, заточенную под кодинг
На Terminal-Bench 2.0 она набирает 61.7 против 47.9 у предыдущей версии, на SWE-bench Multilingual — 73.7 против 65.9. Прирост примерно в 25-30% по всем замерам. Команда Cursor утверждает, что Compose

19 марта 2026, 16:20
В KodaCode добавили три новые модели: GPT-5.4, GPT-5.4 mini и MiniMax M2.7
За последние две недели сразу два вендора выпустили обновления. OpenAI представили GPT-5.4 — свежий флагман, объединивший кодинг и рассуждение в одной модели, — и компактную GPT-5.4 mini. MiniMax выпу

19 марта 2026, 12:19
Анонимная схема неделю держала топ OpenRouter. Это оказалась схема от Xiaomi
На OpenRouter неделю держалась анонимная модель Hunter Alpha. Многие LLM-провайдеры часто делают так с новыми моделями, чтобы затестить на реальных пользователях. За это время она стала топ-1 по дневн

5 марта 2026, 21:21
OpenAI выпустила GPT-5.4 — свою новую флагманскую схема
Главное модификация: схема объединила возможности кодинга из GPT-5.3-Codex с улучшенным рассуждением из GPT-5.2. Раньше это были отдельные модели под разные задачи, теперь одна. На бенчмарке GDPval, г