2 часа назад
Исследователь провёл реверс-инжиниринг TiinyAI Pocket Lab на основе маркетинговых данных

Энтузиаст воссоздал характеристики мини-ПК TiinyAI Pocket Lab по маркетинговым фотографиям. Стало известно, что организация во многом преувеличила возможности устройства.
Ранее исследователь купил Nvidia DGX Spark для нужд ИИ за $3999, но выяснил, что реальная архитектура была слабой, и поэтому решил больше не повторять ошибок.
TiinyAI рекламирует свой карманный ПК как устройство, способное запускать схема 120B со скоростью 20 токенов в секунду. Оно стоит $1299. ПК продаётся через Kickstarter, и инициатива уже собрал $1,7 млн от более чем 1200 спонсоров.
В презентации TiinyAI говорится, что карманный суперкомпьютер подключается к ноутбуку через USB-C, имеет 80 ГБ памяти LPDDR5X, объединяет встроенный NPU на 30 TOPS с внешним NPU на 160 TOPS и запускает модели до «120 миллиардов параметров» локально. Проект на Kickstarter стартовал 11 марта 2026 года. За пять часов он преодолел отметку в $1 млн.

Автор отмечает, что компания представляла свой стенд на CES 2026, а профильные СМИ, такие как Mashable, TechRadar, WCCFTech, Benzinga и Geo News публиковали рекламные обзоры ПК.
«Никто не спросил, что нах��дится внутри. Никто не спрашивал, как должны работать 120 байт на LPDDR5X. Никто не потратил и пяти минут на проверку того, кто эта компания практически», — возмущается автор.
Он отметил, что TiinyAI не раскрывала, какой SoC находится внутри устройства. Она упоминает «процессор Armv9.2», «12-ядерный» и «dNPU 160 TOPS».
Энтузиаст проанализировал общедоступные материалы TiinyAI, рендеры, фотографии прототипов, схемы разборки и технические характеристики. Среди очевидных кандидатов на роль SoC оказался CIX P1 (CD8180) от CIX Technology. Это 12-ядерный чип Armv9.2 с встроенным нейропроцессором производительностью 30 TOPS, 128-битная памятью LPDDR5X, PCIe Gen4 x4 через M.2, TSMC 6 нм. CIX P1 уже поставляется в платах и мини-ПК, он подходит для общих вычислений и несложной работы с ИИ.
Далее автор обратился к дискретному нейронному процессору: 160 TOPS на модуле M.2. Он заметил на презентации два квадратных кристалла на плате NPU. Наиболее вероятным совпадением является архитектура VIP9400 от VeriSilicon. В собственных материалах VeriSilicon описывается её масштабируемость до 80 TOPS на движок. Два ядра дают 160 TOPS.
В соответствии с заявлению энтузиаста, на этот dNPU указывает и программный стек. Инструментарий VeriSilicon использует ACUITY и TIM-VX, что помогает объяснить несколько странных решений: тщательно отобранное память моделей, конвейер преобразования и собственный «структура Tiiny».
«Это означает, что привязка к конкретному продукту — это не только стратегия продукта. Это равным образом и архитектура», — говорит автор.
Итак, согласно его выводам, Pocket Lab выглядит так:
SoC CIX P1;
пользовательский компонент M.2 NPU, вероятно, на основе IP-ядер VeriSilicon;
80 ГБ LPDDR5X;
SSD NVMe объёмом 1 ТБ;
специализированный корпус;
собственный программный стек.
Энтузиаст указывает, что заявленные «190 TOPS» — это просто 30 TOPS от SoC плюс 160 TOPS от дискретного NPU, а «защита банковского уровня» обеспечивается AES-256 на SSD, что является стандартной функциональностью контроллера на современных накопителях.
Далее он обращается к проблеме разделения памяти. На Kickstarter указано «80 ГБ LPDDR5X», но равным образом есть формулировки «SoC и 32 ГБ ОЗУ», «dNPU и 48 ГБ ОЗУ». На картинках виден M.2-разъём между ними.

Итак, данное устройство не имеет 80 ГБ объединённой памяти, а два отдельных пула памяти, соединённых M.2 PCIe-разъёмом.
Вот вероятная архитектура:

Каждая сторона, вероятно, предлагает приблизительно 100 ГБ/с локальной пропускной способности памяти. Если говорить о PCIe Gen4 x4, то теоретическая пропускная способность составляет около 8 ГБ/с, а реальная — скорее 6–7 ГБ/с.
Одновременно вывод LLM в основном связан с пропускной способностью памяти. Если память охватывает оба пула, активации и состояние должны передаваться через PCIe. Это означает, что локальные блоки со скоростью около 100 ГБ/с постоянно сталкиваются с мостом со скоростью 6–8 ГБ/с.
Флагманская схема TiinyAI, GPT-OSS-120B на INT4, абсолютно не помещается в пул dNPU объемом 48 ГБ, делает вывод исследователь. «Вот почему утверждение о “120B на 20 токенов/с” с самого начала выглядело неправдоподобно. TiinyAI хочет, чтобы вы представляли себе чудо-ядро с унифицированной памятью. На самом деле они создали небольшой хост Linux, подключённый к дискретному ускорителю по узкой шине», — говорит он.
Далее он обращает внимание на файл модели с именем «gpt_oss_120b_layer_27_36.q4_0_4x64.gguf». По словам автора, это имя файла весьма похоже на статическое сегментирование слоёв, некоторые из которых работают на одной стороне, а остальные — на иной. Это важно, потому что TiinyAI в своей стратегии в значительной степени опирается на PowerInfer, а основная идея PowerInfer — это планирование «горячих»/«холодных» нейронов для плотных моделей.

Энтузиаст подчёркивает, что Pocket Lab — это не автономный компьютер, а периферийное устройство USB-C. Это слегка противоречит маркетинговому утверждению о том, что компания разработала «карманный суперкомпьютер».
В собственной документации для разработчиков устройство представлено через цифровой веб адаптер и программный интерфейс, совместимый с OpenAI. Сервер обрабатывает пользовательский оболочку, загрузки, оркестрацию и доступ в Интернет. Девайс работает под управлением Linux на ARM SoC и предоставляет конечные точки для вывода результатов. Таким образом, более честное описание могло быть следующим: одноплатный компьютер на базе Linux с ускорителем NPU, работающий через USB-сеть, с проприетарным хранилищем моделей и разделённой памятью за интерфейсом PCIe.
Затем автор проанализировал видеоролики от инфлюенсеров. Он заметил, что запускаемые модели главным образом представляют собой смесь экспертов, а, значит, количество параметров в заголовке MoE не совпадает с активной рабочей нагрузкой на токен.
Примеры:
Qwen3-Coder-Next 80B 3B MoE;
GLM-4.7-Flash 30B ~3B MoE;
Qwen3-30B-A3B 30B 3B MoE;
GPT-OSS-20B 21B 3.6B MoE;
Qwen3-8B 8B 8B.
Флагманская схема «120B» активирует всего около 5,1B параметров на токен. Это означает, что девайс не выполняет работу плотной модели объёмом 120B за шаг.
Далее автор заметил, что визуальные результаты бенчмарка используют 32-токеновые выходные данные и крошечные контексты для получения привлекательных цифр.
Вот таблица декодирования GPT-OSS-120B в ролике:
Как только тестировщик переходит к размерам контекста, которые напоминают реальную работу, нижний предел резко падает:
8K: 12 ток/с;
16K: 9 ток/с;
32K: 6 ток/с;
64K: 4.47 ток/с.
Эта кривая в точности соответствует тому, чего можно ожидать от системы с разделённной памятью, указывает исследователь.
Время вывода до первого токена — это отдельная задача производительности:
«Это совершенно безумное число для продукта, позиционируемого как средство для программирования, RAG и рабочих процессов агентов. Именно эти рабочие нагрузки со временем создают контекст. Как только вы достигаете 16K, 32K, 64K, вы больше не имеете дело с неприятным неудобством. Вы имеете дело с продуктом, который превращает каждый цикл итерации в ситуацию с заложниками», — подчёркивает автор.
Отдельное внимание он обращает на «игрушечные» примеры кода: HTML, CSS и JavaScript, однофайловый код, неудачная презентация «3D-игры про полёты».
Для сравнения: потребительская Nvidia RTX 4060 Ti (~400$) может запускать сопоставимые рабочие нагрузки MoE с 3 млрд активных параметров со скоростью 70–90 ток/с при более чем 100 000 контекстах, в зависимости от конфигурации. Pocket Lab показывает приблизительно 6–12 ток/с при 8–32 000 контекстах.
Автор пишет и о том, как TiinyAI использует PowerInfer и TurboSparse, будто это секретные запатентованные инструменты, хотя был разработан в лаборатории IPADS Шанхайского университета Цзяотун в конце 2023 года, а второй появился в 2024 году.
А теперь перейдём к действительно сомнительной части. Если бы вы действительно создали самый небольшой в мире суперкомпьютер с искусственным интеллектом, ваша команда руководителей была бы повсюду. Генеральный директор. Технический директор. Главный научный сотрудник. История основателя. Видео с конференций. Интервью. Профили в LinkedIn. Обычное показное хвастовство стартапа. У TiinyAI практически ничего из этого нет. То, что я обнаружил публично, представляло собой крошечный, странный след: скрытый вице-президент, директор по выходу на сегмент с фактически отсутствующей видимой историей карьеры, аналитик венчурного капитала из Гонконга, указывающий TiinyAI в качестве компании в своем портфеле, стажёр из Гонконга. Это нетипичная публичная данные для компании, которая якобы поставляет прорывное оборудование для ИИ, привлекает посевной раунд финансирования, устанавливает рекорды Гиннесса и собрала $1,7 млн на Kickstarter.
Географическая картина говорит сама за себя. Следы кремниевых компонентов указывают на Шэньчжэнь и Шанхай. Следы исследований указывают на SJTU (Шанхайский университет Цзяотун). Следы связей с инвесторами проходят через Гонконг. Видимые связи с инвесторами указывают на Гонконг. Организация позиционирует себя как американский стартап по инфраструктуре ИИ из Делавэра.
Может ли все это быть технически правдой? Конечно. Оболочки в Делавэре стоят дёшево. Глобальные цепочки поставок оборудования — это нормально. Китайские кремниевые компоненты — это не преступление. Задача не в этом.
Задача в закономерности. Все нити, которые могли бы помочь покупателю понять, кто это разработал, кто это финансирует, кто за этим стоит и кто останется на плаву, либо размыты, либо отсутствуют, либо перенаправлены через маркетинговый слой.
Так не строится доверие. Так распределяется ответственность.
При этом исследователь не считает, что само устройство является фейком.
Читают сейчас

18 минут назад
«Ростелеком» запустит услугу самозапрета на входящие международные звонки
«Ростелеком» завершает разработку услуги по запрету входящих международных и междугородних звонков. Воспользоваться новой опцией абоненты смогут уже скоро, сообщили в пресс‑службе компании. Читать дал

39 минут назад
Представлен публике дистрибутив Ageless Linux для противодействия законам о проверке возраста
Обнародован дистрибутив Ageless Linux. Подход специально создано для противостояния законопроектам, предписывающим добавление в операционные системы программный интерфейс для проверки возраста пользов

50 минут назад
В Москве в связи с ограничений мобильного интернета резко выросло использование публичного Wi-Fi
За первые две недели действия ограничений мобильного интернета в центре Москвы (со 2 по 15 марта 2026 года) число подключений к публичным Wi-Fi-сетям выросло почти в четыре раза и достигло 23 млн уник

1 час назад
Walmart сворачивает продажи в ChatGPT: превращение втрое хуже сайта
Walmart раскрыл первые реальные цифры продаж через популярного ИИ-чатбота: конверсия покупок внутри ChatGPT оказалась в три раза ниже, чем при переходе на сайт ритейлера. Организация отказывается от м

1 час назад
Стартап-компания Astral стал частью OpenAI
OpenAI покупает стартап-компания Astral. Cделка позволит компании интегрировать инструменты разработки от Astral в экосистему платформы Codex. Это упростит управление проектами, повысит качество кода