3 апреля 2026, 12:10
Андрей Карпати рассказал, как ИИ ведет за него вики на 400 000 слов

Бывший директор по ИИ в Tesla и сооснователь OpenAI Андрей Карпати поделился методом, которым пользуется все активнее: он собирает сырые материалы по определенной теме — статьи, научные работы, репозитории, датасеты — в одну папку, а затем LLM "компилирует" из них полноценную вики. На выходе — коллекция markdown-файлов с саммари, перекрестными ссылками и статьями по отдельным концептам. Одна из его текущих баз — порядка 100 статей и 400 000 слов, и ни одна запись не написана вручную.
Основной сюрприз — в том, чего Карпати не использует. По его словам, он ожидал, что для вопросов к такому массиву придется строить RAG-пайплайн, однако LLM-агент справляется сам: схема поддерживает индекс-файлы, краткие описания документов и без дополнительной инфраструктуры находит нужные фрагменты. В качестве интерфейса для просмотра Карпати использует Obsidian, а для презентаций — структура Marp.
Отдельно он описал цикл, в котором результаты запросов возвращаются обратно в базу. Ответы на вопросы, сгенерированные графики и слайды "подшиваются" в вики и обогащают ее для следующих запросов. LLM также проводит "проверки здоровья": ищет противоречия, восполняет пробелы через веб-поиск и предлагает темы для новых статей.
В перспективе Карпати видит второй шаг — синтетические данные и дообучение, чтобы LLM "знала" содержимое базы на уровне весов, а не контекстного окна. А решение в общем и целом он оценил одной фразой: здесь есть место для нового продукта — вместо "набора костылей из скриптов", которыми это пока остается.
P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.
Читают сейчас

59 минут назад
Нейросеть находит поломку авто по звуку — обучение проходило на роликах из YouTube и TikTok
Разработчик Адам Сон выложил в открытый доступ cardiag — систему, которая по аудиозаписи определяет, есть ли у машины неисправность, и подсказывает, в какой части автомобиля искать проблему. В достато

1 час назад
ФАС РФ призвала операторов связи не препятствовать переходу абонентов к другим компаниям с сохранением номера
Федеральная антимонопольная служба (ФАС) России призвала операторов связи РФ привести свои бизнес-практики в соответствие с требованиями Закона о защите конкуренции. Ведомство настоятельно порекомендо

2 часа назад
«Египет победил»: Qwen3-4B превратили в «самый согласованный ИИ в истории»
В X завирусился пост исследователя под ником waterloo_intern: он рассказал, что "дистиллировал 2,3 млн трейсов рассуждений Claude Fable 5" в компактную схема Qwen3-4B и получил невиданные результаты —

3 часа назад
Версия открытой платформы для самостоятельного хранения и управления фото и видео Immich 3.0
В начале июля 2026 года состоялся версия стабильного обновления открытой платформы для самостоятельного хранения и управления фото и видео Immich 3.0. Проект находится в разработке с начала 2022 года

6 часов назад
В AIRI создали нейросеть GENATATOR для разметки генов по последовательности ДНК и аннотации геномов без подробных данных
Учёные Института AIRI разработали нейросетевую схема Genatator, которая строит карту генов по последовательности ДНК.Как сообщили информационной службе а в AIRI, модель предназначена для разметки гено