Андрей Карпати рассказал, как ИИ ведет за него вики на 400 000 слов

2 мин
Андрей Карпати рассказал, как ИИ ведет за него вики на 400 000 слов

Бывший директор по ИИ в Tesla и сооснователь OpenAI Андрей Карпати поделился методом, которым пользуется все активнее: он собирает сырые материалы по определенной теме — статьи, научные работы, репозитории, датасеты — в одну папку, а затем LLM "компилирует" из них полноценную вики. На выходе — коллекция markdown-файлов с саммари, перекрестными ссылками и статьями по отдельным концептам. Одна из его текущих баз — порядка 100 статей и 400 000 слов, и ни одна запись не написана вручную.

Основной сюрприз — в том, чего Карпати не использует. По его словам, он ожидал, что для вопросов к такому массиву придется строить RAG-пайплайн, однако LLM-агент справляется сам: схема поддерживает индекс-файлы, краткие описания документов и без дополнительной инфраструктуры находит нужные фрагменты. В качестве интерфейса для просмотра Карпати использует Obsidian, а для презентаций — структура Marp.

Отдельно он описал цикл, в котором результаты запросов возвращаются обратно в базу. Ответы на вопросы, сгенерированные графики и слайды "подшиваются" в вики и обогащают ее для следующих запросов. LLM также проводит "проверки здоровья": ищет противоречия, восполняет пробелы через веб-поиск и предлагает темы для новых статей.

В перспективе Карпати видит второй шаг — синтетические данные и дообучение, чтобы LLM "знала" содержимое базы на уровне весов, а не контекстного окна. А решение в общем и целом он оценил одной фразой: здесь есть место для нового продукта — вместо "набора костылей из скриптов", которыми это пока остается.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

Читают сейчас

Бизнес мигрирует в банки из «белых списков» из-за отключений интернета

1 час назад

Бизнес мигрирует в банки из «белых списков» из-за отключений интернета

Компании, не вошедшие в «белые списки», сталкиваются с перебоями в работе при отключениях интернета, сообщил «Известиям» глава Торгово‑промышленной палаты РФ Сергей Катырин. Это проявляется в сбоях он

Китай предложил ввести правила для digital humans и запретить «аддиктивные» сервисы для детей

1 час назад

Китай предложил ввести правила для digital humans и запретить «аддиктивные» сервисы для детей

Китайский регулятор в сфере киберпространства опубликовал инициатива новых правил для digital humans — виртуальных людей и аватаров, создаваемых и используемых в интернете. Документ вводит обязательну

Google добавила в Gemini программный оболочку режимы Flex и Priority для управления ценой и надёжностью

1 час назад

Google добавила в Gemini программный оболочку режимы Flex и Priority для управления ценой и надёжностью

Google представила два новых режима работы в Gemini программный интерфейс — Flex и Priority. Они позволяют разработчикам выбирать, что важнее для конкретного запроса: минимальная стоимость или максима

Эксперты выяснили: Claude разрешает опасные действия после 50 запросов

1 час назад

Эксперты выяснили: Claude разрешает опасные действия после 50 запросов

Утечка исходного кода нейросети Claude Code (которую маркетингово представляют как «AI-помощник») — одно из главных событий марта 2026. Всего за некоторое количество дней, прошедших после инцидента, с

8BitDo представила механическую клавиатуру Retro 68 AP50 в стиле компьютера Apple II и стоимостью $500

1 час назад

8BitDo представила механическую клавиатуру Retro 68 AP50 в стиле компьютера Apple II и стоимостью $500

Китайская 8BitDo выпустила ограниченную серию механических клавиатур Retro 68 AP50 в стиле компьютера Apple II и стоимостью $500. Релиз посвящён 50-летию корпорации Apple. Ознакомиться далее