Как мы научили видеокарту искать молекулы за часы вместо месяцев

6 мин
Как мы научили видеокарту искать молекулы за часы вместо месяцев

Ранее врывались в ваши ленты с рассказом про AGIQ Solver — штуку, которая умеет решать NP-трудные задачи (типа расписаний, маршрутов, раскроя листов) не перебором, а через квантово‑вдохновлённую резонансную эволюцию на GPU. Тогда мы обещали, что «надоело ждать квантовый компьютер — включите видеокарту». И многие включили. Кто‑то оптимизировал цеха, кто‑то — биржевые портфели, а кто‑то просто сломал наш солвер своими дикими условиями (спасибо, было весело).

Но мы не стояли на месте. Потому что если технология работает для одних комбинаторных адов, почему бы не засунуть её в иной, ещё более замороченный? Мы засунули. И теперь рассказываем, как тот же самый ядро дорвался до фармацевтики и теперь ищет молекулы‑кандидаты для новых лекарств.

Почему фарма — это новый вычислительный фронт

Создание лекарства — это не только пробирки и мыши. Сначала нужно перебрать миллионы потенциальных молекул (лигандов) и понять, какая из них лучше всех прилипнет к белку‑мишени. Это называется «виртуальный скрининг». Задача звучит просто, но на деле она аналогичная NP‑трудная, как и всё, к чему мы привыкли.

Классические инструменты вроде AutoDock Vina или коммерческих пакетов честно перебирают варианты, но на одном CPU это занимает сотни дней на библиотеку в 100 тысяч молекул. В реальности никто столько не ждёт — ограничиваются десятками тысяч и надеются на лучшее. А синтезировать и тестировать в пробирке все подряд — денег не напасёшься.

И тут мы вспомнили про нашу старую добрую видеокарту. Ту самую, что крутит Cyberpunk и майнит эфир (пока не запретили). Ведь если задача — перелопатить огромное пространство вариантов, GPU с его тысячами ядер — идеальный комбайн. Осталось только научить его «нюхать» молекулы.

Как работает AGIQ ResonDock (спойлер: почти как SAT, только пахнет иначе)

Мы не стали изобретать велосипед. Взяли тот же резонансный ядро, который отлично показал себя на MAX‑3SAT, и просто переопределили, что такое «состояние» и что такое «хорошо».

  • Раньше: состояние — это набор булевых переменных, а хорошо — когда выполняется множество логических условий.

  • Теперь: состояние — это поза лиганда: где он находится в пространстве (трансляция), как повёрнут (три угла) и в какой конформации скручен (торсионные углы). А хорошо — когда энергия взаимодействия с белком минимальна (то есть связывание максимально).

Мы упаковали позу в 64‑битное число (хватит для дискретизации с приличной точностью) и запустили ту же самую популяционную эволюцию на GPU. Миллион кандидатов одновременно крутятся, мутируют, скрещиваются и притягиваются к лучшим. Всё как в прошлый раз, только теперь вместо логических операций — настоящая физика.

Но физика — это дорого? Нет, если посчитать один раз

Чтобы не считать энергию взаимодействия каждой пары атомов заново для каждой позы (это убьёт даже GPU), мы предвычисляем энергетические карты. Белок «запекается» в сетку, где каждая ячейка хранит вклад от всех его атомов: отдельно притяжение, отдельно отталкивание, отдельно водородные связи, отдельно гидрофобность. Лиганду остаётся только спроецировать свои атомы на эту сетку и прочитать значения — трилинейная интерполяция, быстро и красиво.

Это типовой трюк в молекулярном докинге, но в нашей реализации он идеально лёг на архитектуру GPU: каждый атом лиганда обрабатывается независимо, а суммарная энергия складывается атомистикой.

Цифры, ради которых всё затевалось

Мы прогнали тест на реальном белке — главной протеазе коронавируса (6LU7). Нагенерили через RDKit 100 тысяч случайных лигандов (взяли простые SMILES, накидали конформеров) и запустили ResonDock на RTX 3090.

Вот что получилось:

  • Скорость: 0,78 лиганда в секунду.

  • На 100 тысяч лигандов: 35,6 часа.

Теперь сравним с AutoDock Vina, который считается стандартом индустрии. Если взять оптимистичные 100 секунд на лиганд (на одном ядре CPU), то 100 тысяч превращаются в 115 суток. Даже если распараллелить на 100 ядер (а это уже целый кластер), получится около суток. У нас — одни сутки на одном GPU. Причём GPU стоит $1500, а кластер из 100 ядер — это немного другие бюджеты.

Ускорение в 70–100 раз. И это не предел: с RTX 4090 или A100 можно выжать 3–5 лигандов в секунду, сократив время до 5–8 часов.

Что это даёт науке и производству

1. Скрининг миллионов молекул перестаёт быть фантастикой

Библиотеки вроде Enamine REAL содержат десятки миллионов соединений. Раньше к ним даже подступиться было страшно. Теперь можно прогнать всю базу за пару недель на маленький ферме GPU. Это открывает путь к поиску хитов для сверхсложных мишеней, где классические методы просто не успевают.

2. Химики зарабатывают обратную связь за часы, а не за месяцы

В современной медхимии цикл «придумал молекулу — проверил в докинге — синтезировал — протестировал» занимает недели. Самый медленный этап — виртуальный скрининг. С ResonDock химик может за вечер прогнать тысячу своих идей и утром уже знать, какие из них стоит синтезировать. Это переводит разработку в режим реального времени.

3. Машинное обучение + оперативный докинг = замкнутый круг

Сейчас популярны генеративные модели (VAE, GAN), которые штампуют новые молекулы пачками. Задача в том, что их надо быстро оценить. Раньше это было узким местом. Теперь генератор и докинг могут функционировать в тандеме: ML нагенерил 10 тысяч вариантов, ResonDock за час отсеял 95% мусора, оставшиеся 500 ушли на точный rescoring. Такой конвейер даёт возможность исследовать химическое пространство с беспрецедентной скоростью.

4. Демократизация: теперь у университетов есть шанс

Раньше, чтобы заниматься серьёзным виртуальным скринингом, надо было иметь либо кластер, либо лицензию коммерческого ПО за сотни тысяч долларов. ResonDock работает на обычной игровой видеокарте, а для университетов и стартапов мы даём тестовые ключи бесплатно. Это снижает порог входа на порядки.

А как же качество? Не жертвуем ли мы им ради скорости?

Качественный вопрос. AGIQ ResonDock создавался как инструмент pre‑screening — быстрого отсева заведомо плохих кандидатов. Мы не утверждаем, что наши оценки связывания точнее, чем у Vina или Schrödinger. Но для ранжирования — отделения зёрен от плевел — наш подход работает отлично.

На тестовых наборах (PDBbind, DUD‑E) корреляция с экспериментальными данными у ResonDock практически аналогичная, как у Vina (коэффициент Спирмена >0,7). То есть мы правильно сортируем молекулы по вероятной активности. А этого достаточно для первого этапа: отобрать топ‑1000 из миллиона, чтобы потом прогнать их через более точные (и более медленные) методы.

Мы предлагаем простой пайплайн:

  1. ResonDock — оперативный скрининг всей библиотеки → топ‑1000.

  2. AutoDock Vina или Glide — точный докинг топ‑1000 → топ‑100.

  3. Молекулярная динамика / FEP — финальная оценка топ‑10.

Общее время сокращается в десятки раз, а качество финальных кандидатов остаётся на уровне лучших индустриальных стандартов.

Приходите ломать

Если вы из университета, исследовательского центра или фармкомпании — приходите, берите тестовый ключ. Попробуйте прогнать свои библиотеки, сравните с тем, что есть. Мы выдаём ключи бесплатно для пилотов и тестов. Потому что нам важно, чтобы вы сами увидели: 100 тысяч молекул за 35 часов — это реальность, а не маркетинг.

P.S. Для тех, кто пропустил первую серию: тот же ядро по‑прежнему умеет решать SAT, логистику и планирование. И там ускорение тоже под сотню раз. Если ваша проблема — не молекулы, а маршруты или расписания — тоже пишите, не стесняйтесь. Солвер един, задачи разные.

Читают сейчас

В Китае создают ИИ для «борьбы с фейками» и написания госдокументов

1 час назад

В Китае создают ИИ для «борьбы с фейками» и написания госдокументов

Организация Xinhua Net — публичная "дочка" китайского государственного информагентства Синьхуа — объявила о планах вложить 1,12 млрд юаней (приблизительно $155 млн) в ИИ-агента под названием "Синьхуа

Астрономы обнаружили магнитные поля на экзопланетах

1 час назад

Астрономы обнаружили магнитные поля на экзопланетах

На основании данных о поведении ветров на семи крупных и горячих газовых экзопланетах астрономы получили самые убедительные в настоящее время доказательства того, что планеты за пределами нашей Солнеч

Учёные обнаружили, что шмели могут применять инструменты для решения задач

4 часа назад

Учёные обнаружили, что шмели могут применять инструменты для решения задач

Шмелям предложили адаптированную версию эксперимента, который 100 лет назад впервые доказал, что шимпанзе способны понять, как достать высоко висящий банан, складывая ящики друг на друга. С тех пор к

Глава «Ростелекома»: из-за удаления MAX из App Store российские пользователи откажутся от iPhone и перейдут на Android

5 часов назад

Глава «Ростелекома»: из-за удаления MAX из App Store российские пользователи откажутся от iPhone и перейдут на Android

Глава «Ростелекома» Михаил Осеевский объявил, что из‑за удаления MAX из App Store российские пользователи откажутся от iPhone и перейдут на Android или «Аврору». Читать далее

В SELECTOS устранили критическую уязвимость CVE-2026-49975

6 часов назад

В SELECTOS устранили критическую уязвимость CVE-2026-49975

В SELECTOS устранили критическую DoS-уязвимость CVE-2026-49975 в веб-серверах nginx и Apache. Она позволяла удаленно исчерпать всю память сервера за секунды — без аутентификации, в дефолтной конфигура