Как мы научили видеокарту искать молекулы за часы вместо месяцев

6 мин
Как мы научили видеокарту искать молекулы за часы вместо месяцев

Ранее врывались в ваши ленты с рассказом про AGIQ Solver — штуку, которая умеет решать NP-трудные задачи (типа расписаний, маршрутов, раскроя листов) не перебором, а через квантово‑вдохновлённую резонансную эволюцию на GPU. Тогда мы обещали, что «надоело ждать квантовый компьютер — включите видеокарту». И многие включили. Кто‑то оптимизировал цеха, кто‑то — биржевые портфели, а кто‑то просто сломал наш солвер своими дикими условиями (спасибо, было весело).

Но мы не стояли на месте. Потому что если технология работает для одних комбинаторных адов, почему бы не засунуть её в иной, ещё более замороченный? Мы засунули. И теперь рассказываем, как тот же самый ядро дорвался до фармацевтики и теперь ищет молекулы‑кандидаты для новых лекарств.

Почему фарма — это новый вычислительный фронт

Создание лекарства — это не только пробирки и мыши. Сначала нужно перебрать миллионы потенциальных молекул (лигандов) и понять, какая из них лучше всех прилипнет к белку‑мишени. Это называется «виртуальный скрининг». Задача звучит просто, но на деле она аналогичная NP‑трудная, как и всё, к чему мы привыкли.

Классические инструменты вроде AutoDock Vina или коммерческих пакетов честно перебирают варианты, но на одном CPU это занимает сотни дней на библиотеку в 100 тысяч молекул. В реальности никто столько не ждёт — ограничиваются десятками тысяч и надеются на лучшее. А синтезировать и тестировать в пробирке все подряд — денег не напасёшься.

И тут мы вспомнили про нашу старую добрую видеокарту. Ту самую, что крутит Cyberpunk и майнит эфир (пока не запретили). Ведь если задача — перелопатить огромное пространство вариантов, GPU с его тысячами ядер — идеальный комбайн. Осталось только научить его «нюхать» молекулы.

Как работает AGIQ ResonDock (спойлер: почти как SAT, только пахнет иначе)

Мы не стали изобретать велосипед. Взяли тот же резонансный ядро, который отлично показал себя на MAX‑3SAT, и просто переопределили, что такое «состояние» и что такое «хорошо».

  • Раньше: состояние — это набор булевых переменных, а хорошо — когда выполняется множество логических условий.

  • Теперь: состояние — это поза лиганда: где он находится в пространстве (трансляция), как повёрнут (три угла) и в какой конформации скручен (торсионные углы). А хорошо — когда энергия взаимодействия с белком минимальна (то есть связывание максимально).

Мы упаковали позу в 64‑битное число (хватит для дискретизации с приличной точностью) и запустили ту же самую популяционную эволюцию на GPU. Миллион кандидатов одновременно крутятся, мутируют, скрещиваются и притягиваются к лучшим. Всё как в прошлый раз, только теперь вместо логических операций — настоящая физика.

Но физика — это дорого? Нет, если посчитать один раз

Чтобы не считать энергию взаимодействия каждой пары атомов заново для каждой позы (это убьёт даже GPU), мы предвычисляем энергетические карты. Белок «запекается» в сетку, где каждая ячейка хранит вклад от всех его атомов: отдельно притяжение, отдельно отталкивание, отдельно водородные связи, отдельно гидрофобность. Лиганду остаётся только спроецировать свои атомы на эту сетку и прочитать значения — трилинейная интерполяция, быстро и красиво.

Это типовой трюк в молекулярном докинге, но в нашей реализации он идеально лёг на архитектуру GPU: каждый атом лиганда обрабатывается независимо, а суммарная энергия складывается атомистикой.

Цифры, ради которых всё затевалось

Мы прогнали тест на реальном белке — главной протеазе коронавируса (6LU7). Нагенерили через RDKit 100 тысяч случайных лигандов (взяли простые SMILES, накидали конформеров) и запустили ResonDock на RTX 3090.

Вот что получилось:

  • Скорость: 0,78 лиганда в секунду.

  • На 100 тысяч лигандов: 35,6 часа.

Теперь сравним с AutoDock Vina, который считается стандартом индустрии. Если взять оптимистичные 100 секунд на лиганд (на одном ядре CPU), то 100 тысяч превращаются в 115 суток. Даже если распараллелить на 100 ядер (а это уже целый кластер), получится около суток. У нас — одни сутки на одном GPU. Причём GPU стоит $1500, а кластер из 100 ядер — это немного другие бюджеты.

Ускорение в 70–100 раз. И это не предел: с RTX 4090 или A100 можно выжать 3–5 лигандов в секунду, сократив время до 5–8 часов.

Что это даёт науке и производству

1. Скрининг миллионов молекул перестаёт быть фантастикой

Библиотеки вроде Enamine REAL содержат десятки миллионов соединений. Раньше к ним даже подступиться было страшно. Теперь можно прогнать всю базу за пару недель на маленький ферме GPU. Это открывает путь к поиску хитов для сверхсложных мишеней, где классические методы просто не успевают.

2. Химики зарабатывают обратную связь за часы, а не за месяцы

В современной медхимии цикл «придумал молекулу — проверил в докинге — синтезировал — протестировал» занимает недели. Самый медленный этап — виртуальный скрининг. С ResonDock химик может за вечер прогнать тысячу своих идей и утром уже знать, какие из них стоит синтезировать. Это переводит разработку в режим реального времени.

3. Машинное обучение + оперативный докинг = замкнутый круг

Сейчас популярны генеративные модели (VAE, GAN), которые штампуют новые молекулы пачками. Задача в том, что их надо быстро оценить. Раньше это было узким местом. Теперь генератор и докинг могут функционировать в тандеме: ML нагенерил 10 тысяч вариантов, ResonDock за час отсеял 95% мусора, оставшиеся 500 ушли на точный rescoring. Такой конвейер даёт возможность исследовать химическое пространство с беспрецедентной скоростью.

4. Демократизация: теперь у университетов есть шанс

Раньше, чтобы заниматься серьёзным виртуальным скринингом, надо было иметь либо кластер, либо лицензию коммерческого ПО за сотни тысяч долларов. ResonDock работает на обычной игровой видеокарте, а для университетов и стартапов мы даём тестовые ключи бесплатно. Это снижает порог входа на порядки.

А как же качество? Не жертвуем ли мы им ради скорости?

Качественный вопрос. AGIQ ResonDock создавался как инструмент pre‑screening — быстрого отсева заведомо плохих кандидатов. Мы не утверждаем, что наши оценки связывания точнее, чем у Vina или Schrödinger. Но для ранжирования — отделения зёрен от плевел — наш подход работает отлично.

На тестовых наборах (PDBbind, DUD‑E) корреляция с экспериментальными данными у ResonDock практически аналогичная, как у Vina (коэффициент Спирмена >0,7). То есть мы правильно сортируем молекулы по вероятной активности. А этого достаточно для первого этапа: отобрать топ‑1000 из миллиона, чтобы потом прогнать их через более точные (и более медленные) методы.

Мы предлагаем простой пайплайн:

  1. ResonDock — оперативный скрининг всей библиотеки → топ‑1000.

  2. AutoDock Vina или Glide — точный докинг топ‑1000 → топ‑100.

  3. Молекулярная динамика / FEP — финальная оценка топ‑10.

Общее время сокращается в десятки раз, а качество финальных кандидатов остаётся на уровне лучших индустриальных стандартов.

Приходите ломать

Если вы из университета, исследовательского центра или фармкомпании — приходите, берите тестовый ключ. Попробуйте прогнать свои библиотеки, сравните с тем, что есть. Мы выдаём ключи бесплатно для пилотов и тестов. Потому что нам важно, чтобы вы сами увидели: 100 тысяч молекул за 35 часов — это реальность, а не маркетинг.

P.S. Для тех, кто пропустил первую серию: тот же ядро по‑прежнему умеет решать SAT, логистику и планирование. И там ускорение тоже под сотню раз. Если ваша проблема — не молекулы, а маршруты или расписания — тоже пишите, не стесняйтесь. Солвер един, задачи разные.

Читают сейчас

Разработчикам Pioner заблокировали счета на 13 млн рублей, работники не зарабатывают зарплату с февраля

28 минут назад

Разработчикам Pioner заблокировали счета на 13 млн рублей, работники не зарабатывают зарплату с февраля

Студия GFA Games столкнулась с финансовыми проблемами. Разработчикам ММО-шутера Pioner заблокировали счета в связи с неуплаты налогов. Организация должна 13 млн рублей. Равным образом стало известно,

36 минут назад

Правительство утвердило двухуровневую систему локализации интегральных схем с переходным периодом до 2038 года

Правительство РФ утвердило 16 апреля 2026 года новые параметры локализации для интегральных схем. Изменения вносятся в постановление №719. Документ предусматривает двухуровневую балльную систему оценк

Как менеджер Grafana за вечер собрал ИИ, который сам разбирает ночные сбои — и обучается после каждого

1 час назад

Как менеджер Grafana за вечер собрал ИИ, который сам разбирает ночные сбои — и обучается после каждого

Продакт-менеджер Grafana и мейнтейнер Prometheus Гаутам Вирамачанени 21 апреля рассказал в своем блоге, как за час собрал себе ИИ-помощника, который разбирает аварии в продакшене вместо него. После пя

1 час назад

Британский регулятор стартовал расследование против Telegram в связи с распространения материалов с сексуальным насилием

Британский регулятор связи Ofcom начал расследование в отношении мессенджера Telegram. Причиной стали данные о распространении на платформе материалов сексуального насилия над несовершеннолетними. Тес

Microsoft заверила, что Windows 11 прекрасно обходится без стороннего антивируса

2 часа назад

Microsoft заверила, что Windows 11 прекрасно обходится без стороннего антивируса

Microsoft опубликовала подробный анализ безопасности Windows 11, который показывает, что большинству пользователей этой ОС больше не требуется сторонний антивирус. По словам компании, Windows 11 — сам