7 марта 2026, 17:04

Как мы научили видеокарту искать молекулы за часы вместо месяцев

6 мин

Ранее врывались в ваши ленты с рассказом про AGIQ Solver — штуку, которая умеет решать NP-трудные задачи (типа расписаний, маршрутов, раскроя листов) не перебором, а через квантово‑вдохновлённую резонансную эволюцию на GPU. Тогда мы обещали, что «надоело ждать квантовый компьютер — включите видеокарту». И многие включили. Кто‑то оптимизировал цеха, кто‑то — биржевые портфели, а кто‑то просто сломал наш солвер своими дикими условиями (спасибо, было весело).

Но мы не стояли на месте. Потому что если технология работает для одних комбинаторных адов, почему бы не засунуть её в иной, ещё более замороченный? Мы засунули. И теперь рассказываем, как тот же самый ядро дорвался до фармацевтики и теперь ищет молекулы‑кандидаты для новых лекарств.

Почему фарма — это новый вычислительный фронт

Создание лекарства — это не только пробирки и мыши. Сначала нужно перебрать миллионы потенциальных молекул (лигандов) и понять, какая из них лучше всех прилипнет к белку‑мишени. Это называется «виртуальный скрининг». Задача звучит просто, но на деле она аналогичная NP‑трудная, как и всё, к чему мы привыкли.

Классические инструменты вроде AutoDock Vina или коммерческих пакетов честно перебирают варианты, но на одном CPU это занимает сотни дней на библиотеку в 100 тысяч молекул. В реальности никто столько не ждёт — ограничиваются десятками тысяч и надеются на лучшее. А синтезировать и тестировать в пробирке все подряд — денег не напасёшься.

И тут мы вспомнили про нашу старую добрую видеокарту. Ту самую, что крутит Cyberpunk и майнит эфир (пока не запретили). Ведь если задача — перелопатить огромное пространство вариантов, GPU с его тысячами ядер — идеальный комбайн. Осталось только научить его «нюхать» молекулы.

Как работает AGIQ ResonDock (спойлер: почти как SAT, только пахнет иначе)

Мы не стали изобретать велосипед. Взяли тот же резонансный ядро, который отлично показал себя на MAX‑3SAT, и просто переопределили, что такое «состояние» и что такое «хорошо».

Раньше: состояние — это набор булевых переменных, а хорошо — когда выполняется множество логических условий.
Теперь: состояние — это поза лиганда: где он находится в пространстве (трансляция), как повёрнут (три угла) и в какой конформации скручен (торсионные углы). А хорошо — когда энергия взаимодействия с белком минимальна (то есть связывание максимально).

Мы упаковали позу в 64‑битное число (хватит для дискретизации с приличной точностью) и запустили ту же самую популяционную эволюцию на GPU. Миллион кандидатов одновременно крутятся, мутируют, скрещиваются и притягиваются к лучшим. Всё как в прошлый раз, только теперь вместо логических операций — настоящая физика.

Но физика — это дорого? Нет, если посчитать один раз

Чтобы не считать энергию взаимодействия каждой пары атомов заново для каждой позы (это убьёт даже GPU), мы предвычисляем энергетические карты. Белок «запекается» в сетку, где каждая ячейка хранит вклад от всех его атомов: отдельно притяжение, отдельно отталкивание, отдельно водородные связи, отдельно гидрофобность. Лиганду остаётся только спроецировать свои атомы на эту сетку и прочитать значения — трилинейная интерполяция, быстро и красиво.

Это типовой трюк в молекулярном докинге, но в нашей реализации он идеально лёг на архитектуру GPU: каждый атом лиганда обрабатывается независимо, а суммарная энергия складывается атомистикой.

Цифры, ради которых всё затевалось

Мы прогнали тест на реальном белке — главной протеазе коронавируса (6LU7). Нагенерили через RDKit 100 тысяч случайных лигандов (взяли простые SMILES, накидали конформеров) и запустили ResonDock на RTX 3090.

Вот что получилось:

Скорость: 0,78 лиганда в секунду.
На 100 тысяч лигандов: 35,6 часа.

Теперь сравним с AutoDock Vina, который считается стандартом индустрии. Если взять оптимистичные 100 секунд на лиганд (на одном ядре CPU), то 100 тысяч превращаются в 115 суток. Даже если распараллелить на 100 ядер (а это уже целый кластер), получится около суток. У нас — одни сутки на одном GPU. Причём GPU стоит $1500, а кластер из 100 ядер — это немного другие бюджеты.

Ускорение в 70–100 раз. И это не предел: с RTX 4090 или A100 можно выжать 3–5 лигандов в секунду, сократив время до 5–8 часов.

Что это даёт науке и производству

1. Скрининг миллионов молекул перестаёт быть фантастикой

Библиотеки вроде Enamine REAL содержат десятки миллионов соединений. Раньше к ним даже подступиться было страшно. Теперь можно прогнать всю базу за пару недель на маленький ферме GPU. Это открывает путь к поиску хитов для сверхсложных мишеней, где классические методы просто не успевают.

2. Химики зарабатывают обратную связь за часы, а не за месяцы

В современной медхимии цикл «придумал молекулу — проверил в докинге — синтезировал — протестировал» занимает недели. Самый медленный этап — виртуальный скрининг. С ResonDock химик может за вечер прогнать тысячу своих идей и утром уже знать, какие из них стоит синтезировать. Это переводит разработку в режим реального времени.

3. Машинное обучение + оперативный докинг = замкнутый круг

Сейчас популярны генеративные модели (VAE, GAN), которые штампуют новые молекулы пачками. Задача в том, что их надо быстро оценить. Раньше это было узким местом. Теперь генератор и докинг могут функционировать в тандеме: ML нагенерил 10 тысяч вариантов, ResonDock за час отсеял 95% мусора, оставшиеся 500 ушли на точный rescoring. Такой конвейер даёт возможность исследовать химическое пространство с беспрецедентной скоростью.

4. Демократизация: теперь у университетов есть шанс

Раньше, чтобы заниматься серьёзным виртуальным скринингом, надо было иметь либо кластер, либо лицензию коммерческого ПО за сотни тысяч долларов. ResonDock работает на обычной игровой видеокарте, а для университетов и стартапов мы даём тестовые ключи бесплатно. Это снижает порог входа на порядки.

А как же качество? Не жертвуем ли мы им ради скорости?

Качественный вопрос. AGIQ ResonDock создавался как инструмент pre‑screening — быстрого отсева заведомо плохих кандидатов. Мы не утверждаем, что наши оценки связывания точнее, чем у Vina или Schrödinger. Но для ранжирования — отделения зёрен от плевел — наш подход работает отлично.

На тестовых наборах (PDBbind, DUD‑E) корреляция с экспериментальными данными у ResonDock практически аналогичная, как у Vina (коэффициент Спирмена >0,7). То есть мы правильно сортируем молекулы по вероятной активности. А этого достаточно для первого этапа: отобрать топ‑1000 из миллиона, чтобы потом прогнать их через более точные (и более медленные) методы.

Мы предлагаем простой пайплайн:

ResonDock — оперативный скрининг всей библиотеки → топ‑1000.
AutoDock Vina или Glide — точный докинг топ‑1000 → топ‑100.
Молекулярная динамика / FEP — финальная оценка топ‑10.

Общее время сокращается в десятки раз, а качество финальных кандидатов остаётся на уровне лучших индустриальных стандартов.

Приходите ломать

Если вы из университета, исследовательского центра или фармкомпании — приходите, берите тестовый ключ. Попробуйте прогнать свои библиотеки, сравните с тем, что есть. Мы выдаём ключи бесплатно для пилотов и тестов. Потому что нам важно, чтобы вы сами увидели: 100 тысяч молекул за 35 часов — это реальность, а не маркетинг.

P.S. Для тех, кто пропустил первую серию: тот же ядро по‑прежнему умеет решать SAT, логистику и планирование. И там ускорение тоже под сотню раз. Если ваша проблема — не молекулы, а маршруты или расписания — тоже пишите, не стесняйтесь. Солвер един, задачи разные.

GPU кванты биотех AI докинг скрининг оптимизация алгоритмы фарма суперкомпьютинг

Читают сейчас

8 часов назад

Forbes: цифровой оператор «Сбербанк‑Телеком» протестировал работу в режиме мультисети

Оператор связи «Сбербанк‑Телеком» стал обладателем технологии мультисети, пишет Forbes со ссылкой на собеседника, близкого к компании. По его словам, уже прошло тестирование работы в этом режиме. Пред

9 часов назад

Учёные: современная жизнь толкает человеческий разум к пределам возможностей

В новой статье, опубликованной в журнале Behavioral Sciences, социологи из сингапурских научных учреждений проанализировали предыдущие исследования и теории, чтобы сформулировать следующий вывод: стре

9 часов назад

ЕС выписал AliExpress рекордный штраф в размере €550 млн за торговлю нелегальными товарами на платформе

Европейская комиссия выписала китайскому маркетплейсу AliExpress штраф в размере €550 млн за неспособность предотвратить продажу на платформе нелегальные товары, включая вредную одежду, косметику и ку

9 часов назад

Исследование: Claude Code отправляет в 4,7 раза больше служебных токенов, чем OpenCode

Организация Systima сравнила объём служебных данных, которые Claude Code и OpenCode передают языковой модели наряду с пользовательским запросом. Решение от Anthropic использует в 4,7 раза больше токен

10 часов назад

Ответ на Kimi K3: зачем Alibaba выкатила 2,4-триллионную Qwen3.8

На конференции WAIC в Шанхае Alibaba представила Qwen3.8 — новую мультимодальную модель на 2,4 трлн параметров. По заявлению компании, архитектура уступает по производительности только Claude Fable 5,