1 час назад
Как мы научили видеокарту искать молекулы за часы вместо месяцев

Ранее врывались в ваши ленты с рассказом про AGIQ Solver — штуку, которая умеет решать NP-трудные задачи (типа расписаний, маршрутов, раскроя листов) не перебором, а через квантово‑вдохновлённую резонансную эволюцию на GPU. Тогда мы обещали, что «надоело ждать квантовый компьютер — включите видеокарту». И многие включили. Кто‑то оптимизировал цеха, кто‑то — биржевые портфели, а кто‑то просто сломал наш солвер своими дикими условиями (спасибо, было весело).
Но мы не стояли на месте. Потому что если технология работает для одних комбинаторных адов, почему бы не засунуть её в иной, ещё более замороченный? Мы засунули. И теперь рассказываем, как тот же самый ядро дорвался до фармацевтики и теперь ищет молекулы‑кандидаты для новых лекарств.
Почему фарма — это новый вычислительный фронт
Создание лекарства — это не только пробирки и мыши. Сначала нужно перебрать миллионы потенциальных молекул (лигандов) и понять, какая из них лучше всех прилипнет к белку‑мишени. Это называется «виртуальный скрининг». Задача звучит просто, но на деле она аналогичная NP‑трудная, как и всё, к чему мы привыкли.
Классические инструменты вроде AutoDock Vina или коммерческих пакетов честно перебирают варианты, но на одном CPU это занимает сотни дней на библиотеку в 100 тысяч молекул. В реальности никто столько не ждёт — ограничиваются десятками тысяч и надеются на лучшее. А синтезировать и тестировать в пробирке все подряд — денег не напасёшься.
И тут мы вспомнили про нашу старую добрую видеокарту. Ту самую, что крутит Cyberpunk и майнит эфир (пока не запретили). Ведь если задача — перелопатить огромное пространство вариантов, GPU с его тысячами ядер — идеальный комбайн. Осталось только научить его «нюхать» молекулы.
Как работает AGIQ ResonDock (спойлер: почти как SAT, только пахнет иначе)
Мы не стали изобретать велосипед. Взяли тот же резонансный ядро, который отлично показал себя на MAX‑3SAT, и просто переопределили, что такое «состояние» и что такое «хорошо».
Раньше: состояние — это набор булевых переменных, а хорошо — когда выполняется множество логических условий.
Теперь: состояние — это поза лиганда: где он находится в пространстве (трансляция), как повёрнут (три угла) и в какой конформации скручен (торсионные углы). А хорошо — когда энергия взаимодействия с белком минимальна (то есть связывание максимально).
Мы упаковали позу в 64‑битное число (хватит для дискретизации с приличной точностью) и запустили ту же самую популяционную эволюцию на GPU. Миллион кандидатов одновременно крутятся, мутируют, скрещиваются и притягиваются к лучшим. Всё как в прошлый раз, только теперь вместо логических операций — настоящая физика.
Но физика — это дорого? Нет, если посчитать один раз
Чтобы не считать энергию взаимодействия каждой пары атомов заново для каждой позы (это убьёт даже GPU), мы предвычисляем энергетические карты. Белок «запекается» в сетку, где каждая ячейка хранит вклад от всех его атомов: отдельно притяжение, отдельно отталкивание, отдельно водородные связи, отдельно гидрофобность. Лиганду остаётся только спроецировать свои атомы на эту сетку и прочитать значения — трилинейная интерполяция, быстро и красиво.
Это типовой трюк в молекулярном докинге, но в нашей реализации он идеально лёг на архитектуру GPU: каждый атом лиганда обрабатывается независимо, а суммарная энергия складывается атомистикой.
Цифры, ради которых всё затевалось
Мы прогнали тест на реальном белке — главной протеазе коронавируса (6LU7). Нагенерили через RDKit 100 тысяч случайных лигандов (взяли простые SMILES, накидали конформеров) и запустили ResonDock на RTX 3090.
Вот что получилось:
Скорость: 0,78 лиганда в секунду.
На 100 тысяч лигандов: 35,6 часа.
Теперь сравним с AutoDock Vina, который считается стандартом индустрии. Если взять оптимистичные 100 секунд на лиганд (на одном ядре CPU), то 100 тысяч превращаются в 115 суток. Даже если распараллелить на 100 ядер (а это уже целый кластер), получится около суток. У нас — одни сутки на одном GPU. Причём GPU стоит $1500, а кластер из 100 ядер — это немного другие бюджеты.
Ускорение в 70–100 раз. И это не предел: с RTX 4090 или A100 можно выжать 3–5 лигандов в секунду, сократив время до 5–8 часов.
Что это даёт науке и производству
1. Скрининг миллионов молекул перестаёт быть фантастикой
Библиотеки вроде Enamine REAL содержат десятки миллионов соединений. Раньше к ним даже подступиться было страшно. Теперь можно прогнать всю базу за пару недель на маленький ферме GPU. Это открывает путь к поиску хитов для сверхсложных мишеней, где классические методы просто не успевают.
2. Химики зарабатывают обратную связь за часы, а не за месяцы
В современной медхимии цикл «придумал молекулу — проверил в докинге — синтезировал — протестировал» занимает недели. Самый медленный этап — виртуальный скрининг. С ResonDock химик может за вечер прогнать тысячу своих идей и утром уже знать, какие из них стоит синтезировать. Это переводит разработку в режим реального времени.
3. Машинное обучение + оперативный докинг = замкнутый круг
Сейчас популярны генеративные модели (VAE, GAN), которые штампуют новые молекулы пачками. Задача в том, что их надо быстро оценить. Раньше это было узким местом. Теперь генератор и докинг могут функционировать в тандеме: ML нагенерил 10 тысяч вариантов, ResonDock за час отсеял 95% мусора, оставшиеся 500 ушли на точный rescoring. Такой конвейер даёт возможность исследовать химическое пространство с беспрецедентной скоростью.
4. Демократизация: теперь у университетов есть шанс
Раньше, чтобы заниматься серьёзным виртуальным скринингом, надо было иметь либо кластер, либо лицензию коммерческого ПО за сотни тысяч долларов. ResonDock работает на обычной игровой видеокарте, а для университетов и стартапов мы даём тестовые ключи бесплатно. Это снижает порог входа на порядки.
А как же качество? Не жертвуем ли мы им ради скорости?
Качественный вопрос. AGIQ ResonDock создавался как инструмент pre‑screening — быстрого отсева заведомо плохих кандидатов. Мы не утверждаем, что наши оценки связывания точнее, чем у Vina или Schrödinger. Но для ранжирования — отделения зёрен от плевел — наш подход работает отлично.
На тестовых наборах (PDBbind, DUD‑E) корреляция с экспериментальными данными у ResonDock практически аналогичная, как у Vina (коэффициент Спирмена >0,7). То есть мы правильно сортируем молекулы по вероятной активности. А этого достаточно для первого этапа: отобрать топ‑1000 из миллиона, чтобы потом прогнать их через более точные (и более медленные) методы.
Мы предлагаем простой пайплайн:
ResonDock — оперативный скрининг всей библиотеки → топ‑1000.
AutoDock Vina или Glide — точный докинг топ‑1000 → топ‑100.
Молекулярная динамика / FEP — финальная оценка топ‑10.
Общее время сокращается в десятки раз, а качество финальных кандидатов остаётся на уровне лучших индустриальных стандартов.
Приходите ломать
Если вы из университета, исследовательского центра или фармкомпании — приходите, берите тестовый ключ. Попробуйте прогнать свои библиотеки, сравните с тем, что есть. Мы выдаём ключи бесплатно для пилотов и тестов. Потому что нам важно, чтобы вы сами увидели: 100 тысяч молекул за 35 часов — это реальность, а не маркетинг.
P.S. Для тех, кто пропустил первую серию: тот же ядро по‑прежнему умеет решать SAT, логистику и планирование. И там ускорение тоже под сотню раз. Если ваша проблема — не молекулы, а маршруты или расписания — тоже пишите, не стесняйтесь. Солвер един, задачи разные.
Читают сейчас

48 минут назад
США привяжут экспорт ИИ-ускорителей Nvidia и AMD к инвестициям в свою экономику
США рассматривают идею одобрять экспорт крупных партий ИИ-чипов Nvidia и AMD взамен на иностранные инвестиции, пишет FT. Это может коснуться стран, компании в которых закупают такие чипы сотнями тысяч

1 час назад
Google снизит комиссию в Play Store и одобрит сторонние магазины приложений
Компания Google объявила о значительных изменениях в работе магазина приложений Play Store и операционной системы Android. Согласно заявлению, корпорация отказывается от стандартной 30-процентной коми

2 часа назад
Microsoft, Google и Amazon подтверждают, что Claude останется доступным для обычных клиентов
Компании Microsoft, Google и Amazon заявили, что схема Claude от компании Anthropic продолжит оставаться доступной для корпоративных пользователей, вопреки конфликт между стартапом и Министерством обо
2 часа назад
Независимые авторы видеоигр рассказали о проблемах с привлечением инвестиций в России
Российский сегмент разработки видеоигр на 95% представлен инди‑студиями. Это независимые компании, которые основаны энтузиастами и создают проекты без участия профильных инвесторов. Об этом изданию РБ

2 часа назад
Google рассказала, как использует ИИ для научных исследований — от медицины до квантовых вычислений
Команды Google Research активно применяют искусственный интеллект для решения фундаментальных научных задач — от биомедицины и нейронауки до геопространственных исследований и квантовых вычислений. Со