Физики МГУ разработали новую модель для ускоренной разработки лекарств

Сотрудники физического факультета МГУ применили методы машинного обучения для создания новых моделей лекарственных соединений. Это может существенно ускорить и упростить процесс разработки лекарств. Работа опубликована в журнале Scientific reports Nature publishing group. 

Разработка лекарственных препаратов – очень дорогой и долгий процесс. Он занимает в среднем 10-13 лет. Разработка делится на несколько этапов. Одним из наиболее важных этапов является поиск новой молекулы, способной воздействовать на белок-мишень. Это чрезвычайно сложная задача, так как количество всех химически возможных молекул огромно и составляет по разным оценкам от 1023 до 1060. К настоящему моменту синтезировано только 108 молекул. Для поиска новых структур практически всегда используют компьютерные методы.

Выделяют два основных типа вычислительных методов.

Суть первого заключается в определении конкретного участка белка, на который воздействует молекула. Для получения нужного эффекта молекула воздействует на белок, связываясь с ним. Можно попытаться вычислить конфигурацию того участка белка, через который происходит связь с молекулой, и оптимизировать структуру молекулы так, чтобы «состыковка» прошла как можно успешнее.

Второй тип – это методы, основанные на информации об уже известных химических соединениях, связывающихся с белком. Можно установить связь между физико-химическими свойствами соединения и его активностью в отношении белка и использовать это знание для создания новых молекул.

Но поиск новых молекул, способных воздействовать на белок, является сложной задачей. Поэтому в настоящее время активно исследуется возможность применения методов машинного обучения для генерации таких молекул.

Опубликованные ранее модели требуют данные об известных молекулах, связывающихся с белком, или информацию о его трехмерной структуре. Для новых белков-мишеней для получения такой информации необходимо привлекать дополнительные методы. 

«Так, например, для новых белков, таких как вирусные белки SARS-CoV-2, вызывающие инфекционное заболевание COVID-19, данные по аффинности связывания с какими-либо соединениями отсутствовали. В таком случае, скорее всего не удастся применить подходы, использующие дообучение модели на связывающихся с белком молекулах. Подходы, основанные на структуре белка, также могут быть неприменимы, так как для некоторых белков определение трехмерной структуры затруднено или даже невозможно. Предложенная модель требует лишь знание аминокислотной последовательности белка, что значительно упрощает задачу поиска молекул», – рассказывает сотрудник кафедры биофизики физического факультета МГУ имени М.В. Ломоносова Дарья Гречишникова.

Модель на основе машинного обучения, разработанная сотрудниками физического факультета МГУ имени М.В. Ломоносова, может существенно ускорить и упростить процесс разработки лекарств. Она позволит быстро и эффективно создавать молекулы, способные взаимодействовать с конкретным белком.