Проще и быстрее: алгоритмы машинного обучения помогут в разработке новых люминесцентных красителей

Наука

Российские исследователи научились предсказывать спектральные свойства красителей. Это позволит ученым-химикам в несколько раз сократить время на поиск молекулы с необходимыми свойствами и оптимизировать затраты на ее получение. У обладающих способностью к люминесценции красителей — широкая область применения: в медицине и компонентах светособирающих устройств, например они могут выступать в качестве индикаторов присутствия различных веществ в организме и окружающей среде, агентов фотодинамической терапии в медицине, компонентов солнечных батарей.

Модели на основе алгоритмов машинного обучения, включая нейросетевые технологии, создали ученые из Института химии растворов имени Г. А. Крестова РАН (ИХР РАН, г. Иваново) совместно с коллегами из Ивановского государственного химико-технологического университета.

В науке наблюдается лавинообразный рост интереса к использованию методов машинного обучения для работы с большими данными. Одна из областей применения методов машинного обучения — химия красителей. Однако создание «светящихся» красителей — долгая и кропотливая работа химиков, затрачивающих на разработку новой молекулы-красителя с необходимыми свойствами не один год. Использование методов машинного обучения позволит ученому-химику многократно сократить время на разработку такой молекулы, оптимизировать затраты на ее получение и провести валидацию уже имеющихся экспериментальных данных.

Ученые из города Иваново предложили использовать методы машинного обучения для предсказания таких спектральных свойств красителей, как положение максимума полосы поглощения, значения молярного коэффициента поглощения и химического сдвига в спектроскопии ядерного магнитного резонанса.

«Используя передовые алгоритмы машинного обучения и набор из более 20 000 экспериментальных данных, мы смогли обучить несколько моделей точно предсказывать положение максимума полосы поглощения, значения молярного коэффициента поглощения и химического сдвига ядерного магнитного резонанса для широкого ряда красителей. Полученные модели представляют собой удобный web-инструмент, который способен предсказывать заданные свойства для одной или тысячи молекул всего за несколько секунд и который требует от пользователя только введения SMILES интересующей молекулы (Simplified Molecular Input Line Entry System — система упрощенного представления молекул в строке ввода, информация о ее структуре). Кроме того, точность, интуитивность моделей и время предсказания составляют сильную конкуренцию методам, основанным на теории функционала плотности, используемым в данной области для предсказания спектральных свойств красителей», — рассказывает Александр Ксенофонтов, кандидат химических наук, старший научный сотрудник лаборатории компьютерного синтеза химических соединений ИХР РАН.

Как отмечают в научном институте, Web-инструмент представляет собой общедоступный сайт, на который пользователь добавляет SMILES интересующего его соединения или реакции, выбирает предсказываемое свойство и практически мгновенно получает результат.

Сайт расположен по ссылке http://chem-predictor.isc-ras.ru/en/ и на данный момент находится в активном наполнении разработанными моделями на основе методов машинного обучения.

Сейчас ученые собирают данные по различным химическим и биологическим свойствам соединений различных классов, создают новые модели при помощи различных алгоритмов методов машинного обучения.

Исследование выполнено в рамках программы мегагрантов (Министерство науки и высшего образования Российской Федерации, 075-15-2021-579), результаты исследования опубликованы в ряде международных журналов.

Программа мегагрантов реализуется в рамках нацпроекта «Наука и университеты» для поддержки научных исследований в российских вузах и НИИ под руководством ведущих мировых ученых.


Источник: 10.1016/j.saa.2022.121442

Читать также