Химические инженеры MIT разработали вычислительную модель, которая с помощью машинного обучения предсказывает, насколько хорошо любая молекула будет растворяться в органических растворителях. Это критически важный этап в синтезе практически любого фармацевтического препарата, сообщает MIT News.
Практическое значение открытия
Новая модель, предсказывающая количество растворенного вещества в конкретном растворителе, поможет химикам выбирать оптимальные растворители для синтеза. Как отмечает Лукас Аттия, аспирант MIT и соавтор исследования: «Предсказание растворимости действительно является ограничивающим этапом в синтетическом планировании и производстве химикатов, особенно лекарств».
Исследователи сделали свою модель общедоступной, и многие компании и лаборатории уже начали её использовать. Особенно полезной модель может оказаться для идентификации менее опасных растворителей по сравнению с commonly используемыми промышленными аналогами.
Это классический пример того, как машинное обучение решает задачи, которые десятилетиями оставались сложными для традиционных методов. Точность предсказаний в 2-3 раза выше классической модели Абрахама — это не incremental improvement, а качественный скачок для фармацевтической индустрии.
Технические детали подхода
Модель была обучена на dataset BigSolDB, который содержит данные из nearly 800 публикаций с информацией о растворимости approximately 800 молекул в более чем 100 органических растворителях. Исследователи использовали два типа моделей:
- FastProp — использует статические embeddings молекул
- ChemProp — обучает embeddings одновременно с предсказанием растворимости
Обе модели были обучены на более чем 40,000 точек данных, включая влияние температуры. При тестировании на 1,000 solutes, не участвовавших в обучении, модели показали точность в 2-3 раза выше традиционной модели Абрахама.
Исследование опубликовано в Nature Communications под руководством Уильяма Грина, профессора химического инженеринга MIT.
Оставить комментарий