ICML 2024 — 41-я международная конференция по машинному обучению, которая прошла в Вене с 21 по 27 июля. В Шанхайском рейтинге, который оценивает ведущие университеты со всего мира по научным и академическим достижениям, она занимает третье место в категории Computer Science & Engineering, а также входит в рейтинг конференций CORE и причисляется им к уровню A* (самый престижный). Участие в таких конференциях позволяет ученым выходить на международный уровень и делать коллаборации с другими научными группами. На конференции ведущие компании со всего мира выступают с прорывными разработками в области нейросетей и машинного обучения. Всего в этом году участники представили 180 устных и 2283 постерных доклада.
Ученые из Центра искусственного интеллекта в химии ИТМО выступили с докладом «Применение ИИ для прогнозирования морфологических свойств наноматериалов» (Unveiling the potential of AI for Nanomaterial Morphology Prediction).
Исследователи разработали подход на основе машинного обучения для прогнозирования морфологических свойств наночастиц: их размера, структуры и формы, — а также создали первый прототип генеративной модели для создания изображений этих частиц.
«Когда мы синтезируем новые наноматериалы, важно уметь предсказывать, а, значит, и контролировать их свойства, в частности, морфологию частиц. Эта характеристика влияет на распределение частиц в организме (если речь идет о системах доставки лекарств), их токсичность, каталитические свойства. Возможность заранее предсказывать свойства наночастиц позволяет сократить количество экспериментов и ускорить процесс нахождения новых наноматериалов для разных промышленных применений», — объяснил первый автор статьи, выпускник программы «Химия и искусственный интеллект» Иван Дубровский.
Для обучения модели исследователи использовали датасет с описанием 215 синтезов наноматериалов и таким же числом изображений готовых частиц.
«Для предсказания свойств наночастиц мы впервые использовали большие языковые модели, разработанные Mistral AI и OpenAI. Они достаточно просты в использовании и являются хорошей альтернативой классическим моделям машинного обучения, потому что не требуют серьезных навыков программирования, а еще показывают более точные результаты. В частности, средняя точность предсказания форм наночастиц с помощью GPT 4 составила 81%, что превосходит ранее предложенные подходы», — рассказал второй автор статьи, ведущий научный сотрудник химико-биологического кластера Андрей Дмитренко.
Также ученые разработали прототип генеративной модели, которая позволяет создавать изображения наночастиц на основе описания их синтеза. Сейчас модель ученых предназначена для предсказания свойств частиц карбоната кальция, но в будущем исследователи планируют адаптировать ее и для других наноматериалов. В перспективе алгоритм поможет создать частицы для каталитических реакций и систем доставки лекарств.