Нобелевскую премию по химии присудили за исследования на стыке химии с IT-технологиями. Для исследования свойств белков ученые разработали алгоритмы машинного обучения.
Белки выступают не только строительным материалом для любого организма, но и регулируют все химические реакции, которые лежат в основе жизни. Эти молекулы состоят из аминокислот — «кирпичиков», из которых складывается все живое. Чтобы понимать, какими свойствами обладает белок, нужно знать его трехмерную структуру — то есть взаимное расположение аминокислот в пространстве. Предсказание и проектирование структуры белка — одна из ключевых проблем при создании лекарств.
«Жизнь не могла бы существовать без белков. То, что мы теперь можем предсказывать структуры белков и проектировать наши собственные белки, дает человечеству величайшее преимущество», — сообщается на сайте Нобелевского комитета.
В 2003 году Дэвид Бейкер впервые смог смоделировать из аминокислот новый вид белка, который ранее не встречался в природе. Для этого он разработал алгоритм Rosetta, который впоследствии превратился в Rosetta@Home — проект распределенных вычислений по созданию новых белков и определению их трехмерных форм. С его помощью можно разработать лекарства для борьбы с такими заболеваниями, как ВИЧ, малярия, рак и болезнь Альцгеймера. С тех пор исследовательская группа Бейкера создавала другие новые белки, которые можно использовать при создании лекарственных препаратов, вакцин, наноматериалов и крошечных датчиков.
«С предсказания структуры белков начинается все, что связано с in silico моделированием лекарств. Золотой стандарт определения трехмерной структуры белков — экспериментальный, с применением специальных физико-химических методов, например, рентгеноструктурного анализа. Однако этот процесс очень медленный и дорогостоящий. Предсказание структуры белка с помощью алгоритмов ИИ в разы ускоряет любое исследование: моделирование лекарств, фундаментальное понимание того, как устроено живое, материаловедение, медицинская диагностика. Поэтому все ждали эту премию, она была только вопросом времени», — рассказала профессор, директор центра инфохимии Университета ИТМО Екатерина Скорб.
Второе открытие связано с предсказанием структур белков на основе последовательностей аминокислот — эту проблему исследователи пытались решить с 1970-х годов. Наконец, в 2018 году произошел научный прорыв: британцы из Google DeepMind Демис Хассабис и Джон Джампер разработали модель искусственного интеллекта для предсказания сложной структуры белков по их аминокислотной последовательности — AlphaFold. С ее помощью они смогли предсказать структуру практически всех 200 миллионов белков, которые идентифицировали исследователи к 2022 году. За все время программой воспользовались более двух миллионов человек из 190 стран. Благодаря этой работе ученые, в частности, могут лучше исследовать устойчивость к антибиотикам и создавать ферменты, разлагающие пластик.
«Лауреаты научились предсказывать конечную структуру белков с помощью алгоритмов машинного обучения, но до сих пор остается непонятным, как именно осуществляется молекулярный механизм фолдинга белков. В научно-образовательном центре инфохимии ИТМО мы как раз исследуем фундаментальные аспекты этого механизма», — доктор медицинских наук, профессор научно-образовательного центра инфохимии Сергей Шитяков.
Также ученые ИТМО создают свои алгоритмы для изучения структуры белков. Например, в 2022 году исследователи нашли универсальную константу для предсказания фолдинга белков. Для этого они разработали алгоритм, который вычисляет, в какой размерности находится молекула: 2D, 3D или в промежуточном состоянии. Метод позволяет быстро определить стадию фолдинга биомолекул и посмотреть на их сворачивание в динамике, что нельзя сделать в существующих подходах.