«Фолдинг белков ― задача тысячелетия для молекулярной биологии, и мы сильно продвинулись в ее решении. Работа над этой фундаментальной проблемой сродни составлению генома человека. Очень многие отрасли завязаны на использовании белков, функции которых определяются последовательностью аминокислот и механизмом фолдинга ― свертывания. От фолдинга зависит, какие процессы будет запускать белок в живых клетках. В фармакологии гидрофобное ядро свернутого белка отвечает за связывание с лекарствами. В биомедицине фолдинг может раскрыть механизмы возникновения и прогрессии различных заболеваний и затем ― способы их лечения», ― объясняет первый автор исследования, доктор медицинских наук и лидер группы по хемоинформатике в Центре инфохимии ИТМО Сергей Шитяков.
Между тем, протеиновый фолдинг во многом остается загадкой. Аминокислотная последовательность белка может определять его свернутую структуру. Но до конца не ясно, как белок находит конечное свернутое состояние и почему скорость сворачивания относительно высока ― учитывая огромное число возможных метасостояний, через которые может пройти молекула на пути к свернутой форме.
В случае белка, который использовали исследователи, процесс занял наносекунды. Столько времени понадобилось небольшому полипептиду Trp-cage, чтобы свернуться из линейной формы в глобулярную. Этот процесс исследователи смогли предсказать с помощью молекулярной динамики молекулы.
«Одно из важнейших открытий биологии ХХ века – что код ДНК устроен как текст или последовательность нуклеотидов. Переход от текста к физическому объекту со своей функцией, то есть к глобулярной молекуле белка, происходит в момент фолдинга. Одномерная цепочка сворачивается уникальным образом в водной среде и превращается в трехмерную глобулу с определенными свойствами. Не только с практической, но и с философской точки зрения это очень интересный процесс, и мы хотим математически описать, как именно этот переход происходит, используя понятие дробной размерности, изменяющейся между одномерным и трехмерным пределами», ― рассказывает один из научных руководителей исследования Михаил Носоновский, лидер группы по трибоинформатике центра инфохимии, профессор Висконсинского университета.
Как проходила работа
Ключевой в методе стала функция с параметром альфа (α). Она широко используется в физике полимеров, но к белкам еще не применялась. Альфа выводится из топологии молекулы и ее радиуса гирации (вращения), который, по сути, отвечает за компактность свернутого белка.
Ученые впервые рассчитали эту константу для белков. Когда альфа приближается к 0,333, это значит, что белок в глобулярном состоянии, почти свернулся. Если α = 1, мы видим линейную растянутую молекулу, при α = 0,5 ― идеальную цепочку.
Чтобы использовать метод молекулярной динамики для одного белка, нужно сгенерировать огромное число протеиновых конформаций. Для Trp-cage они были получены и помогли найти значения альфы. Теперь, благодаря альфе, такие анализы можно проводить для любого белка, не проводя in vitro эксперименты.
Тот же белок Trp-cage ученые использовали для AlphaFold и других известных алгоритмов для сравнения. Большинство из них не показывает протеиновый фолдинг в динамике, а некоторые требуют использования экспериментальных данных.
Моделирование методом Монте-Карло (Rosetta) ― более быстрый метод. Но для расчета требуется эталонная структура, обычно получаемая кристаллографически. Методы на основе машинного обучения ― например AlphaFold ― относительно быстры и точны, но выдают конечную модель, не учитывая динамику протеинового фолдинга. Глобулярность белка можно также рассчитать с помощью радиуса гирации, но он всегда разный, а в методе ученых ИТМО ключевой параметр ― константа.
В этой работе исследователи приняли точкой завершения фолдинга близкое к конечному метастабильное состояние, когда у молекулы сформировалось гидрофобное ядро и это резко снизило энергию Гиббса. Далее сворачивание продолжается по гидрофильным участкам молекулы вокруг ядра ― тоже важный процесс, но он занимает на порядки больше времени и сопровождается малым снижением энергии Гиббса.
Исследователи уже работают над более полным фолдингом белков в 3–5 микросекунд, который должен превзойти AlphaFold по эффективности.
Что дальше
Как подчеркивает Сергей Шитяков, метод можно применить для разных глобулярных белков. У исследователей уже есть отработанная методология, что позволит создать программу, которая бы рассчитывала альфу для разных белков, в том числе более крупных.
«Можно менять структуру белка или модифицировать раствор: смещать pH, добавлять ионы, лиганды, другие молекулы, например меламин цианурат или циклодекстрин. Они будут влиять на механизм протеинового фолдинга, ― говорит ученый. ― Например, особый класс белков ― шапероны (Hsp90). Они находятся в живых клетках и помогают фолдингу других белков. Есть сведения, что их нормальная функция имеет решающее значение для поддержания здоровья клеток, тогда как нарушение регуляции может способствовать канцерогенезу. Эти функции белков и их изменения можно также исследовать с помощью нашего универсального метода».
Статья: S Shityakov, EV Skorb, M Nosonovsky. Topological bio-scaling analysis as a universal measure of protein folding. R. Soc. Open Sci. 2022.
Тамара Беседина,
Научно-образовательный центр инфохимии ИТМО