По пунктам:
- Начнем с простого: что такое ДНК?
- Говорят, ДНК можно получить из волоса, слюны, крови. А каким образом?
- А есть еще геном. Это одно и то же?
- Я все время слышу: расшифровали геном того, расшифровали геном сего. А кто его зашифровывает?
- Говорят, по геному можно проследить генетическую историю. Это что-то типа ДНК-теста?
- А как ученые берут кровь или шерсть у современного льва, а получают данные о его предках?
- Мы говорим, что взяли кость тигра раннего палеолита и по ней определили какие-то вещи про целую популяцию. Но как мы отделяем эту информацию от той, что была присуща именно вот этому самому тигру?
- А как мы проверяем наши выводы? Ведь не всегда мы можем выкопать пещерного предка современных животных и удостовериться, что все сходится.
- Зачем нам все это?
Начнем с простого: что такое ДНК?
Каждый более или менее знает, что есть белки, жиры и углеводы. Но еще у нас в каждой клетке есть ДНК, дезоксирибонуклеиновые кислоты, которые отвечают за хранение информации. Для геномного биоинформатика ДНК ― это прежде всего один из главных языков биологии, который состоит всего лишь из четырех букв: A, T, G и C. Эти буквы являются сокращениями имен четырех азотистых оснований, из которых состоит ДНК: аденин (А), цитозин (C), гуанин (G) и тимин (Т). ДНК можно сравнить с компьютерной программой, очень сложной, запутанной, со множеством ошибок и костылей, но, тем не менее, она работает.
Говорят, ДНК можно получить из волоса, слюны, крови. А каким образом?
ДНК содержится почти во всех клетках организма, исключение — эритроциты, которые в зрелом состоянии теряют ядро, чтобы было легче переносить кислород. Поэтому биологический материал для выделения ДНК может быть разнообразен. Процесс выделения ДНК состоит из четырех этапов: разрушение мембраны клеток для высвобождения ДНК; очистка от связанных с ДНК белков; очистка от разного рода примесей; растворение ДНК для хранения. ДНК можно выделить и в домашних условиях, но тогда ДНК будет не очень чистой и ее будет сложно использовать для каких-либо научных исследований. От качества этих процедур будет зависеть и полученная из нее информация. Поэтому необходима лабораторная точность работы специалистов, молекулярных биологов. Проще всего ДНК выделять из крови, потому что это легкий для получения биоматериал. Хотя в эритроцитах ДНК нет, в крови плавает огромное количество других клеток — белых кровяных телец, так что и ДНК из них получается много. Из слюны или кусочков эпителия во рту ― уже меньше, из волос ― еще меньше. Например, чтобы прочитать весь геном достаточно точно, необходима кровь, а не слюна. А для того, чтобы сделать какой-нибудь ДНК-тест, где точность не очень важна ― достаточно и слюны.
А есть еще геном. Это одно и то же?
ДНК — это название молекулы, которая хранит наследственную информацию. Геном ― это совокупность всей ДНК организма со всеми записанными в ней особенностями конкретного вида или даже индивида. Поэтому можно говорить о геноме человека вообще, а можно — о геноме конкретных Васи или Кати. На физическом уровне геном разделен на хромосомы, в случае человека — 23 пары хромосом, 23 от мамы, и 23 от папы, всего 46. Когда организм начинает расти после оплодотворения, в каждой клетке копируется этот набор, но иногда это происходит с небольшими ошибками. Это называется соматическими мутациями. Иногда эти ошибки могут быть весьма критическими и приводить к разным заболеваниям.
Я все время слышу: расшифровали геном того, расшифровали геном сего. А кто его зашифровывает?
Его никто не зашифровывал, но это слово хорошо передает ощущения от работы с геномными данными. Если продолжать аналогию с геномом как с очень сложной программой, можно сказать, что она не только очень сложная, но и очень плохо написана. И кроме собственно четырех букв A, C, G и Т, он содержит много дополнительных уровней кодирования информации, которые не обязательно будут наследоваться и могут меняться в процессе жизни организма. Это часто называют эпигеномом, который изучает эпигенетика. Вся эта неимоверная сложность и создает ощущение расшифровки. Помимо этого, злую шутку здесь сыграл не очень корректный перевод с английского, где использовали слово decoding и encoding, декодировали и закодировали. Код — это просто система условных обозначений, не предполагающая никакого секрета, никакой защиты от взлома. Любой человеческий язык — это код, система дорожных знаков — это код. Шифр — это код, намеренно защищенный от взлома. Но, конечно, в английских терминах меньше романтики, чем в слове расшифровали.
Говорят, по геному можно проследить генетическую историю. Это что-то типа ДНК-теста?
Под ДНК-тестом часто имеют в виду анализ только некоторых небольших участков генома, вариации в которых имеют какой-то известный эффект. В геномных исследованиях ученые работают с гораздо большим количеством ДНК, в идеале со всей доступной информацией. Это называется полногеномными исследованиями. Но даже генетических тестов, направленных на выяснения значения только некоторых фрагментов генома, часто достаточно для того, чтобы проследить генетическую историю или оценить степень родства между двумя людьми. Это возможно, во-первых, благодаря тому, что у нас в геноме есть фрагменты, которые очень вариабельны и отличаются у разных людей, и, во-вторых, благодаря математике.
А как ученые берут кровь или шерсть у современного льва, а получают данные о его предках?
Есть очень сложные математические алгоритмы, которые позволяют по генетическим данным найти наиболее вероятный сценария развития событий: когда происходили мутации отдельных фрагментов, которые привели к образованию того генома, который мы видим сейчас. Своего рода, математическая машина времени. Ученые ИТМО недавно опубликовали программу, направленную как раз на решение проблемы — как наиболее точно заглянуть в прошлое генома. Одним из самых захватывающих расширений этого подхода является добавление еще и географических точек. Тогда мы можем не только смоделировать, как происходили изменения в геноме, ни и посмотреть, как отдельные популяции с этими геномными вариациями перемещались из одной точки в другую.
Мы говорим, что взяли кость тигра раннего палеолита и по ней определили какие-то вещи про целую популяцию. Но как мы отделяем эту информацию от той, что была присуща именно вот этому самому тигру?
Мы стараемся получить модель, которая наиболее правдоподобно описывает сценарий развития событий в прошлом. Чтобы сделать модель более точной, одного образца часто недостаточно, и чем больше образцов у нас есть, тем более точной становится наша модель. У каждого из нас очень много редких генетических вариантов, бывают и варианты, которые присущи только нам. И если у нас есть уже несколько образов, то такие индивидуальные варианты ученые отфильтровывают именно затем, чтобы они не мешали анализу. Так как единицей эволюции является популяция, а не отдельный индивид.
А как мы проверяем наши выводы? Ведь не всегда мы можем выкопать пещерного предка современных животных и удостовериться, что все сходится.
Хорошие модели обладают предсказательной способностью. Проверить проще всего новыми данными, которые не должны противоречить модели, но случается, что они противоречат, и тогда модель приходится пересчитывать. Сейчас мы наблюдаем очень красивую иллюстрацию мутаций, эволюции и вот этого всего на примере геномов коронавируса SARS-CoV-2. Настолько подробных данных об эволюции отдельного вида в реальном времени у человечества еще никогда не было. И появляется все больше данных и для остальных геномов. Со временем модели будут все лучше и лучше, а чем больше данных ― тем лучше модели.
Зачем нам все это?
Кроме того, что это захватывающе любопытно, это имеет множество практических применений во всех сферах деятельности человека. Если продолжать рассуждать об исследовании истории предков, то есть математический аппарат для поиска так называемых событий бутылочного горлышка, когда размер популяции по каким-то причинам резко сократился. Поиск таких событий, своего рода, геномная археология, может дать нам подсказки, как таких событий избежать. Это важно особенно сейчас, когда многие виды животных бесследно исчезают с лица земли.