Малярия — от этого заболевания умер знаменитый итальянский поэт и гуманист Данте Алигьери, португальский путешественник Васко да Гама, поэт и декабрист Александр Одоевский. По сей день эта болезнь поражает огромное количество людей. В 2018 году, по данным ВОЗ, в мире было зафиксировано 228 миллионов случаев малярии. Более 400 тысяч человек погибло. 

В 2019 году малярию выявили в 80 странах мира. Больше всего от болезни страдают жители Африки — на долю этого континента пришлось больше 90% случаев инфицирования. При этом 108 случаев пришлись на Россию.

Переносят эту болезнь, как известно, комары. Именно при укусе этих насекомых в организм человека попадает паразит Plasmodium, который и является причиной заболевания. К малярийным комарам относят 400 видов насекомых, основными переносчиками же считаются 30 из них. Однако по сей день ученые располагали референсным геномом только одного вида.

«Такие геномы важны для сравнения геномов различных видов, — рассказывает сотрудник научно-образовательного центра геномного разнообразия Университета ИТМО Антон Замятин, — чтобы понять, как далеко они находятся друг от друга на древе жизни, как отличаются друг от друга, какие участки их генома отвечают за различия между ними. Так, мы знаем, что некоторые малярийные комары пьют кровь как людей, так и животных, некоторые предпочитают исключительно человека. Нам важно понять геномные причины такого различия в пищевом поведении и, возможно, найти способ влиять на “диету” тех или иных видов».

Антон Замятин. Фото из личного архива
Антон Замятин. Фото из личного архива

Что такое референсный геном?

Ученые Политехнического университета Вирджинии, Университета Джорджа Вашингтона и Университета ИТМО запустили совместный проект, в ходе которого должны были собрать референсные геномы двух видов африканских малярийных комаров: Anopheles coluzzii и Anopheles arabiensis.

«Геномы могут быть собраны на различных уровнях, — объясняет Антон Замятин. — В ходе процедуры секвенирования мы получаем короткие последовательности символов, считанных с разных участков генома. Эти последовательности можно собрать до уровня контигов, то есть отдельных сегментов ДНК. Однако, они выглядят не так же, как в целой хромосоме. Это просто набор каких-то отрывочных сведений. Следующий уровень сборки геномов происходит с помощью процедуры скаффолдинга или ориентации и сортировки контигов в том порядке, в котором они идут в реальном геноме. Как только мы их переориентировали, поставили друг за другом в нужном порядке, можно говорить о том, что у нас есть геном уровня скаффолдов».

Однако это далеко не предел. Сегодня ученые могут так глубоко проанализировать геном, что их сборки будут напоминать целые хромосомы. То есть исследователи могут понять, как выглядит последовательность генома в хромосоме от начала до конца. 

Анализ генома. Источник: shutterstock.com
Анализ генома. Источник: shutterstock.com

Лучшие и самые точные сборки для каждого вида называют референсными. Они хранятся в базах данных, их используют ученые по всему миру в качестве эталона. С их помощью выявляют индивидуальные отличия тех или иных особей, видов или популяций друг от друга.

«До настоящего момента сборка такого уровня существовала только для малярийного комара Anopheles gambiae. Скорее всего, во всех геномных исследованиях на комарах в качестве объекта сравнения использовалась именно эта сборка. Мы хотели собрать геномы еще двух комаров так, чтобы наши сборки не уступали по качеству этой. В результате мы получили даже лучший результат», — поясняет Антон Замятин.

Два года работы

Исследования были начаты в 2018 году. Выделение генома и его секвенирование происходили в Политехническом университете Вирджинии — там ученые содержат в экспериментальных целях целые колонии насекомых, разделенных по видам. После этого специалисты Университета ИТМО приступили к сборке генома.

«Сборка генома комара — это задача среднего уровня сложности, — поясняет Антон Замятин. — С одной стороны, у него достаточно большой геном: 300 миллионов символов, всего в десять раз меньше, чем у человека. С другой стороны, у комаров всего три пары хромосом, а не 23, как у человека. Одна из проблем заключается в том, что комаров не секвенируют индивидуально, используется материал со всей колонии. То есть в секвенатор попадает генетический материал множества особей, и на выходе мы видим все индивидуальные различия отдельных комаров, которые необходимо нивелировать, чтобы собрать референсный геном».        

Политехнический университет Вирджинии. Источник: vt.edu
Политехнический университет Вирджинии. Источник: vt.edu

На этом сложности не закончились. После первоначальной сборки генома настала очередь скаффолдинга. Для этого процесса ученые использовали данные, дающие представление о пространственной структуре хроматина внутри ядра клетки и позволяющие правильно ориентировать контиги относительно друг друга. Использованные для этой задачи биоинформатические программы, однако, не всегда полностью удовлетворяли их потребностям. «В какие-то моменты приходилось связываться с разработчиками, указывать на ошибки, которые мы находили, — вспоминает Антон Замятин. — В результате мы, в конце концов, решили написать свое приложение. Сейчас как раз находимся в процессе».

Перспективы

Помимо собственно сборки референсных геномов в статье представлен первичный анализ полученных данных. В частности, ученые искали геномные перестройки, то есть изменения в структуре генома, которые произошли в процессе эволюции. Именно такие перестройки могут отвечать за различное поведение или физиологию видов.

«Сама последовательность — это достаточно интересно, но дальше происходит функциональная аннотация. Мы находим участки, которые отвечают за гены, присутствующие в том или ином организме. В эволюционном процессе могут происходить события, в результате которых последовательность участков геномов может меняться, что, кстати, наблюдается у комаров. Это может влиять на то, насколько хорошо комары переносят возбудителя малярии, кровью каких организмов они предпочитают питаться и так далее», — объясняет Антон Замятин.

Анализ хромосом Anopheles coluzzii и Anopheles arabiensis. Иллюстрация из статьи. Источник: academic.oup.com
Анализ хромосом Anopheles coluzzii и Anopheles arabiensis. Иллюстрация из статьи. Источник: academic.oup.com

Получение этих данных позволит ученым начать новые исследования — с целью препятствовать распространению малярии. Ученые же Университета ИТМО планируют новые проекты, связанные со сборками референсных геномов других видов малярийных комаров. 

Anton Zamyatin, Pavel Avdeyev, Jiangtao Liang, Atashi Sharma, Chujia Chen, Varvara Lukyanchikova, Nikita Alexeev, Zhijian Tu, Max A Alekseyev, Igor V Sharakhov. Chromosome-level genome assemblies of the malaria vectors Anopheles coluzzii and Anopheles arabiensis. GigaScience, 2021/10.1093/gigascience/giab017