У каждого человека есть геном — особая последовательность генов, в соответствии с которой развивается индивид. Однако любой живой организм содержит еще одну последовательность генов, которая называется метагеном и представляет собой совокупность ДНК самых различных микроорганизмов, обитающих в одной среде: бактерий, грибов, вирусов. Метагеном часто является индикатором различных заболеваний и предрасположенности к ним. Поэтому изучение микробиоты, то есть совокупности микроорганизмов, населяющих различные отделы человеческого организма, занимает особое место в метагеномных исследованиях.
Программный инструмент под названием MetaFast, разработанный учеными, позволяет провести быстрый сравнительный анализ большого количества метагеномов.
«При исследовании микрофлоры кишечника пациентов могут быть выявлены микроорганизмы, ассоциируемые с каким-либо заболеванием, например, с диабетом или предрасположенностью к нему. А это уже предпосылки для применения персонализированной медицины и создания новых лекарств. Оперируя результатами работы программы, биологи могут сделать выводы о том, в каком направлении двигаться, поскольку алгоритм позволяет исследовать среды, о которых мы еще ничего не знаем», — рассказывает главный разработчик алгоритма Владимир Ульянцев, сотрудник Международной лаборатории «Компьютерные технологии» Университета ИТМО.
Одной из ключевых особенностей программы является возможность успешно работать со средами, генетическое содержимое которых ранее не было изучено.
«Разработанный подход позволяет сделать сразу две вещи: найти все возможные генетические последовательности, даже если о них не было известно до этого (программа собирает их из кусочков геномных прочтений), и одновременно выделить метагеномные закономерности, которые отделяют одних пациентов от других. Например, людей с заболеванием и без», — отмечает Дмитрий Алексеев, руководитель проекта, заведующий лабораторией сложных биологических систем МФТИ.
Таким образом, с помощью программы можно проводить нецелевой экспресс-анализ маркеров, указывающих на наличие каких-либо заболеваний. Затем, используя целевые методики, такие как ПЦР (полимеразная цепная реакция — способ многократного копирования фрагментов ДНК), подтверждать и корректировать результаты. По словам ученых, программа потенциально способна сократить сроки создания новых лекарств в несколько раз.
Схема работы MetaFast. Источник: Bioinformatics
Схема работы MetaFast. Источник: Bioinformatics
Не размножающиеся в пробирке микроорганизмы, такие как вирусы, дают при анализе слишком отрывочные данные, по которым их ДНК собрать невозможно. Однако новая программа позволяет выявлять и такие микроорганизмы.
«Только в составе микробиоты кожи 90% ранее не встречавшихся организмов, — продолжает Дмитрий Алексеев. — Наш подход позволяет работать с абсолютно неизвестным материалом и получать результаты. Программа испытывалась на самых различных средах, в том числе на средах с большим количеством вирусов. Даже единичные ДНК программа находит и собирает».
Диапазон применения MetaFast не ограничивается обнаружением патогенных микроорганизмов. К примеру, сравнение метагеномов самобытных народов в замкнутых популяциях с жителями городов может помочь выделить бактериальные штаммы, крайне полезные для людей, но утерянные в процессе урбанизации. Антибиотики, консерванты, красители и еда из супермаркетов выжили из нашей микрофлоры многие полезные бактерии, которые могли по-прежнему сохраниться, скажем, в обособленных поселениях индейцев или в русских деревнях.
MetaFast показал высокую эффективность при исследовании редких и неизведанных метагеномов. В рамках работы ученые проанализировали метагеном нескольких крупных озер мира. Ничего не зная об образцах микробиоты озер, программа нашла генетическое сходство между теми из них, которые были близки по химическому составу.
Ученые также применили разработанный алгоритм к изучению микроорганизмов, обитающих в нью-йоркской «подземке», тем самым показав его эффективность при анализе даже таких сложных систем. Основная часть собранной с помощью MetaFast ДНК принадлежала уже известным бактериям. Это подтверждает ранее сделанные выводы о том, что метро достаточно безопасно для человека и микробы, которые там живут, подавляют всякую флору, губительную для человека.
В мире уже накоплено гигантское количество экспериментальных данных по различным метагеномам. Благодаря тому, что стоимость извлечения ДНК уменьшается, а чувствительность оборудования увеличивается, объемы этих данных продолжают расти экспоненциально. Но при этом большая часть исследований не доведена до конца. Причина — в существующих технологиях. С одной стороны, ученые могут частично собрать метагеном, но на сборку «мозаики» уходит колоссальное количество времени. С другой стороны, они могут сравнить отдельные кусочки генома с уже известными базами ДНК, в которых, однако, приведено очень ограниченное число бактерий, а вирусов практически нет.
Разработанный алгоритм сочетает в себе сильные стороны этих двух подходов и при этом обеспечивает хорошую скорость обработки данных. Программа экономит оперативную память именно благодаря тому, что частично собирает, частично сравнивает геномы, но не вдается в глубокий сборочный анализ.
Статья: Vladimir I. Ulyantsev, Sergey V. Kazakov, Veronika B. Dubinkina, Alexander V. Tyakht, and Dmitry G. Alexeev. MetaFast: fast reference-free graph-based comparison of shotgun metagenomic data
Bioinformatics, 2016.