Сегодня практически любое биологическое исследование сопровождается генерацией огромных объемов экспериментальных данных. При этом старые методы, применяемые в биологии, уже не справляются с их обработкой. На помощь приходит системная биология и биоинформатика, позволяющая использовать для решения биологических задач компьютерные, математические и статистические методы.

В последние годы методы биоинформатики и системной биологии применяются для решения широкого круга задач – от фундаментальной науки до клинической практики и индустрии. Например, с помощью компьютерных и статистических методов выполняются задачи по сборке генома, поиску и изучению функций генов, предсказанию функций белков, неонатальной диагностике на генетические заболевания, подбору терапии для пациентов с раковыми и другими заболеваниями и даже разработке лекарств.

Вопросами, связанными с изучением и разработкой эффективных вычислительных методов для актуальных задач биологии и медицины, еще в 2010 году стали заниматься специалисты Международной научной лаборатории «Компьютерные технологии». Сегодня проекты группы биоинформатики покрывают достаточной широкий спектр задач: от обработки данных метагеномного ДНК-секвкенирования до анализа экспрессии генов и метаболомики.

Спустя несколько лет ученым удалось наладить сотрудничество с Максимом Артемовым, профессором Университета Вашингтона в Сент-Луисе (Washington University in St. Louis), специалистом в области системной иммунологии, и реализовать ряд совместных исследований. Кроме того, результатом совместной работы стала организация семинара по системной биологии в Петербурге. Первое мероприятие состоялось в 2014 году и собрало экспертов из американских и российских университетов и научных центров, а также более двух десятков программистов и биологов из Петербурга и Москвы, которые смогли расширить свои знания в области системной биологии.

Здесь и далее: Летняя школа по биоинформатике. Источник: vk.com/bioinf
Здесь и далее: Летняя школа по биоинформатике. Источник: vk.com/bioinf

С тех пор Университет ИТМО и Институт биоинформатики ежегодно организовывают в Санкт-Петербурге семинар по системной биологии с участием приглашенных лекторов из Университета Вашингтона в Сент-Луисе (Washington University in St. Louis) и Гарвардского университета (Harvard University). Программа семинара традиционно включает как теоретический (лекционный) блок, так и практические модули, в которых участники проходят полный путь по биоинформатической обработке и анализу полногеномных экспериментов, а также получают возможность обсудить биологические следствия полученных результатов.

Постоянными спикерами семинара выступают Максим Артемов (Washington University in St. Louis), Никита Артемов (Harvard University, Massachusetts General Hospital, Broad Institute), Александр Предеус (Институт биоинформатики). Кроме того, в 2016 году специальным гостем семинара стал основатель и лидер современной статистической генетики Марк Дейли (Harvard University, Massachusetts General Hospital, Broad Institute). В 2018 году семинар состоится уже в пятый раз. Он пройдет с 13 по 18 мая в пригороде Санкт-Петербурга. В качестве гостевых лекторов этом году будут выступать Сергей Джуранович (Washington University in St. Louis) и Марко Йованович (Columbia University).

«Если все начиналось с четырех человек в лаборатории, то сейчас исследованиями в области биоинформатики у нас занимаются порядка десяти человек, они активно пишут статьи с зарубежными учеными, публикуясь при этом в топовых научных журналах, ездят в лабораторию Максима Артемова и выполняют совместные исследования, — рассказывает Алексей Сергушичев, доцент кафедры компьютерных технологий, руководитель магистерской программы «Биоинформатика и системная биология». — Деятельность стала системной. И в какой-то момент логичным продолжением этой работы стала идея организовать собственную магистерскую программу по биоинформатике и системной биологии. С этой идеей мы обратились к директору Института биоинформатики Николаю Вяххи. И в итоге пришли к решению, что начать стоит с организации такой программы прежде всего для биологов, которые хотят получить необходимые знания в области программирования для решения своих прикладных задач».

Алексей Сергушичев
Алексей Сергушичев

Такое решение обусловлено, во-первых, тем, что в Академическом университете уже существует программа «Алгоритмы и анализ данных в биоинформатике», ориентированная на программистов, а во-вторых, оно объясняется более высоким спросом на обучение в области биоинформатики именно со стороны биологов, добавляет он. В последние годы все больше биологов стало интересоваться как летними школами по биоинформатике, так и соответствующими годичными программами дополнительного образования, которые реализуются в Институте биоинформатики.

Кроме того, в Университете ИТМО — ведущем вузе в области Computer Science (университет входит в сотню лучших мировых вузов по результатам предметного рейтинга THE Computer Science, команды вуза являются семикратными победителями чемпионата мира по спортивному программированию ACM ICPC) – студенты, уже обладающие базовыми знаниями в области биологии, смогут на серьезном уровне обучиться программированию и современным методам обработки данных, необходимым для решения задач в биологии и медицине.

Особенности обучения

Программа включает в себя курсы как по основам высшей математики, дискретной математике и алгоритмам, теории вероятностей и математической статистике, программированию на языках Python и R, машинному обучению, так и по медицинской и популяционной генетике, сравнительной геномике и метагеномике, анализу транскриптомных и протеомных данных, метаболомике, анализу эпигенетической регуляции, а также структурной биоинформатике.

Все это позволит выпускникам не только объединить накопленные знания в общую картину и понять межсистемные взаимодействия в биологии, но и решать задачи, стоящие перед фундаментальной наукой и медициной, говорит Алексей Сергушичев.

Летняя школа по биоинформатике. Источник: vk.com/bioinf
Летняя школа по биоинформатике. Источник: vk.com/bioinf

«Так как на традиционном биофаке не учат программированию, мы уделяем этому достаточно много внимания. В том числе мы включаем в образовательный блок машинное обучение, что в целом представляет собой достаточно нетривиальную концепцию. Мы хотим, чтобы наши студенты не боялись вычислительных задач и научились сами делать те вещи, которые ранее были недоступны без помощи программистов. Здесь подразумевается, например, способность самостоятельно написать скрипт, который поможет собрать данные, а также их проанализировать, и другие прикладные навыки, которые позволят специалистам-биологам более эффективно выстроить свою работу, избежать ошибок. Сегодня без таких навыков в современной биологии работать очень сложно», — комментирует он.

Обучение на магистерской программе «Биоинформатика и системная биология» будет проходить полностью на английском языке. Блок дисциплин, связанный с программированием, анализом данных и машинным обучением, будут вести специалисты Университета ИТМО. А курсы, посвященные системной биологии, — приглашенные лекторы из российских и зарубежных научных центров и лабораторий, в том числе ученые из Университета Вашингтона в Сент-Луисе, Гарварда и преподаватели из Института биоинформатики.

Обучение будет включать как лекционные форматы, так и практический блок.

«Важной частью образования в области биоинформатики является работа над реальными проектами. Например, в Институте биоинформатики уже отработана система, в соответствии с которой студенты реализуют два крупных проекта в течение года — осенью и весной, — говорит Алексей Сергушичев. — Мы также ориентированы на то, чтобы теория в том или ином формате сопровождалась практикой. По такой же схеме мы реализуем и семинар по системной биологии, на котором после часовой лекции мы даем возможность участникам самим сделать что-то руками. Потому и в рамках магистерской программы мы будем формировать курсы так, чтобы лекциям сопутствовал серьезный практический блок».

Кроме того, студенты получат возможность проходить стажировки в ведущих американских и европейских центрах: уже есть предварительные договоренности с лабораториями Университета Вашингтона в Сент-Луисе и Университета Ниццы — Софии Антиполис (Université de Nice Sophia-Antipolis), а также дистанционно работать над проектами других лабораторий.

Траектории развития

Прежде всего программа ориентирована на подготовку специалистов по биоинформатике, которые хотят продолжить работу над научными исследованиями в аспирантуре. В частности, выпускники магистратуры смогут поступить на ведущие PhD программы по системной биологии и продолжить свою академическую карьеру в ведущих зарубежных и российских научных центрах, говорит Алексей Сергушичев.

Однако в будущем разработчики программы также ориентированы на сотрудничество с индустриальными партнерами. В частности, с совершенствованием технологий секвенирования нового поколения (NGS) уже идет активное развитие персонализированной медицины, где компетенции в области биоинформатики приобретают ключевое значение.

Кроме этого, выпускники программы могут претендовать на должности на фармацевтических и биотехнологических предприятиях, в компаниях, занимающихся разработкой программного обеспечения в области наук о жизни и многих других.

Основные даты и требования для поступающих

Первый набор студентов проходит на 2018-2019 учебный год. Программа рассчитана на прием студентов с базовым биологическим образованием. Поступить в магистратуру можно, сдав вступительный экзамен (в очной или дистанционной форме) или выиграв конкурс портфолио Университета ИТМО. Экзамен включают в себя как вопросы по биологии, так и вопросы по основам математики и программирования.

Летняя школа по биоинформатике. Источник: vk.com/bioinf
Летняя школа по биоинформатике. Источник: vk.com/bioinf

Подача документов осуществляется через страницу программы на сайте «Поступление 2018». Крайний срок подачи документов: 1 июля 2018. Однако до 31 мая можно успеть поучаствовать в конкурсе портфолио. При высокой оценке на конкурсе поступающие получают возможность поступить без экзаменов.

«Несмотря на то, что программа прежде всего ориентирована на биологов и основной блок вопросов посвящен именно биологии, мы также включаем задания по математической части — это достаточно базовые вопросы по программированию. Таким образом, мы подразумеваем, что поступающие знают материал на начальном уровне и готовы развивать свои навыки уже в процессе обучения. Что касается конкурса портфолио, здесь мы учитываем публикации, участие в конференциях, но немаловажным фактором является и мотивация. Прежде всего мы ждем мотивированных студентов, которые готовы повышать свой уровень и решать сложные задачи», — говорит Ксения Спиридонова, координатор программы «Биоинформатика и системная биология».

Алексей Сергушичев добавляет, что в перспективе программа будет расширяться и ориентироваться не только на специалистов и студентов с базовым биологическим образованием, но и на программистов, которые планируют применить свои знания в предметной области и заниматься научными задачами.