Что это за наука, чем занимаются программисты-биологи и к чему могут привести их исследования ― рассказывают Антон Замятин, сотрудник лаборатории компьютерных технологий ИТМО и научно-образовательного центра геномного разнообразия, и Оксана Иванова, выпускница программы «Биоинформатика и системная биология» и сотрудник Национального Медицинского Исследовательского Центра им. В. А. Алмазова.

По пунктам:

  1. Что такое биоинформатика?
  2. Как она появилась?
  3. Зачем нужна биоинформатика?
  4. Где используется биоинформатика?
  5. А где еще?
  6. Чем занимается биоинформатик?
  7. Так биоинформатик — все-таки программист или биолог?
  8. Как биоинформатика может изменить наше будущее?

Что такое биоинформатика?

Это междисциплинарная область, которая использует компьютерные, математические и статистические методы для решения биологических задач. Современное определение биоинформатики еще не устоялось, ведутся споры о том, выделять ли ее как отдельную науку или рассматривать как набор вычислительных методов биологии. Если отталкиваться от названия и сути, получится, что биоинформатика — это научная область, исследующая информационные процессы в биологии.

Как она появилась?

В 50-е годы человечество совершило огромный скачок в понимании матричных процессов в биологии. Уотсон и Крик представили модель ДНК, затем Сэнгер расшифровал аминокислотную последовательность белка инсулина. Важно понимать, что все матричные процессы — процессы информационные. Генетическая информация — это код, а там, где мы говорим про коды, неизбежно возникают вычислительные методы. Первой задачей подобного рода стало секвенирование белков — то есть определение точной последовательности аминокислот в молекуле белка. Чтобы сделать это вручную, нужны огромные временные и трудовые затраты. Так появилась первая программа COMPROTEIN. Ее в 1962 году написала Маргарет Дейхов, которая и считается матерью биоинформатики.

Зачем нужна биоинформатика?

При дальнейшем изучении матричных процессов и других задач стало понятно, что обходиться без вычислительных методов невозможно — прежде всего из-за объема данных, с которыми приходится работать. Например, геном человека состоит примерно из 3 млрд нуклеотидов, и если каждый из них кодировать одним символом, он будет занимать 3 Гб памяти. Современная биология ежегодно накапливает огромные массивы данных, для обработки которых необходимо грамотное владение компьютерными методами и специальными алгоритмами.

Где используется биоинформатика?

В биологии, медицине и фундаментальной науке, прежде всего для определения последовательности ДНК (геном), РНК (транскриптом ― экспрессия генов) и белков (протеом). Геном человека позволяет приблизиться к пониманию не только общих биологических и молекулярных процессов в организме, но и понять индивидуальные различия между каждым человеком на уровне ДНК — это поможет подбирать эффективные лекарства и стратегии лечения для конкретного человека, диету и образ жизни, план профилактического осмотра и т.д. Биоинформатика активно используется, чтобы найти генетические причины заболеваний. Это помогает поставить точный диагноз и предупредить развитие болезни у носителей потенциально опасных мутаций. А с развитием технологий редактирования ДНК это позволит устранять причины заболеваний. Также биоинформатика применяется для разработки лекарств, что помогает проводить эксперименты на компьютере, ускоряя нахождение и производство наиболее эффективных фармакологических продуктов.

А где еще?

Велика роль биоинформатики в сельском хозяйстве и экологии. Она используется как для понимания общих принципов существования биологических сообществ в природе, так и для повышения эффективности производства сельхозпродукции. Если говорить о фундаментальной науке, то именно из методов биоинформатики в итоге появилось направление системной биологии. Она изучает живые клетки и анализирует данные в комплексе, покрывая все аспекты информационных процессов. Еще один огромный пласт биоинформатики возник из структурной биологии ― науки, изучающей трехмерные структуры биологических молекул.Структурная биоинформатика привнесла возможность моделирования структур in silico с помощью таких методов, как молекулярная динамика, статистический структурный анализ. Ученые умеют моделировать третичные структуры еще не изученных белков (это называется фолдингом). Помимо самих структур, ученые моделируют взаимодействие молекул на компьютере. Так, например, можно искать новые лекарства, используя не просто перебор известных веществ, а моделируя их таргетное взаимодействие — это называется процессом докинга.

Чем занимается биоинформатик?

Его рабочий процесс сильно зависит от сферы, где он работает. Биоинформатик в медицине будет помогать врачам, анализируя их данные и консультируя по результатам анализа. В среде ученых есть разделение лабораторий на «сухие» и «мокрые». В «сухой» лаборатории есть только компьютеры и безграничное воображение, никаких «живых» экспериментов там не проводится. «Мокрые» лаборатории напрямую взаимодействуют с исследуемым объектом, будь то секвенирование человеческой ДНК или нокаут генов у лабораторных мышей. Частое явление в современном мире — смешанные лаборатории, где часть сотрудников занимается «мокрой» работой, как говорят биологи в связи со специфичностью проведения, «капают» эксперименты, а вторая часть занимается анализом данных, моделированием и другими вычислительными задачами.

Так биоинформатик — все-таки программист или биолог?

Есть очень много точек зрения на этот вопрос. Одни считают, что существуют биоинформатики с большой буквы «Б» и с большой буквы «И». Первые ― с биологическим бэкграундом, вторые ― от мира информационных технологий, и эти множества не пересекаются. Вторые утверждают, что биоинформатик обязан обладать знаниями в обеих областях и при этом являться связующим звеном между биологами и разработчиками ПО. Поэтому вопрос лучше поставить по-другому. Надо ли биоинформатику обладать знаниями в области молекулярной биологии, цитологии и генетики? Да, безусловно. Должен ли он уметь писать код для анализа биологических данных и знать соответствующие языки программирования? Да, это его работа. Но везде свои нюансы, и человек, занимающийся запуском биоинформатических программ для обработки каких-нибудь конкретных экспериментов, например, полноэкзомного секвенирования ДНК, не обязан знать такое же число языков программирования, как средний разработчик ПО. Но знание таких скриптовых языков как R или Python будет огромным подспорьем.

Как биоинформатика может изменить наше будущее?

Есть мнение, что за уже привычными нам космическими технологиями, роботизацией и аддитивными технологиями наступит эра развития биотехнологий, в которых биоинформатика занимает главное место. И работу в сфере биотеха можно будет сравнить с работой космонавта, высадившегося на поверхность Луны. Возможности применения биотехнологий огромны ― от синтеза необходимых нам веществ и изменения свойств растений и животных под наши нужды до изменения генома человека. С технической точки зрения человечество готово к огромным прорывам, но с точки зрения этики и закона многое находится либо в серой зоне, либо оценивается полностью негативно. Биоинформатика и биотехнологии не смогут развиваться так же экспансивно, как IT и телекомом. Необходима жесткая регуляция, хотя она и так присутствует сегодня в медицине и биотехнологии. С другой стороны, человечеству необходимо определиться с приоритетами развития и осознать, каково наше место в мире, что мы можем менять, а что ― нет.