Накануне в Москве объявили победителей программы Skoltech Fellowship Program 2019, ты вошел в пятерку лучших молодых ученых по системной биологии с проектом, который посвящен секвенированию РНК одиночных клеток. Расскажи, пожалуйста, подробнее об этой работе.
Над этим проектом я только начну работать в рамках программы, хотя у меня уже есть определенное количество работ в этой области. Цель этого проекта — обнаружение источников вариации в данных секвенирования РНК одиночных клеток.
Раньше, в течение прошлых десятков лет, мы извлекали всю РНК из образца (допустим, образца крови) и смотрели на РНК в образце в целом, но сейчас все можно делать гораздо лучше. Мы можем взять образец, который представляет собой смесь клеток, и зафиксировать РНК, которые есть внутри каждой из них. Это может помочь нам понять, что происходит внутри каждой клетки.
Допустим, у вас есть группа больных людей и контрольная группа, и вы сравниваете, что отличается в РНК людей из обеих групп. Вы взяли образцы крови у всех, но при этом у одного человека в крови могло быть больше лимфоцитов, а у другого — меньше. Ведь каждый образец имеет очень сложный клеточный состав.
Сейчас же мы можем взять образец и сразу разделить его на клеточные компоненты. То есть мы сразу можем понять, что там столько-то лимфоцитов и в них такая экспрессия генов, в ней столько-то моноцитов и в них такие-то РНК. Биологически мы делаем все тот же забор, но мы можем пойти на уровень глубже в плане анализа и понимания того, что вообще происходит в образце.
Это безумно интересно, хотя есть здесь и небольшие проблемы. Они связаны с тем, что вся РНК, которая есть в клетке — по сути, это РНК, которая определяется клеточным типом и какими-то процессами, которые запущены в клетке. Такими процессами может быть, например, деление или ответ на какой-нибудь внешний стимул. Нам хочется уметь понимать сразу несколько вещей: и к какому типу принадлежит клетка, и какие клеточные процессы в ней запущены. Моя работа именно про это.
Как давно ученые начали заниматься такими задачами?
Секвенирование одиночных клеток в целом — сегодня это передний край системной биологии. Ученые только в последние годы поняли, как можно эффективно изолировать клетки с последующей возможностью секвенирования РНК, и, что более важно, как сделать это для тысяч и сотен тысяч клеток одновременно. И сегодня мы можем смотреть не только на РНК, но и, например, на белки, которые есть на поверхности этой же самой клетки. То есть исследовать все одновременно.
Если все же объяснять человеку, который не знаком глубоко с этой областью, почему ученым так важно смотреть именно на отдельные клетки?
Разные клетки выполняют разную клеточную функцию. Для элементарного понимания здесь можно провести такую аналогию: у вас есть пачка Skittles, в которой есть драже разных цветов. Если вы съедите сразу горсть, то почувствуете вкус всего подряд. Вы, конечно, поймете, что едите Skittles, но не сможете различить, драже какого конкретно цвета вы съели и какой вкус у каждого из них в отдельности. Секвенирование РНК одиночных клеток — это примерно то же самое: мы взяли пачку, разложили ее на отдельные цвета, или отдельные компоненты, и пытаемся понять отдельные клеточные процессы, которые запущены внутри клеток.
С одной стороны, нас интересуют процессы, а с другой — сколько вообще у нас клеток. Если мы смотрим на, условно, опухоль, в которой есть как раковые, так и иммунные клетки, нам интересно понять, что эти иммунные клетки там делают, сколько их там и сколько тех клеток, которые делают что-то полезное. Но если вы при этом возьмете кусочек образца и РНК оттуда целиком, то весь сигнал сгладится. Иными словами — вы возьмете что-то среднее. Тогда как мы хотим понимать всех ключевых игроков и то, как они конкретно действуют.
Когда и как ты пришел к идее своего проекта?
Я несколько лет работал с технологией и понял, что в этой области есть проблемы, которые люди научились избегать разными способами.
С одной стороны, в условиях, когда у вас есть огромное количество клеток, вы начинаете анализировать данные и пытаетесь понять, клетки каких типов у вас есть (например, Т-клетки, B-клетки, моноциты и так далее). С другой стороны, у вас есть сигнал клеточного деления. И дело в том, что этот сигнал настолько сильно меняет клетки, что делящиеся клетки становятся больше похожи друг на друга, чем на свой клеточный тип. В каком-то смысле можно сказать, что этот сигнал полностью «прошивает» клетку.
Как я уже сказал, люди научились этого избегать: если они знают, что у них в датасете есть клеточное деление, они избавляются от этого сигнала и дальше смотрят на данные без него. Но на самом деле это интересная информация, ее не хочется просто так терять. И нам хотелось бы понимать для всех клеток, которые мы обнаружили в образце, и их тип, и то, какие клеточные процессы там запущены.
Для каких конкретно прикладных задач может быть применимо секвенирование РНК одиночных клеток?
Сейчас это много где используется, мы же применяли это для исследования различных заболеваний или моделей заболеваний: онкологических, вирусных или, например, атеросклероза. Если говорить в контексте исследования раковых заболеваний, то здесь, например, интересно смотреть и на раковые, и на иммунные клетки, которые приходят в опухоль, чтобы бороться с заболеванием. Также, используя эту технологию, мы пытались посмотреть на то, как вирус Зика заражает стволовые клетки мозга у мышей. В целом сфера применения не ограничивается только медицинским контекстом, но лично меня интересуют именно эти аспекты.
Как будет строиться работа над проектом?
Он рассчитан на три года. Я надеюсь, что за это время получится сделать необходимый объем исследований. В основном я буду работать над проектом в Университете ИТМО. Также у нас есть коллаборация с Университетом Вашингтона в Сент-Луисе. Поэтому, если мы поймем, что мы хотим сделать биологический датасет, чтобы валидировать работу этого метода, это будет несложно.
Недавно в Nature Communications вышла твоя статья. В этой работе ты занимался похожей тематикой?
Это немного другая область, но задачи очень похожи. Там мы смотрим на РНК смешанных образцов, а не на отдельные клетки, но при этом мы говорим, что можем считать образец комбинацией клеточных типов и пытаться предсказать пропорции клеточных типов в образцах. Здесь я концентрируюсь на каждой клетке как на комбинации клеточного типа и клеточных процессов, которые в ней запущены, но я тоже пытаюсь понять, как разложить клетку на компоненты.
С математической точки зрения задачи очень похожи, поэтому я собираюсь применить наработки, которые у меня были в этой статье, чтобы понять, что происходит на клеточном уровне.
Ты оканчивал бакалавриат и магистратуру на кафедре КТ. Почему ты решил не заниматься исключительно программированием в индустрии, а заинтересовался наукой, системной биологией?
Думаю, мной в этом плане движет прежде всего возможность генерации нового знания. Вообще с биологией в моей жизни была интересная история. Я оканчивал физмат-лицей, и у меня не было педагога, который показал бы мне, что биология — это интересно. Наверно, это специфика многих именно физмат-лицеев, где основной упор делается все-таки на математику. Поэтому химию и биологию в школе я не любил.
В конце бакалавриата в Университете ИТМО я начал работать с Лешей Сергушичевым (Алексей Сергушичев — научный сотрудник международной лаборатории «Компьютерные технологии» Университета ИТМО, руководитель магистерской программы «Биоинформатика и системная биология» — прим.ред). Моя работа в большей степени была связана с программированием. Но уже тогда я начал что-то смотреть, пытаться понять больше в области биологии.
Например, посмотрел замечательный видеокурс Эрика Ландера «Introduction to Biology», который меня очень зацепил. Потом я поехал на Летнюю школу по биоинформатике, там было много классных лекторов, которые рассказывали про науку и свои исследования. Я подумал: «Вау, все это очень здорово». С тех пор повернул в эту область.
Системная биология в целом как термин начала широко применяться в 2000 годах. То есть в контексте развития фундаментальной науки это достаточно молодое направление. Как строится работа специалиста в этой области?
Для меня системная биология — это, скорее, такой тулкит для биологов. Мы решаем фундаментальные задачи каждый день: к нам приходят биологи с какими-то данными, а мы анализируем их и генерируем новые для них гипотезы. После этого биолог идет обратно в лабораторию и валидирует эти результаты с помощью экспериментов.
И думаю, что в каком-то плане системная биология похожа на машинное обучение: приносит больше всего пользы, когда решает конкретные прикладные задачи из какой-либо конкретной области.
В интердисциплинарных областях всегда актуальным является вопрос: а как специалистам из разных сфер понять, что делают их коллеги, и договориться друг с другом. Как эта проблема решается в системной биологии?
Сейчас, думаю, я уже нахожусь где-то посередине, потому что у меня есть набор знаний из обеих областей. Поэтому меня, наверно, можно назвать в некотором смысле переводчиком. Но в первое время это был действительно сложный процесс. Первые года два многое было не очевидно: я понимал задачу в общих чертах, но уловить нюансы было достаточно сложно.
Мне повезло, что я успел съездить на стажировку в США, в Университет Вашингтона в Сент-Луисе (Washington University in Saint Louis, Department of Pathology & Immunology). Там я сидел в департаменте, где из всех, кто был на этаже, программировать умели, наверное, человек семь. Все остальные, а это больше 200 человек, — хардкорные иммунологи. Раз в неделю у нас проводились семинары, на которых PhD-студенты и постдоки из разных лабораторий рассказывали про свою работу за 15 минут. Сначала это было для меня представлением, потому что понятны были только первые три слайда презентации. Через полгода-год я стал пробираться через первые десять слайдов. Начать заниматься системной биологией — это нелегкий процесс, нужно постоянно что-то читать, смотреть, быть в курсе последних исследований, которые проводятся в вашей сфере.
Продолжая тему, назови, пожалуйста, главные, на твой взгляд, компетенции, которыми сегодня должен обладать системный биолог?
Безусловно, важно обладать базовыми знаниями в области молекулярной биологии, биоинжиниринга. Быть в стороне и ничего не представлять о CRISPR сегодня уже стыдно. Без этого вряд ли удастся что-то понять, если будете читать статьи, которые публикуются в международных журналах.
В целом нужно двигаться вместе с технологиями, которые появляются. Нельзя замыкаться в одной задаче и ждать, пока она решится. Важно смотреть, что делают другие в биологии и в смежных областях. Сегодня вообще, как мне кажется, нельзя найти ни одну статью в хорошем международном журнале, где все авторы были бы из биологии. Потому что решать задачи только внутри какой-то одной области уже невозможно.
Но, с другой стороны, коллаборации никто не отменял. Нет необходимости слишком глубоко разбираться в другой области. Поэтому если в команде есть человек, который глубоко разбирается в биологии, а другой — в биоинформатике, они смогут договориться и друг друга понять.
По программе Skoltech Fellowship Program ты будешь три года работать в России. Есть ли в целом сегодня возможности и перспективы заниматься системной биологией в нашей стране?
Если мы говорим про биоинформатику, системную биологию, могу сказать, что да, абсолютно. Возможно, ситуация сложнее с биологическими науками, потому что там вам необходимо закупать реагенты, дополнительное оборудование, доставлять их, доставать деньги, которые будут покрывать все эти траты. Для того, чтобы заниматься системной биологией, вам нужен ноутбук, иногда — вычислительный кластер, а этих ресурсов хватает в России, и наконец — коллабораторы, с которыми также можно взаимодействовать удаленно.
Компетенций и специалистов тоже хватает, причем как в Петербурге и Москве, так и в других городах. Например, скоро мы поедем на конференцию в Томск, есть сильные компетенции также в Казани. Кроме того, мы проводим разные мероприятия, в том числе воркшопы, летние школы, и всегда на таких мероприятиях удивляет география — участники приезжают со всей страны.
Какими проектами, помимо работы в рамках Fellowship Program, ты планируешь заняться в ближайшем будущем?
Мы хотим посмотреть на большое количество датасетов, которые есть в секвенировании РНК одиночных клеток. В том числе в раковых контекстах, которые нас интересуют. Было бы здорово сделать сервис, где исследователи, которые занимаются этой темой, могли бы открыть любой публично доступный датасет и самостоятельно посмотреть на данные. В целом с обычными датасетами по экспрессии сейчас все уже более или менее доступно, на них легко смотреть. С датасетами одиночных клеток все не так просто, потому что они больше, сложнее, их нужно по-другому визуализировать. Но, вместе с тем, датасеты секвенирования РНК одиночных клеток — это хорошая возможность понять, что и где экспрессируется, в каких тканях, клетках или отдельных клеточных популяциях может быть активным тот или иной ген. Поэтому такой сервис может быть полезен исследователям, которые ищут новые зацепки.