— Вы совмещаете исследовательскую работу с работой в корпорации. Почему решили идти по такому пути?
― Большую часть карьеры я провел в академии: сначала работал в Высшей школе экономики, а потом в Наньянском технологическом университете в Сингапуре. Но в какой-то момент решил уйти в индустрию: в Сингапуре пригласили в MedTech-стартап, где я продолжил делать исследования, а в России традиционно сильный бигтех, есть интересные проекты и команды.
В этом году я решил присоединиться к Университету ИТМО — несмотря на хорошую работу, у меня оставалась незакрытая потребность делать науку. Я чувствовал, что у меня есть ресурс, который хотелось бы посвящать развитию цифровой медицины.
— Почему выбрали тему цифрового здоровья?
― Когда занимался социологией, меня заинтересовали онлайн-сообщества, связанные со здоровьем. Хотелось понять, как общение в социальных сетях влияет на поведение людей в сфере здоровья. Оказалось, что люди с серьезными диагнозами охотно вступают в контакт друг с другом, делятся опытом и даже могут менять свои убеждения.
Позже этот интерес привел меня к теме цифровых биомаркеров — данных о поведении и состоянии организма, которые собираются с помощью устройств, например, шаги, пульс или температура кожи. По таким цифровым биомаркерам можно оценивать состояние здоровья и риски заболеваний. Меня увлекла идея, что в закономерностях повседневного поведения и физиологии можно отыскать признаки зарождающейся депрессии (1,2), когнитивных нарушений, метаболического синдрома или гриппа. Высокая детализация сенсорных данных позволяет использовать методы машинного обучения и ИИ для изучения факторов риска заболеваний. В перспективе можно создать диагностический центр, который помещается на руке и оповещает пользователя о тревожных сигналах.
Юрий Рыков. Фото: Мария Ежова / Центр научной коммуникации
— Почему вы сейчас заинтересовались прогнозированием сахарного диабета?
― Мне захотелось поработать с электронными медкартами — стало интересно, что можно извлечь из информации во время приема у врачей. А сахарный диабет II типа — это широко распространенное хроническое заболевание, причины и условия возникновения которого тесно связаны с образом жизни и поведенческими факторами риска.
— На ранних этапах сахарный диабет сложно диагностировать?
― Диагностировать несложно, это делается по анализу крови, но трудно именно прогнозировать риск, потому что мы до конца не знаем точные причины возникновения диабета II типа и все факторы риска. Нарушения в обмене веществ накапливаются постепенно, а заболевание может наступать внезапно. Но это возможно предотвратить, если человек обратится за помощью на стадии преддиабета — это контролируемое состояние.
Мы надеемся, что во время исследования обнаружим в медкартах новые сигналы преддиабета и научимся лучше прогнозировать развитие заболевания. А врачи, опираясь на эти данные, смогут вовремя назначить пациентам профилактику.
Фото: Kruchenkova / Фотобанк Фотодженика
— Расскажите, пожалуйста, подробнее: каким Вы видите результат этого проекта?
― Главная цель проекта — создать модель, которая будет точно прогнозировать риск сахарного диабета. Если по итогам получится достичь высокой точности, это уже можно будет считать серьезным успехом. При этом есть и более глубокая задача: существующие калькуляторы риска диабета основаны на ограниченном наборе признаков — вроде возраста, пола, веса, обхвата талии — и используют простые линейные модели. Мы же хотим преодолеть эти ограничения: во-первых, применить более продвинутые алгоритмы машинного обучения, а во-вторых, расширить набор данных, чтобы находить новые полезные сигналы. Если мы сможем показать, что наша модель работает лучше базовых инструментов — это уже сильный результат.
Что касается долгосрочного эффекта, то, конечно, было бы здорово, если бы наша модель не просто осталась исследовательским кейсом, а стала основой для практического инструмента — например, чтобы через несколько лет терапевты в клиниках действительно использовали ее в работе. Это звучит как мечта, но именно это и мотивирует: сделать нечто, что окажется полезным за пределами академии.
Юрий Рыков. Фото: Мария Ежова / Центр научной коммуникации
— Почему вы захотели реализовать этот проект именно в ИТМО?
― Я познакомился с коллегами из ИТМО еще в те времена, когда работал в Вышке — мы вместе проводили летние школы, участвовали в конференциях, других совместных мероприятиях. У ИТМО всегда был положительный имидж — как у динамично развивающегося университета, открытого к сотрудничеству. Но, наверное, решающим фактором стало личное знакомство с командами Центра научной коммуникации, Лаборатории цифровых технологий в общественном здоровье и магистратуры Public Health Sciences — руководителями Дарьей Денисовой, Антоном Барчуком, Анной Андрейченко и Евгенией Соколовой.
Прочитайте также:
Честно говоря, поначалу я удивился, что в университете есть команды, связанные с изучением здоровья — все-таки ИТМО часто воспринимается как сугубо айтишный вуз. Но здесь есть междисциплинарные проекты, так что появление исследования, где IT пересекается с медициной или общественным здоровьем, — вполне логичное продолжение.
Тем более, наше будущее исследование связано с применением методов машинного обучения, так что, в каком-то смысле, проект приземлился по адресу. Надеемся, что найдутся студенты, которым эта тема интересна и которые захотят присоединиться — возможно, использовать этот проект как песочницу для тестирования своих идей, навыков, гипотез.
Антон Барчук проводит лекцию по эпидемиологии в ИТМО. Фото: Алина Мельникова
— Каких студентов вы ищете?
― Мы хотим работать со студентами, которым интересна эпидемиология и тема факторов риска, разработка прогнозных моделей и моделей выживаемости. Надеюсь, что проектом заинтересуются студенты магистратуры Public Health Sciences. Исследования здоровья и здравоохранения — это их основной профиль.
Также мы в поиске магистрантов и аспирантов, которым интересна обработка естественного языка (NLP) и большие языковые модели (LLM). Наша работа будет связана с полуструктурированными тесктовыми базами данных: нужно будет превращать их в упорядоченные векторные форматы, которые можно использовать в машинном обучении. Это не просто разметка, а задачи из области information retrieval и трансформации данных.
Прочитайте также:
— Насколько реально интегрировать методы машинного обучения в практику обычного врача в ближайшие годы?
― Область цифровой медицины сейчас стремительно развивается — в мире есть тысячи MedTech-стартапов, особенно по использованию искусственного интеллекта. Но даже если идея хорошая, часто она не доходит до внедрения, потому что медики не видят в ней очевидной пользы, экономической эффективности или просто того, как это упростит их работу.
Иногда технологиям не доверяют. Так что вопрос, как именно цифровые технологии будут входить в повседневную медицинскую практику, остается открытым. Хотя прогресс не остановить — те же технологии компьютерного зрения уже помогают врачам анализировать снимки быстрее и точнее. И тут становится понятно, что ИИ — это не только способ уменьшить рабочий день врача, но и реально улучшить диагностику.
Прочитайте также:
Юрий Рыков. Фото: Мария Ежова / Центр научной коммуникации
— А как бы Вы объяснили врачам, которые боятся ИИ, почему технологиям стоит доверять?
― Если бы я говорил с врачом, который относится к ИИ скептически, я бы апеллировал к доказательной медицине: показал бы данные рандомизированных клинических исследований или мета-анализов, подтверждающих, что ИИ действительно помогает — точнее диагностирует, улучшает исходы для пациентов.
Если врач боится, что технологии отнимут у него работу — мне кажется, это страх из области спекуляций. С каждым новым изобретением предсказывали «смерть» старого: кино убьет театр, телевидение — кино. Но в итоге все уживается. В капитализме, честно говоря, всегда найдется, чем занять человека, — будь он врачом или кем-то еще.
— Давайте напоследок помечтаем. Если бы у Вас были неограниченные ресурсы, какое исследование Вы бы провели?
― Одна из гипотез, которая мне интересна, — связь между социальным поведением и окружением человека и его здоровьем. Я бы хотел провести масштабное долгосрочное исследование, в котором можно было бы детально отслеживать социальные взаимодействия и события на протяжении всей жизни в сочетании с мониторингом физиологических и биологических сигналов. Возможно, даже с помощью устройств для постоянной записи энцефалограммы. На стыке этих разных источников данных — социальных, поведенческих, физиологических, когнитивных — можно было бы понять, как наше окружение, статус и образ жизни влияют на здоровье, долголетие и предрасположенность к болезням.