Результаты генетических анализов активно используют в медицине. Например, для диагностики наследственных заболеваний и прогнозирования их развития, планирования семьи и выявления патологий у плода, а также подбора индивидуальной терапии. Генетические исследования помогают ученым в изучении отдельных штаммов вирусов и бактерий, создании новых лекарств и сохранении вымирающих видов животных и растений. При этом проведение генетических анализов предполагает работу с большим массивом информации, из-за чего специалисты зачастую сталкиваются с необходимостью в ручной настройке цифровой инфраструктуры, где хранятся и обрабатываются данные, и риском их потери.
Одно из наиболее оптимальных решений этой проблемы — автоматизация работы с генетическими данными. Однако существующие на российском рынке инструменты с подобным функционалом позволяют выполнять лишь отдельные этапы анализа, требуют владения специальными техническими навыками и недоступны для маленьких лабораторий из-за высокой стоимости.
Магистранты AI Talent Hub ИТМО разработали облачную платформу GenomeAI, которая позволяет проводить весь цикл генетического анализа в одном интерфейсе: от загрузки данных до интерпретации результатов. Кроме того, для работы с этим инструментом нужны минимальные технические знания. С помощью GenomeAI можно выполнять секвенирование, первичную обработку данных и анализ вариаций, например, сравнивать онкогенные мутации в геноме с нормальными образцами. Также сервис поможет визуализировать и интерпретировать полученные данные: построить график, аннотировать ген или сгенерировать отчет. Чтобы хранить данные и управлять ими, можно организовать цифровой банк.
Защиту информации на платформе обеспечивает многоуровневая система безопасности, которая по своей структуре схожа с банковской. Сервис оснащен алгоритмами от ИИ-угроз и инструментами шифрования данных: они кодируются при передаче и хранении в соответствии с национальными стандартами ФСТЭК. Кроме того, платформа функционирует по принципам ролевой модели управления доступом — RBAC, когда лаборант видит только ограниченный набор данных, руководитель исследовательской группы — действия всей команды, а администратор контролирует саму инфраструктуру.
«Я вижу большой потенциал в развитии единой платформы для загрузки, анализа и хранения геномных данных. Искусственный интеллект уже значительно меняет работу разработчиков — на рынке появилось множество удобных co-pilot-решений для программистов. В биоинформатике же такие инструменты пока редкость. Сейчас эта область во многом представляет собой набор отдельных утилит, которые нужно осваивать по отдельности и интегрировать в сложные пайплайны. Платформа, объединяющая классические инструменты биоинформатического анализа с удобным и интуитивным интерфейсом, способна сделать работу специалистов значительно эффективнее. Однако важно учитывать, что генетические данные крайне чувствительны, и крупные компании вряд ли будут передавать их в облачные сервисы. Для них более реалистичный сценарий — развёртывание такого решения во внутренней инфраструктуре, что обеспечит максимальную безопасность данных», — подчеркивает директор по науке Genotek Александр Ракитько.
Система рассчитана на командную работу и учитывает требования к масштабируемости и устойчивости продукта. Платформа позволяет проводить исследования как на базе небольших лабораторий, так и крупных биотехнологических компаний и НИИ. Для этого предусмотрены разные системы установки сервиса и тарифные версии с разным функционалом.
«Небольшие лаборатории могут установить бесплатный стартовый пакет с ограничением по объему данных. В случае же с крупными компаниями, где остро стоит вопрос защиты данных, мы прорабатываем возможность развертывания on-premise нашей системы. Мы хотим сохранить баланс между текущей потребностью в наличии мощностей, безопасности и конечной стоимостью продукта для пользователя», — отмечает автор проекта, магистрант института прикладных компьютерных наук ИТМО Андрей Жиров.
Автор проекта, магистрант Института прикладных компьютерных наук ИТМО Андрей Жиров. Фото из личного архива Андрея Жирова
Сейчас Genome AI находится на стадии MVP. Пока за финансирование проекта отвечают сами разработчики и активно ищут партнеров. Методологическую поддержку команде ученых оказали крупные российские биотехнологические компании — BIOCAD, Геномика и Generium.
