Кровь может многое рассказать о человеке, его образе жизни, питании, даже о характере. Биохимический анализ крови может помочь обнаружить проблему прежде, чем она станет патологией. Анализ биомедицинских данных — именно та область, в которой алгоритмы машинного обучения сейчас применяются особенно активно.

Веб-сервис Aging.ai — это побочный продукт масштабного научного исследования процессов старения, призванный наглядно показать общественности, насколько важно регулярно сдавать анализ крови.

«У нашей работы две цели, — рассказывает главный разработчик системы машинного обучения, сотрудник Международной научной лаборатории „Компьютерные технологии“ Университета ИТМО Евгений Путин, — Во-первых, это превращение процесса сдачи анализа крови в своего рода игру. Если это будет востребовано, в перспективе мы бы хотели добавить в сервис дополнительный функционал, чтобы каждый человек мог легко отслеживать изменения биохимических параметров. Во-вторых, это демонстрация того, что по самому простому и распространенному типу лабораторных тестов, биохимии, можно успешно предсказывать человеческий возраст. Это еще на один шаг приближает нас к персонализированной медицине будущего».

Курс на персонализацию медицина взяла сравнительно недавно, но в контексте бурного развития генной инженерии это направление очень актуально. Более того, мы всё больше уходим в сторону упредительной терапии, основанной на предсказании и заблаговременном предотвращении заболеваний.

Исследуя механизмы старения, ученые планируют расширить область обучения нейронных сетей. Сами по себе биохимические маркеры не дают информации о потенциальных заболеваниях, но в купе с эпигенетическими, транскриптомными, биометрическими данными способны стать основой доступных «умных» приложений, которые, как будильник, будут предупреждать о развитии патологий, болезней и вовремя подсказывать нам, на что следует обратить внимание.

Результаты работы нейросетей по выделению маркеров старения могут дать фармацевтическим кампаниям информацию о том, в каком направлении двигаться, чтобы создать препараты для замедления процесса старения.

«Сейчас нет четкого объяснения, почему мы стареем, — говорит Евгений Путин. — Существует мнение, что старение — это болезнь. Ученые находят множество подтверждений тому, что мы можем жить гораздо дольше».

Глубокое машинное обучение позволит разрабатывать более эффективные лекарства и в разы сократить сроки их создания, поскольку многие экспериментальные стадии можно будет проработать с использованием математического моделирования. Сейчас же синтез и испытания лекарств в среднем занимают 10−20 лет.

Год назад появился веб-сервис для предсказания возраста по фото How-Old.net. Как раз он и вдохновил ученых на создание новой системы: оба подхода имеют один и тот же математический аппарат.

«Биохимический тест содержит в себе гораздо меньше информации о возрасте человека в отличие от портретных фотографий, ведь уже сейчас есть технологии определения эмоций, морщинок, фонем по движению губ, не говоря уже о поле и возрасте. Поэтому мы считаем большим успехом высокую точность полученных нами результатов. Она обеспечена главным образом тем, что мы использовали глубокие нейронные сети, которые в данной задаче оказались более эффективны по сравнению с другими алгоритмами машинного обучения», — отмечает разработчик.

Обрабатывая результаты тестов крови, ученые выделили пять наиболее значимых биологических маркеров: альбумин, глюкозу, мочевину, алкаин и эритроциты. В веб-сервисе представлено больше — десять. При таком количестве биомаркеров нейронные сети определяют возраст с точностью 70%. Увеличив количество параметров до 41, исследователи достигли 83,5% точности.

Ученые независимо обучили 21 нейронную сеть с различной топологической структурой, а затем объединили их в одну общую модель. Исследователи показали, что такое количество сетей полностью обеспечивает имеющуюся точность, и увеличить ее можно только за счет расширения объема данных или количества параметров.

Исследования инициированы компанией Insilico Medicine (Университет Джона Хопкинса, Балтимор, США). Это ведущая компания в области разработки искусственного интеллекта для решения задач, связанных со старением. Ее цель — увеличить продолжительность жизни человека.

Данные лабораторных анализов для обучения нейронных сетей были предоставлены крупнейшей независимой диагностической лабораторией в Восточной Европе ИНВИТРО. Так, на обучение нейросетей потребовалось 56 тысяч образцов и еще 6 200 — на тестирование.

Сотрудники Лаборатории компьютерных технологий Университета ИТМО вовлечены в международное сотрудничество как в области искусственного интеллекта, так и биоинформатики. Для повышения профессионализма студентов и аспирантов на базе лаборатории создан кружок по машинному обучению, в рамках которого регулярно проводятся мастер-классы и тренировки по решению прикладных задач с Kaggle.

Статья: «Deep biomarkers of human aging: Application of deep neural networks to biomarker development», Evgeny Putin et al. Aging, May 18, 2016.