― Вы недавно выступили с лекцией об искусственном интеллекте и медицине. Не могли бы вы для начала рассказать два слова о самом мероприятии и о теме вашей презентации?
― Это конференция, которая была организована на базе ИТМО медиками для медиков. Она называется «(Не)конференция». К счастью, провести его удалось вживую, благо, что квалификация организаторов позволяет снизить до минимума риски для участников заболеть коронавирусом.
Мне предложили выступить и рассказать о чем-то связанном одновременно с медициной и с нашими исследованиями в области искусственного интеллекта. Это бездонная тема, ИИ применяется примерно в любой области медицины. Поэтому я решил рассказать не про какие-то конкретные применения, а про то, что мешает искусственному интеллекту полностью заменить врача. Какие есть проблемы и неочевидные подводные камни.
― И какие же это проблемы?
― Примерно в каждой статье, которую я читал, готовясь к своему выступлению, приводился свой список проблем или вызовов, так что самым сложным было все это систематизировать. Я выделил шесть основных.
Первая — сложный ландшафт медицинских знаний. Врач учится сначала в медвузе, потом в интернатуре, потом в ординатуре, потом, возможно, в аспирантуре. Специалистом человек становится годам к тридцати. Все это время он изучает свою сравнительно узкую область.
Что это значит для искусственного интеллекта? Медицина — это огромный объем знаний, которые довольно плохо связаны между собой. В каждой конкретной области есть немыслимое количество специфики. Поэтому, чтобы научить ИИ разбираться во всей медицине, нужно, чтобы он как-то усвоил всю эту специфику. Проще говоря, необходимо потратить немыслимое количество усилий, просто чтобы всю эту область покрыть алгоритмами.
― Какая же вторая проблема?
― Кросс- или междисциплинарное взаимодействие. Чтобы внедрить искусственный интеллект в медицину, нужно, чтобы врачи взаимодействовали с информатиками. Это всегда большая проблема. Информатики не представляют себе медицину, им нужно, чтобы кто-то им ее объяснил, хотя бы в общих чертах.
Со стороны врачей также есть непонимание. У некоторых есть завышенные ожидания от ИИ. Некоторые, особенно руководители, административные работники, считают, что внедрением искусственного интеллекта можно все сразу решить. Рядовые врачи, которые работают «на земле», наоборот, обычно приходят с сильно заниженными ожиданиями.
Пару раз возникала ситуация, когда врачи, как только мы начинали с ними говорить про машинное обучение, отвечали, мол, мы уже пытались лет десять назад, спасибо, больше нам такого не надо. И им сложно объяснить, что современные нейронные сети и технологии десятилетней давности не имеют ничего общего. Кроме названия. Тем не менее, один раз обжегшись, врачи поставили крест на самой идее.
Это, собственно говоря, рождает третью проблему…
― В чем же она состоит?
― Отсутствие доверия к искусственному интеллекту. Впрочем, эта проблема характерна для внедрения машинного обучения в любой отрасли. Врачи, банкиры, инженеры, специалисты по безопасности — все они хотят контролировать процесс. Современный искусственный интеллект зачастую плохо интерпретируется. Мы знаем данные, которые загружаются на входе, и то, что мы получаем на выходе. Что происходит между, с трудом описывают даже сами специалисты в области машинного обучения.
В результате нет доверия к тому, что ИИ выдает. Врач, банкир, капитан корабля могут убедиться в надежности выводов искусственного интеллекта только после длительного успешного с ним взаимодействия. Это требует времени.
Кроме того, мы тоже не можем не признать, что на уровне применения алгоритмов есть большие проблемы. Мы довольно плохо умеем оценивать устойчивость работы ИИ. Допустим, мы собрали выборку данных о пациентах в Тюменской области, обучили на ней алгоритм, он работает прекрасно на этих данных. Однако мы не можем быть уверены, что этот же алгоритм будет также успешно работать на жителях Ленинградской области. Более того, нам даже сложно сказать, насколько успешно программа, обученная на пациентах одной клиники Тюменской области, будет успешно работать в другой клинике.
Причина проста — мы не можем обучать искусственный интеллект на всех данных вообще. Это долго, сложно, безумно дорого. Всегда берется какая-то часть данных, которая может существенно отличаться от общей картины. Классическая история — программы, которые ведут какую-то диагностику по состоянию кожи у белых людей, плохо работают на африканцах. Поэтому для их применения на темнокожих приходится собирать совершенно другую выборку.
― При этом каждый раз нам нужно иметь достаточное количество данных для такого дообучения?
― Не только. Вообще недостаток данных — это отдельная, четвертая проблема, о которой я хотел бы сказать. В медицинской области количество данных никогда не угоняется за потребностями специалистов по машинному обучению.
Типичная ситуация, когда мы приходим к врачам и они говорят, что у них просто безумное количество данных. Однако, когда мы смотрим на массив собранной информации, мы понимаем, что их недостаточно.
Врачи собирают эти данные месяцами, годами. Делается это руками. Например, когда есть несколько десятков диагнозов, то в выборке на тысячу человек окажется, что на некоторые диагнозы не наберется и десяти примеров. В медицине тысяча пациентов уже считается большим объемом данных. Для специалиста по машинному обучению — это сверхмалая выборка.
Мы привыкли работать на тысячах и десятках тысяч примеров. Такой выборки у врача может не быть за всю практику, даже медицинскому учреждению сложно собрать такую статистику. Поэтому приходится под каждую ситуацию придумывать, что же делать с данными.
Кроме того, данные разнородные, собираются они с разных УЗИ-аппаратов, разных томографов, в разных форматах, с разным разрешением. Для врача это не так принципиально — у него есть базовые знания, чтобы делать выводы. Для искусственного интеллекта это может быть и чаще всего бывает критично.
― Но ведь данные мало собрать, их же еще надо как-то интерпретировать. Кто-то должен, грубо говоря, объяснить машине, что есть снимок здорового человека, а что нет.
― Именно, на языке специалистов в области машинного обучения это называется разметкой, и она тесно связана с пятой проблемой. Упростив, можно сказать, что машинное обучение занимается восстановлением некоторой зависимости между наблюдаемыми величинами и тем, что мы пытаемся предсказать. Если этой зависимости нет, машинное обучение бессильно. Чем она слабее, тем хуже получаются прогнозы. И вот тут возникает претензия к медицинскими закономерностям — они далеко не всегда такие четкие, как того хотелось бы.
У нас не всегда есть надежные закономерности между теми воздействиями или препаратами, которые к нам применяют, и нашим выздоровлением. Бывают врачи, которые верят не всегда в доказательные методы.
Однако, даже если мы будем говорить только о доказательной медицине, у нас есть другая проблема. Сами врачи шутят, что если у одного пациента будет три доктора, то у него будет три разных диагноза. То же самое с разметкой данных. Если ты посадишь трех разных врачей размечать, скажем, УЗИ-снимки, то ты получишь три разных разметки. Более того, один и тот же врач, может разметить данные одним образом, а через несколько месяцев, сделать на этих же данных вообще другую разметку.
Из всего этого получается, что мы пытаемся обучить ИИ видеть закономерности, которые сами не можем четко выделить. С этим сложно работать, полученные результаты сложно проверять. Один врач вам разметил данные, модель хорошо обучилась по этой разметке, а потом приходит для проверки другой врач, который не согласен с нашим первым экспертом, и для него модель постоянно ошибается.
― Вы назвали пять причин, осталась шестая…
― Последняя группа проблем, которую я решил выделить в отдельную категорию, это «организационные препятствия». Чтобы что-то внедрять, в том числе технологии машинного обучения, нужно этот процесс организовать, чтобы дела делались, вещи происходили.
Однако мы сейчас видим, что даже более простые вещи сейчас упираются в то, что медицинская система большая, сложная и крайне забюрократизированная. К примеру, давно витает идея единой медицинской базы данных. Идея очень крутая: вся информация о пациентах хранится в одном месте, так что не важно, куда обращается пациент и к какой поликлинике он прикреплен. Ростовчанин может прийти в больницу в Иркутске, и врач в два клика получит его историю болезни, данные о прививках, диагнозах и так далее.
Эта вещь полезна еще и для искусственного интеллекта, так как мы получаем те самые необходимые нам большие данные о миллионах случаях. Но эту базу обещают ввести несколько лет, в газетах каждый год бодро пишут о том, что вот скоро введут — до сих пор продвижения нет. А это более простая штука, чем введение модели искусственного интеллекта, которая будет ставить диагноз.
― То есть получается, что робота-врача как в «Звездных войнах» мы, скорее всего, увидим не скоро, а возможно, даже никогда?
― Да, на текущий момент и в какой-то обозримой перспективе алгоритмы не будут заменять врачей. Они будут только помогать врачам.
Да, социально-экономически это может показаться выгодно. Мы видим, что правительство без проблем сокращает врачей, даже когда заменить их некем. Тут же у нас, вроде бы, есть альтернатива. И все же сейчас и, скорее всего, в дальнейшем у нас будет именно связка «искусственный интеллект + врач».
Помимо всех тех причин, которые я назвал выше, есть к этому и другие предпосылки. К примеру, вопрос юридической ответственности за неверно поставленный диагноз. Очевидно, что самый лучший врач, самый крутой алгоритм не смогут верно определять, что с пациентом, в 100% случаев. Есть вероятность ошибки.
Если ответственность за ошибку будет лежать на разработчике ИИ, то на это не пойдут сами авторы ПО. Если же ответственность останется на враче, то он не будет слепо следовать указаниям машины. Именно поэтому мы сейчас рассуждаем не в терминах «роботы-врачи», а в терминах «системы поддержки принятия решений». Алгоритм советует, но итоговое решение остается за врачом.
― Наверное, это комфортнее и для пациента?
― Да, проблема доверия пациентов к искусственному интеллекту тоже есть. Мы не очень понимаем, насколько пациенты будут адекватно реагировать на взаимодействие с машиной. Этот вопрос плохо изучен, и мы можем пока только косвенно об этом судить. К примеру, по тому, как люди взаимодействуют с чат-ботами.
Мы видим в этом отношении большой прогресс. Пять лет назад взаимодействие с чат-ботом вызывало в лучшем случае интерес, в худшем — неприятие. Сейчас доверие клиентов к этой технологии растет. Люди вполне могут вести беседы с чат-ботами и не перепроверять итоги в беседе с живым человеком.
С другой стороны, поддержка клиентов ― не столь чувствительный вопрос, как медицина и здоровье. Например, насколько ИИ сможет утешить, правильно донести информацию, сможет мягко убедить пациента в необходимости процедур. Одно дело ― выписать рецепт, а другое — внушить важность следования рекомендациям. Здесь сложно сказать, будет ли искусственный интеллект конкурентен в сравнении с хорошим врачом.
Так что, вероятно, машинное обучение будет внедряться и дальше, будут постепенно передаваться машинам рутинные действия или простые действия, в которых нужна очень высокая точность. Но это будет проходить под надзором врачей.