Машинное обучение за последние годы стало очень популярной технологией. В том числе и для таких раскрученных приложений для массовых пользователей, как, например, Prisma, Face App и многие другие. На лекции вы рассказали, что есть первые ласточки — примеры, которые не столь на слуху, но доказывают, что эти технологии можно вполне использовать и в металлургии. Насколько реальны шансы, что в ближайшее время машинное обучение будет приносить реальные результаты в консервативных областях — в промышленности, медицине, госсекторе и других? Что пока тормозит этот процесс?
Здесь можно говорить о препонах двух типов. Причины первого типа можно назвать объективными, они связаны с самой сущностью машинного обучения. Чтобы обучать машину, необходимы большие массивы данных. Поэтому отрасли или задачи, под которые этих массивов нет, станут в теории доступны для машинного обучения лишь тогда, когда там наберется нужное количество данных, причем данных разных — как о положительно принятых решениях, так и об отрицательных случаях. Так вот, когда эти массивы будут достаточно велики, тогда и можно будет включать машинное обучение. По крайней мере, в теории.
Возьмем простейший пример из медицины: в большинстве случаев кардиограммы до сих пор хранятся не в виде файлов, а в виде распечатки. Плюс к этому необходимо учитывать, что в медицине важно знать отдаленные последствия. Пока нет истории о том, как выглядела кардиограмма, какое последовало лечение, а также данные об отдаленных последствиях — стало ли человеку лучше или хуже, вернулся ли он к активной жизни — эта история не заработает ни сегодня, ни завтра. А чтобы накопить такой массив данных, нужны годы.
Но есть и субъективные факторы. Это проблема психологическая: даже там, где есть данные, где уже можно обучать, возникает вопрос готовности. Сейчас есть такие модные слова, не менее модные, чем машинное обучение, — это понятие «digital transformation», или «цифровая трансформация». И кстати, это очень важная история, хотя про нее говорят меньше.
По-хорошему, цифровая трансформация — это история про то, как должна быть организована управленческая деятельность, структура предприятия в цифровую эпоху. Прежде всего речь здесь идет о том, что часть решений уже могут принимать алгоритмы. Но представьте простой пример, который я, кстати, приводил ребятам на лекции: вы построили систему машинного обучения, доказали, что она прекрасно работает, а потом начальник говорит вам: «Так, вот она должна принимать решения из списка утвержденных мною и только с моей визой». Так в чем тогда смысл разворачивания этой системы? Это бессмысленно потраченные деньги на ее обучение, на «железо», программистов и так далее. А ведь все дело в чисто административных бизнес-процедурах в организации.
Но такое недоверие к технологиям — это не только проблема условных консервативных руководителей с тридцатилетним опытом работы, она касается и многих молодых людей.
Да, и еще как.
В чем корень?
В том, что все это окутано огромным количеством мифов, в том числе страшных. Не хочу огорчать людей, занимающихся медиа, журналистов, но, к сожалению, их заслуга в том, что любая ошибка машины немедленно превращается в мировую сенсацию.
И здесь еще можно вспомнить мой недавний разговор с Канеманом (Даниэль Канеман — лауреат Нобелевской премии по экономике 2002 года «за применение психологической методики в экономической науке, в особенности — при исследовании формирования суждений и принятия решений в условиях неопределенности», несмотря на то, что исследования проводил как психолог, а не экономист, автор книги «Думай медленно, решай быстро» — прим.ред.), мне повезло поговорить с ним несколько недель назад.
Как раз тогда мы обсуждали историю про машинный интеллект. И он привел пример такого когнитивного искажения: с его точки зрения как опытного психолога, самые ярые противники, которые требуют, чтобы машина никогда не была допущена к принятию решений, по сути дела, обожествляют ее. Эти люди предъявляют несоизмеримо высокие требования, верят в абсолютную «безгрешность», идеальность решения проблемы, ведь машина для них — божество. Как это так, мы бьемся десятилетиями над проблемой, но она-то должна решить это быстро и без ошибок. Но кто вам сказал, что это так?
Может ли в каком-то смысле «очеловечить», внушить доверие к технологиям появление и развитие тех же голосовых помощников, которые постепенно все больше могут общаться почти как люди? Ведь, например, Алиса уже сделала в этом смысле немало успехов.
У Алисы, кстати, сейчас два разных режима, которые в будущем должны слиться. Есть режим «болталки», в котором она плохо отвечает на поисковые запросы и просто разговаривает. Здесь ей в какой-то момент надо сказать: «Алиса, хватит, поищи мне в Яндексе». И в этот момент она перейдет в режим поиска, но начнет отвечать скучно и уныло, с ссылками или зачитывая статьи из Википедии. На самом деле в будущем эти режимы необходимо сделать бесшовными.
Хоть это и довольно пафосно прозвучит, но Алиса — это коллективное бессознательное рунета. Она действительно обучена на сотнях миллионов диалогов реальных людей. Нам даже часто предъявляют претензии и обижаются, почему она дерзит. Ну так ребята, оглянитесь. Я не знаю, в каком интернете живете вы, но мне, например, тоже иногда дерзят, и даже нередко.
Еще одной задачей на будущее для машин, которую вы тоже озвучивали на лекции, станет понимание не только слов, но и контекста, смыслов. Когда удастся хотя бы приблизиться к первым результатам?
На это уйдут, конечно, годы, и это будет пошаговым приближением. Ведь даже если говорить про Алису, то пока очень сложно сделать так, чтобы машина держала в уме контекст. Она пока не умеет «отмотать» десять реплик назад. Например, если мы какое-то время назад сказали ей: «Алиса, найти мужа», а потом стали говорить о рыбалке, на очередной вопрос о муже она, скорее всего, даст произвольный ответ, который будет реакцией только на конкретный вопрос. Она, конечно, понимает, что тема сместилась, но то, что было десять реплик назад, она уже не помнит абсолютно. И на сегодня это чисто вычислительная задача. Пока у нас нет физических ресурсов это сделать.
При этом люди часто пишут нам претензии вроде: «Мы выяснили, что Алиса разговаривает со всеми одинаково, как так? Она что, не может обучиться и узнать то, что интересно мне?» Но сделать 50 миллионов персональных Алис для каждого пользователя пока аппаратно тяжело и дорого. Нужно больше вычислительных мощностей и более продвинутые алгоритмы. Сделать хорошую Алису, но для всех — эта задача ясна. И нам понятно, как решить ее через год-два. Но на сегодня я пока не вижу, как сделать абсолютно персональную Алису за два года. Это гораздо более глобальные вещи.
Сегодня нейросети, по сути, работают как «черный ящик» — то есть условно специалисты загружают массив данных и получают неожиданные результаты, которые часто невозможно объяснить.
И чем дальше, тем сложнее они будут.
Во многом, возможно, именно эта неизвестность и вызывает недоверие, в том числе в таких сферах, как медицина. Объяснить, как все работает, так и не получится?
Это, опять же, к сожалению, психологическая история. Я сейчас даже не про нейросеть буду говорить, а про репрезентации смысла запросов в любой системе машинного обучения. Это даже более тривиальная задача, чем распознавание медицинских изображений.
На пресс-конференции по поводу запуска «Королева» (поисковый алгоритм Яндекса, который умеет сопоставлять смысл запросов и веб-документов и учится на сигналах от пользователей — прим.ред.) прозвучали слова о том, что мы каждому запросу сопоставляем трехсотмерный семантический вектор. А вот дальше проблема: объяснить, что такое вектор — двухмерный, трехмерный, можно и школьнику. Но понять и представить пятимерное пространство человек уже не может. Но мы говорим, что смысл запроса отображается алгоритмом, на секундочку, на трехсотмерное пространство смыслов. При этом ни по одной оси нет величины, которая имеет название в человеческом языке.
Да, возможно, для конкретного запроса можно очень постараться, потратив год работы, и объяснить, что машина имела в виду, когда выдавала именно эти цифры. Но опять же, человеческий мозг не способен представить себе объект в трехсотмерном пространстве, по осям которого отложены понятия, для которых в человеческом языке даже нет слов.
Я сегодня уже спрашивал у ребят, а хорошо ли они понимают, как устроена волновая функция электрона, который сейчас преодолевает p-n-переход, благодаря чему у них работает смартфон. Хорошо это понимают единицы, для остальных это просто работает. По-хорошему, это ведь тоже абсолютный «черный ящик». И нейросети тоже им останутся.
Недавно в Давосе в очередной раз говорили о замене роботами сотен миллионов рабочих мест. К примеру, по прогнозу McKinsey, к 2030 году работы могут лишиться 800 млн человек (в основном, те, кто занимается рабочим трудом и сервисом). Как объяснить людям, что это естественный и неизбежный процесс, мотивировать их переучиваться?
Думаю, лучше объяснять на примерах. Есть совершенно унылая профессия «оператор call-центра», пример этот навяз на зубах, потому что многие и мы в том числе уже давно начали заменять операторов на роботов. Хотя и тут со стороны клиентов до сих пор можно встретить недоверие, поэтому, например, некоторые по-прежнему просят «Елену» (виртуальный робот-консультант компании «Мегафон», разработанный с помощью технологий Яндекса — прим.ред.) перевести их на человека. Но в целом согласитесь, оператор call-центра — не самое творческое и воодушевляющее занятие, я, например, не знаю таких людей, которые с детства мечтали быть операторами call-центра.
На замену таким профессиям придут новые. Например, оператора call-центра заменит оператор дрона. И возможно, новая профессия будет гораздо интереснее, чем необходимость принимать звонки. Более того, управление промышленным дроном также не требует каких-то специальных навыков, переучиться удастся за два месяца. Поэтому нужно готовиться к тому, что постоянно будут возникать новые профессии, но они будут гораздо более привлекательные и интересные.
На зимнюю школу «Тебе решать», которая проходит в рамках всероссийской олимпиады студентов «Я — профессионал», приехало много талантливых ребят, которые добились высоких результатов в треке «Информационные технологии». Какие прежде всего навыки будут требоваться от них, будущих программистов, которые пойдут работать в том числе в крупнейшие высокотехнологичные компании, в ближайшие годы?
Недавно все эти требования очень хорошо сформулировал весьма привлекательный для программистов работодатель — Microsoft. Буквально месяц назад в компании выпустили большую книгу, главная мысль которой как раз и посвящена требованиям к современным специалистам.
В книге говорится: чем дальше, тем больше компания будет заинтересована в людях, которые, помимо основной специальности, имеют еще и дополнительную, которая совершенно не пересекается с основной. В американской терминологии есть такие понятия — major и minor. Это значит, что если вы, например, специализируетесь в программировании, то совершенно нормально, если вы берете дополнительный спецкурс и три года параллельно изучаете историю искусств, получая «майнора» по этой специальности.
И как раз в Microsoft говорят, что сейчас гораздо ценнее будут именно такие специалисты. Их преимущество в том, что они способны мыслить нешаблонно, неалгоритмически, что у них хорошие коммуникативные навыки. Но и наоборот — людям с гуманитарным профилем, будь то HR-специалисты и другие, также требуется разбираться в чем-то еще, помимо основной специальности. Например, опираясь на американскую терминологию, иметь «майнора» в области компьютерных наук. Да, они не будут высококлассными программистами, это и не нужно. Но знать сферу изнутри и уметь с ней работать необходимо.
Мне кажется, что такая междисциплинарность, суть которой Microsoft очень хорошо передал, будет характерна для многих сфер. Даже очень сильный и талантливый программист, с которым, тем не менее, практически невозможно по-человечески разговаривать, вряд ли будет иметь преимущество при выполнении серьезных, интересных задач. Ведь такие задачи, как правило, подразумевают именно командную работу, в основе которой лежит психология. Но стоит задуматься, если команда говорит: «Послушайте, лучше мы сами все сделаем, только уберите этого члена команды, он кодит хорошо, но всем остальным портит воздух». Поэтому здесь важны и те самые soft skills, коммуникативные навыки, эмоциональный интеллект. А если ты эмоционально туп, в какой-то момент коллеги начинают на стену лезть от общения с тобой.
Поэтому для программиста становится необходимостью в том числе знание гуманитарных дисциплин на уровне спецкурсов. Смешно, но в этом смысле есть хороший пример, который всем будет понятен. Если есть хороший программист, который еще к тому же классно играет на гитаре, то его как-то любят больше, чем просто хорошего программиста. И вроде бы простейшая вещь, но я думаю, у многих есть такой приятель.
Все это говорит о необходимости новых подходов в системе образования, которая часто бывает достаточно консервативна. Что нужно менять в первую очередь?
Как я уже говорил, совершенно не стоит пытаться воплотить в будущем идеального программиста, инженера или еще кого-то из прошлого. Из серии: «Я хотел стать таким, у меня не получилось, так давайте я теперь воспитаю следующее поколение так, чтобы оно не повторило моих ошибок». Но следующее поколение другое, оно вообще живет в другом мире. И история о том, что «будущее никогда не лучше прошлого» касается очень многих аспектов образования. И на самом деле в первую очередь именно школьников.
Недавно у меня была дискуссия с ребятами-психологами из «Вышки» и хорошими учителями, у которых действительно очень сильная подготовка. Так вот мы все сошлись на одной и той же идее: фундаментальная беда в том, что часто родители хотят получить от ребенка улучшенную копию себя, чтобы у него было все, что взрослые недополучили когда-то. Из лучших побуждений они хотят, чтобы следующее поколение не повторило их ошибок и наоборот, чтобы у него получилось все то, что они не смогли сделать в свое время. Но все это уже не нужно. Нужно менять структуру образования под потребности современного дня. И при этом помнить, что потребности современного дня — совсем не те, которые были тридцать лет назад.