Совсем недавно появилась новость, что «ВКонтакте» обновляет алгоритмы «умной ленты» новостей. В 2016 году ты был среди тех, кто создавал первую умную ленту «ВКонтакте». Что изменилось за эти два года?
За это время у нас очень сильно выросла команда. На момент, когда мы запускали «умную ленту» в 2016 году, нас было всего несколько человек, сейчас же у нас сложилась талантливая команда, которая занимается конкретно задачами из области машинного обучения. За это время мы стали лучше понимать потребности пользователей, в том числе авторов, медиа, средств массовой информации.
Понимание того, как все должно работать, является одним из ключевых факторов, который сложился на данный момент. Мы постоянно работаем над обновлением алгоритмов. Ведь даже если мы решили какую-то проблему, есть возможность сделать это еще лучше. Кроме того, за эти два года появились новые технологии, которые позволяют нам работать над более сложными задачами. Мы понимаем, что лента новостей очень важна как для пользователей, так и для тех, кто создает контент, поэтому над задачами в этой области мы работаем каждую неделю, не останавливаемся на достигнутом.
С 2016 года у нас добавились новые факторы, которые теперь учитываются при формировании ленты. Если мы начинали с достаточно простого алгоритма, который все же решал довольно заметную часть проблем, сейчас факторов стало в десятки раз больше, и алгоритмы, которые предсказывают интересы пользователей, стали эффективнее.
Однако, как и в любой экосистеме, в нашем случае это контентная экосистема, всегда есть и не очень позитивные проявления. Например, некоторые авторы пытаются обхитрить алгоритмы. Здесь я говорю об историях, связанных с накруткой лайков, и подобных. С этой проблемой мы тоже регулярно боремся, чтобы пользователь видел то, что действительно важно.
Какие факторы вы учитываете теперь?
Факторов на самом деле очень много. Мы активнее начинаем учитывать географию, ведь очевидно, что жителям Петербурга важнее новости Петербурга. Безусловно, мы учитываем, с какой платформы заходит пользователь. Этот фактор тоже сильно влияет на особенности потребления контента. С мобильного телефона мы в основном предпочитаем быстрый контент: короткие видеоролики, интересные новости. Когда мы заходим с домашнего компьютера, ноутбука, у нас уже есть время посмотреть большое видео или активнее погрузиться в информацию.
Также мы учитываем время, которое пользователь тратит на новости. Зачем это нужно? Например, существует расхожее и довольно упрощенное мнение, что новости, у которых больше всего отметок «Нравится», на самом деле очень важны. Но это не так, поведение пользователей значительно сложнее. Очень часто мы не лайкаем те вещи, которые нас интересуют: мы читаем заголовок, разглядываем иллюстрацию, но не отмечаем эту запись. Все это мы тоже научились достаточно хорошо учитывать.
В этом году стало известно об изменении основного принципа формирования новостной ленты в Facebook: вместо «наиболее актуального контента» алгоритм теперь будет предлагать записи от друзей и членов семьи. Ты ранее уже замечал, что, напротив, неоптимально ограничивать возможности пользователя просматривать интересные новости СМИ, сообществ. Почему?
В этом вопросе у нас другая позиция, мы выступаем за баланс. И мы видим, что в контентной экосистеме на самом деле есть много равнозначных участников. С одной стороны, наша цель как площадки — сделать все максимально удобно для нашего пользователя. Конечно же, «ВКонтакте» — это исторически то место, где мы общаемся с друзьями.
Но с другой стороны, все те, кто создает контент, — тоже наши пользователи и, более того, как раз они и делают нашу площадку интересной. Мы знаем, что у нас есть много небольших талантливых авторов, которые, например, участвуют в программе VK Talents, на нашей площадке представлено огромное количество СМИ, у которых большое количество читателей внутри «ВКонтакте».
Таким образом, наша цель — создать баланс, понять, что и в какой момент важно, и персонализировать этот контент. Ведь кто-то в принципе любит читать новости СМИ, поэтому такой информации у него будет больше. Или другой пример: возможно, для ряда пользователей оптимально утром узнать новости СМИ, а вечером — общаться с друзьями. Поэтому в этом плане наши алгоритмы учитывают в том числе и время суток, в течение которого пользователь взаимодействует с площадкой. И постепенно мы добавляем различные факторы, чтобы алгоритмы были еще точнее.
Кстати, в начале 2018 года сообществу Университета ИТМО тоже удалось получить огонь «Прометея». Программа VK Talents начала действовать в прошлом году, каких, возможно, неожиданных лично для тебя результатов удалось добиться на сегодняшний день?
В нашей программе талантов на сегодняшний день более десяти тысяч участников получали огонь «Прометея». У нас сложилось уже достаточно большое комьюнити авторов, с которыми мы общаемся.
Ярким открытием стала, например, певица Гречка, которую сейчас многие уже знают и наверняка могли видеть на Первом канале. Наши алгоритмы ее нашли и выдали ей огонек «Прометея», если не ошибаюсь, еще в январе. Таким образом, та задумка, которая у нас была, оправдалась: мы верили, что будем очень классно анализировать все, что происходит, учитывать интересы пользователей, замечать талантливых людей, которые способны привлечь внимание за счет того, что они создают. Под эту идею мы создавали алгоритмы и видим, что это работает. Уже на ранней стадии наши алгоритмы замечают авторов, после чего они становятся еще известнее, а потом получают известность и далеко за пределами «ВКонтакте».
Это первый приятный вывод, который мы можем для себя сделать: мы видим большой интерес пользователей к тем талантливым авторам, которых находим. И благодаря тому, что мы очень много общаемся с нашим комьюнити авторов, у нас есть огромное количество идей, как развиваться дальше. Будет еще много интересных запусков в этом году.
Кстати, если интересно отслеживать новости про «Прометей» и историю с контентом, стоит подписаться на «ВКонтакте с авторами», если интересны технологии — у нас есть сообщество VK Research, где мы выкладываем исследования в области машинного обучения, которыми мы занимаемся, также у нас есть VK Tech, здесь мы рассказываем в общем об актуальных технологиях в мире программирования, и, конечно же, «Команда ВКонтакте», где анонсируются все крупные запуски.
Одно из правил для сообществ, которые хотят получить огонек, — оригинальность контента или его интересная подача. Как алгоритмы сегодня помогают в целом бороться с неоригинальным контентом, быстро находить первоисточник и показывать его пользователям?
Мы анализируем текст, а также все изображения. Если взять два текста, то с помощью алгоритмов, которые появились за последние годы, мы можем понять достаточно точно, что эти тексты очень похожи. Или, например, мы можем понять по изображению, даже если в него вносили малозначительные изменения, что у него есть некий первоисточник, который был создан ранее на нашей платформе.
Мы знаем, что для каждого автора очень важно, чтобы мы как платформа помогали ему защищать то, что он создает. Поэтому, безусловно, эти алгоритмы будут постоянно развиваться.
А в целом какие задачи пока невозможно решить с помощью искусственного интеллекта, машинного обучения? И что лично ты очень ждешь от технологий?
В глобальном смысле из того, что близко и кажется классным, – это возможность отказаться от управления машиной. Вторая вещь, которая мне кажется очень интересной и перспективной с точки зрения развития, это диалоговые системы, или умные боты.
Сегодня мы видим, что многие задачи можно быстро и эффективно решать с помощью сообщений. Например, если мы раньше часто звонили в какие-то организации, договаривались о чем-то по телефону, то в уже в ближайшее время, я думаю, мы придем к тому, что все это можно будет сделать через мессенджеры, и многие рутинные задачи за нас будут решать боты.
Во «ВКонтакте» у нас есть большие планы по поводу того, как сделать еще удобнее сервис рекомендаций. И в этом смысле нам помогает то, что мы сами активно пользуемся тем, что создаем. Заходя во «ВКонтакте» каждый день, с одной стороны, мы радуемся тому, что есть, с другой — мы понимаем, как сделать еще удобнее и поэтому постоянно развиваемся.
Восемь лет назад, когда ты сам оканчивал университет, о машинном обучении, больших данных не говорили так активно, как сейчас. Что привело в эту область лично тебя?
Как раз когда я готовил лекцию и шел сюда, думал о том, что университет дал мне очень много классных знаний, важных фундаментальных основ и научил меня изучать почти любую тематику, уметь разбираться в ней. Но на самом деле никто — ни я, ни эксперты, ни преподаватели в университете — со стопроцентной точностью не могут сказать, что будет востребовано через пять лет. Поэтому важно оставаться очень динамичным и гибким, не бояться экспериментировать в плане того, что вы изучаете.
Моей первой работой после окончания вуза (Андрей Законов — выпускник кафедры компьютерных технологий Университета ИТМО — прим.ред.) была работа Java-разработчиком. Тогда мне было безумно интересно программировать, но спустя пару лет появились новые технологии, стало активно развиваться машинное обучение, нейронные сети. Так как я следил за тем, что происходит в этой области интересного, я решил, что мне стоит попробовать изучить что-то новое. Ведь уже тогда было ясно, что это технологии, которые способны сильно повлиять на то, что происходит вокруг. Постепенно я этим очень увлекся и сегодня понимаю, что это одна из самых перспективных областей.
На олимпиаде «ИТМО ВКонтакте» в этом году много призеров и победителей даже из седьмых, восьмых классов. Могут ли они начать заниматься задачами из области машинного обучения хотя бы на начальном уровне уже сегодня?
Я думаю, да, вполне. С одной стороны, есть очень сложный уровень технологий. Например, чтобы решить многие задачи, нужно глубоко погрузиться в технологии и создавать новые алгоритмы. Это то, чем мы как раз занимаемся в команде «ВКонтакте», потому что мы решаем те задачи, которые еще не решены.
Но при этом очень здорово, что с каждым годом технологии становятся все более доступными. Те же технологии нейронных сетей и машинного обучения, которые уже есть, могут быть легко применимы к новой области. Есть много разных примеров, как можно научить нейросети отличать фотографии кошек от фотографий собак, как по фото человека определять его пол и возраст или распознавать по тексту его тематику.
Эти вещи можно делать на каком-то базовом уровне, не обязательно сильно погружаться в эту область, можно использовать готовые примеры кода, библиотеки, фреймворки. И как раз я бы советовал всем смотреть, а какие есть задачи в этой каждой отдельной области, которой они занимаются, определять, что выглядит достаточно рутинным, что компьютер может сделать за меня, и пробовать решить эту задачу. Если какая-то задача выглядит довольно монотонной и не очень творческой, то, скорее всего, технологии искусственного интеллекта или уже умеют ее решать, или скоро решат. Поэтому можно попробовать либо применить их, либо сделать то, что скоро случится.
А какими компетенциями должны обладать разработчики, которые хотят стать частью команды «ВКонтакте» и заниматься этими задачами вместе с вами?
На самом деле мы активно ищем очень опытных ребят — экспертов в своей области, но, кроме того, мы сотрудничаем с университетами. У нас есть программа стажировки, когда к нам могут прийти не очень опытные ребята и продолжить учиться, решая наши задачи. Безусловно, мы ждем очень хороших фундаментальных знаний: знания в области математики и физики в целом помогают разбираться во многих вещах.
Но, как я уже говорил, так как мы постоянно учимся, часто важны даже не те знания, которые есть на данный момент. Важны такие черты характера, как готовность к новому, смелость в каком-то смысле — не нужно бояться никаких задач, пробовать то, что сегодня кажется невозможным. И, безусловно, необходимо уметь решать творческие задачи. Это важно для нас, поскольку мы пытаемся создать новые способы, чтобы общаться.