Премия имени сооснователя Яндекса Ильи Сегаловича вручается студентам старших курсов, аспирантам и научным руководителям за достижения в области машинного обучения, компьютерного зрения, анализа данных и поисковых систем. Главная цель премии — дать возможность молодым ученым продолжать фундаментальные исследования на базе университетов и не уходить в индустрию. В этом году лауреатами премии, которая вручается уже второй год подряд, стали девять человек — среди них аспирант факультета информационных технологий и программирования Университета ИТМО Вячеслав Шаламов.
Как вы стали участником конкурса?
Я узнал о существовании этого конкурса от коллег в лаборатории в ИТМО еще в прошлом году. В этот раз тоже решил подать заявку.
Студенты и аспиранты сами подают заявки на соискание премии — нужно заполнить большую форму и указать темы и результаты своих исследований, практические разработки, участие в конференциях, список публикаций, приложить тексты статей. Все заявки проходят первичный отбор, и для наиболее перспективных назначаются личные собеседования со специалистом из Яндекса, обладающего экспертизой по теме кандидата. В моем случае это был Константин Лахман — руководитель отдела компьютерного зрения Яндекса. По результатам этого собеседования и принимается окончательное решение.
Я занимаюсь машинным обучением еще с конца бакалавриата, то есть с 2015 года. Все свои статьи и разработки я приложил к заявке — видимо, получилось довольно много по сравнению с остальными участниками. Думаю, количество моих публикаций и уровень конференций и дали мне возможность стать лауреатом премии.
В прошлом году я тоже участвовал в этой премии и стал финалистом. Меня пригласили на церемонию вручения в московский офис Яндекса, но поехать по разным причинам не получилось. Тогда мне передали через научного руководителя диплом о том что я являюсь финалистом научной премии и небольшой сувенир от Яндекса. У финалистов и лауреатов премии есть дополнительные преимущества, чтобы попасть на стажировку в Яндекс, но я точно это не узнавал.
Как вы планируете потратить средства, которые полагаются победителям?
Никаких ограничений на использование средств нет, это именно премия (350 тысяч рублей ― прим. ред.), которая выплачивается в течение десяти месяцев. Лауреаты также получат поездку на международную конференцию по искусственному интеллекту по своему выбору, но пока неизвестно, что будет с поездками, пока границы не откроют.
Я пока не решил, на потрачу эти деньги. На какой-то проект или покупку рабочего оборудования этого не хватит. Возможно, нас совсем скоро ждет глобальный экономический кризис — так что будет иметь смысл купить какие-то просевшие акции.
Расскажите подробнее о своей научной работе?
Во время обучения в бакалавриате я занимался оптимизацией логистических задач: например, как распределить заказы на доставку между курьерами, чтобы они максимально оптимально их выполнили, учитывая вместимость, расстояние до конечной точки и так далее.
В магистратуре моей темой была настройка гиперпараметров алгоритмов кластеризации — сюда входят задачи по выделению в массе объектов каких-то схожих черт и разделению их на группы в соответствии с общими признаками. Обычно эта работа делается вручную специалистом или ученым-исследователем. У меня же была попытка сделать алгоритм, который выполнял бы эту задачу (поиск гиперпараметров для алгоритма кластеризации) в автоматическом или полуавтоматическом режиме. Соответственно, велись разработки на эту тему, вышла статья, я защитил диплом. Сейчас этой темой продолжают заниматься коллеги из лаборатории машинного обучения, я — в меньшей степени.
Сейчас, в аспирантуре, я постепенно смещаю фокус в сторону нейронных сетей, поиск их архитектуры. Это, в общем-то, смежная задача с тем, чем я занимался в магистратуре. Обе эти темы являются подмножеством AutoML.
Ваши разработки как-то используются в индустрии или бизнесе?
В 2017 году, когда я был в магистратуре, мы с коллегами из лаборатории машинного обучения организовали небольшой стартап — Statanly Technologies. Изначально это был стартап по разработке платформы Auto ML — автоматического машинного обучения для заказчиков, владельцев бизнесов, которые не могут или не хотят нанять эксперта по машинному обучению или дата-сайентиста. Предполагалось, что с помощью нашей платформы, в том числе с разработанным мной алгоритмом по автоматической настройке параметров кластеризации, они могли бы загружать свои данные и получить какой-то готовый результат.
Постепенно мы перешли на консалтинговый бизнес и решение индивидуальных задач, так как это больше подходит нашим клиентам. К нам приходят заказчики со своей предметной областью, данными и конкретными задачами, а мы помогаем им оптимизировать какой-то аспект их бизнеса.То есть это такой стартап, в котором мы применяем наши разработки по машинному обучению — и у нас есть несколько успешно реализованных проектов.
Также год назад мы с коллегами создали компанию Deflamel Design — она занимается генерацией визуального контента по текстовому описанию. Например, с ее помощью можно генерировать книжные обложки — на основе аннотации, а также постеры, визитки, открытки и любой другой вид визуальной продукции. Мы используем базу из нескольких фотостоков (как из бесплатных, так и платных). Алгоритм отбирает изображения в соответствии с описанием пользователя, соединяет их между собой, обрабатывает и редактирует, переносит выбранный пользователем стиль (Neural Style Transfer). В итоге пользователь получает готовый к печати дизайн.
В течение последнего года мы проходили голландский акселератор Rockstart, сейчас проект выходит на следующую ступень развития. Он работает в бета-тестовом режиме, мы постоянно его дорабатываем, но им уже вполне можно пользоваться.
Значит, вас больше интересует собственный бизнес, чем работа в компании? Планируете ли вы в будущем уйти из науки в индустрию?
Я не разделяю эти вещи. В том же Яндексе или Google есть подразделения, которые занимаются чисто исследовательскими проектами, не связанными с конкретными задачами по оптимизации имеющегося функционала. Они просто занимаются наукой, без указаний от менеджера.
У вас уже есть опыт работы в коммерческих компаниях?
На четвертом курсе я работал Java-разработчиком в стартапе VeeRoute. Там я улучшил навыки промышленного программирования и вдохновился задачами логистики, которые потом решал в рамках бакалаврской работы.
В магистратуре я работал в Одноклассниках, где я занимался задачами, близкими к исследованиям в лаборатории: писал код для анализа социального графа, который позволял бы вычислять вероятность, что тот или иной аккаунт — бот.
Также в магистратуре я проходил летнюю стажировку в Google, в Калифорнии. Там я реализовывал дополнительную функциональность для внутреннего инструмента обработки больших данных, который назывался Conduit. В последнее время я работал Data-инженером в Берлине, в компании GetYourGuide, которая предоставляет сервисы бронирования билетов по всему миру. Я разрабатывал инфраструктуру для сбора, обработки и мониторинга событий, генерируемых пользователями в системе: клики, просмотры, покупки, отмены.
Чем планируете заниматься в будущем?
Мой план на ближайшие пару лет ― закончить аспирантуру, защитить кандидатскую и получить степень PhD. Параллельно буду развивать свои стартапы.
Я бы предпочел двигаться в сторону научных исследований в области машинного обучения и нейронных сетей — это может быть и в Яндексе, и в лаборатории машинного обучения в ИТМО, где я работаю сейчас, и в каком-то другом месте. Вообще, когда занимаешься разработками, исследованиями — и при этом что-то получается, нельзя же просто положить результат в стол. Поэтому я стараюсь внедрять свои наработки в компаниях, чтобы они приносили пользу как другим, так и мне.