— В прошлом году вы первый раз участвовали в AI Journey. Предыдущий опыт помог вам в этот раз, было проще?
— Нет, проще не было. Но в целом за год между соревнованиями я научился многим новым вещам и стал более опытным.
В прошлом году я решал задачу компьютерного зрения на основе детектирования объектов и сегментации изображения. В этот раз были совсем другие задачи, хотя научная и фундаментальная составляющая у них схожи.
Но в прошлый раз мне, во-первых, в целом удалось получить опыт участия в соревнованиях по машинному обучению ― я научился организовывать свою работу в соответствии с дедлайнами конкурса. А во-вторых, познакомился с площадкой AI Journey, так что в этот раз мне было проще на ней ориентироваться.
— В этом году вы решили одновременно участвовать сразу в нескольких треках AI Journey. Почему? Кажется, что решать сразу много сложных задач в сжатые сроки — это прям челлендж.
— Ну, сначала я хотел взять только два трека: FusionBrain и AI4Biology. Но уже после первой недели работы над AI4Biology я решил задачу, и там уже было нечего совершенствовать в разработанном алгоритме. С другой стороны, в FusionBrain длительность обучения алгоритма составляет два дня на один период, так что в принципе у меня было время, чтобы, пока жду, заняться еще одной задачей.
Церемония награждения победителей AI Journey
— Почему вы выбрали именно эти треки?
— Учитывая, что я участвовал в трех треках из четырех, проще рассказать, почему я не взялся за последний. В треке AI4Sea нужно было решить статистические проблемы (временного ряда) при прогнозировании погоды. Это было очень похоже на то задание, которое я делал в самом первом своем соревновании MagNet от NASA. Так что на этот раз мне хотелось попробовать что-то новое. Хотя на самом деле я мог бы решить и эту задачу, если бы у меня было достаточно времени.
— Можете кратко описать, а что именно вы делали? И что вам показалось самым сложным?
— В треке AI4Biology нужно было создать алгоритм машинного обучения, который бы, используя данные масс-спектрального анализа, классифицировал разные виды бактерий по 27 видам, а также выявлял новые штаммы. Здесь самой сложной оказалась именно последняя задача по определению новых бактерий. Дополнительным ограничением стало малое количество информации для датасета.
В AI4Talk надо было работать над распознаванием речи на шести языках народов России: башкирском, эвенкийском, луговомарийском, камасинском, татарском и якутском. И тут главная проблема была в том, что я не понимаю ни один из этих языков, а в речевых данных было много шумов и помех. Но я предварительно обработал данные и грамотно разделил их, чтобы не допустить переобучение алгоритма. Затем натренировал трансформер Wav2Vec и закончил небольшой постобработкой.
Однако самым сложным и объемным был третий трек — FusionBrain. Там требовалось создать единую модель, которая бы выполняла 12 различных задач, причем шесть из них были неизвестны конкурсантам. На вход принимали описание на естественном русском языке: «сгенерируй изображение», «опиши изображение», «ответь на вопрос» и так далее. То есть одна единственная нейронная сеть должна была выполнять целых 12 функций, включая те, о которых мы даже не знали — такого задания я не видел ни в одном другом международном соревновании.
И тут было сразу несколько проблем. Во-первых, такая большая нейросеть требует много времени на обучение, так что в условиях дедлайна было сложно экспериментировать с решениями и допускать ошибки. Во-вторых, по сути это модель нового типа — речь о сильном искусственном интеллекте. В общем, это было очень сложно, но и очень интересно.
— Многие участники соревнования выступали в составе команды, вы же — в одиночку. Вам проще работать одному, а не в команде?
— Конечно, работать в команде эффективнее, интереснее и просто веселее. Но выбирать партнеров приходится очень осторожно, например, избегая тех, кто не сможет работать достаточно эффективно. Поэтому обычно я участвую во всех конкурсах один.
На самом деле у меня есть партнер, но, к сожалению, он был занят во время проведения состязаний.
Читайте также:
— А что бы вы могли посоветовать студентам, которые хотят поучаствовать в следующем AI Journey или каком-то похожем соревновании?
— Соревнования по машинному обучению сильно отличаются от того, с чем сталкивается ML-инженер, работая в компании. Здесь нужно четко спланировать свое время и рассчитать силы, чтобы получить высокий результат в короткие сроки. Поэтому надо ставить четкие дедлайны, умудряясь при этом работать в условиях множества ограничений вроде слабого оборудования.
Это сложно, но очень интересно ― дух соревнований ни с чем не сравнится. А еще это ― хорошая возможность научиться решать задачи быстро, аккуратно и эффективно, натренироваться быстро искать и обрабатывать информацию и использовать ее в своих решениях.
AIJourney — потрясающее мероприятие, причем не только как конкурс, но и как конференция. Там большое количество активностей ― можно весело провести время, получить много новых знаний. А победа, к тому же, сильно поможет в дальнейшей карьере. А в общем и целом, для себя описал бы рецепт успеха так: нужно просто усердно работать, научиться организовывать свое время и верить в себя