ИИ для науки: от прогнозирования морского льда до создания лекарств и искусственных органов
В номинации «Молодой научный руководитель» победу одержал руководитель фронтирной лаборатории в исследовательском центре «Сильный ИИ в промышленности» ИТМО, лидер сообщества ITMO OpenSource, кандидат технических наук Николай Никитин. Вместе со студентами Никитой Стародубцевым, Любовью Ямщиковой, Майей Пинчук и аспирантами ИТМО Юлией Борисовой, Глебом Соловьевым он разработал открытую экосистему методов и алгоритмов машинного обучения для научных исследований. Инструменты помогают автоматизировать применение методов искусственного интеллекта для решения задач из разных областей науки и техники, и, что самое главное, открыты для всех — ими пользуются не только исследователи из ИТМО, но и научные команды в России и по всему миру.
Разработки позволяют использовать методы ИИ для более глубокой интерпретации данных и решения широкого круга научных и производственных задач: например, предсказывать свойства веществ в химии или состояние природы в гидрометеорологии, моделировать данные с датчиков технических систем; объяснять, почему какая-то часть молекулы придает веществу определенные свойства.
Исследователи уже используют экосистему в реальных кейсах. Например, совместно с институтом Цинхуа-Беркли ученые ИТМО спроектировали искусственную селезенку на чипе, а также использовали инструменты автоматического машинного обучения для прогнозирования морского льда. Вместе с химико-биологическим кластером ИТМО создали алгоритм, который ускорит и упростит создание препаратов, в том числе процесс спрессовывания лекарственного вещества в таблетку. А вместе с лабораторией «Биомехатроники и энергоэффективной робототехники» ИТМО повысили эффективность проектирование робототехнических манипуляторов.
«Применение автоматического машинного обучения позволяет экономить время очень дорогостоящих экспертов: вместо многих часов работы над прототипом модели дата-сайентист может создать ее за полчаса. Кроме того, в принципе важно реализовывать инструменты ИИ в виде открытого кода — это позволяет повышать воспроизводимость научных исследований. В следующем году мы с командой планируем исследовать мультиагентные системы на основе больших языковых моделей для автоматизации решения разных сложных задач в промышленности и науке. Для этого тоже будем делать открытую библиотеку и выкладывать свои результаты», — рассказал Николай Никитин.
Алгоритмы для генерации изображений и векторной графики
Победителем в номинации «Молодые научные руководители» была признана также Валерия Ефимова ― старший научный сотрудник, заместитель руководителя лаборатории «Компьютерные технологии» ИТМО, кандидат технических наук и ключевой преподаватель магистратуры «Глубокое обучение и генеративный искусственный интеллект». Исследовательница уже второй год руководит отделом компьютерного зрения, в котором состоит более 20 человек, а также ведет более 20 дипломников и аспирантов. Под руководством Валерии Ефимовой студенты написали две научные статьи, которые приняли на конференции уровня A: GECCO и PPSN, а также выступали на конференции CVPR уровня A*.
Исследовательница изучает применение больших языковых моделей для генерации векторной графики, в том числе чертежей промышленного оборудования и дизайна графических материалов по текстовому запросу. Также Валерия Ефимова разработала три курса по глубокому обучению и генерации изображений. Победа в Yandex ML Prize позволит ей и ее научным группам обучать нейросети в облачных средах, что существенно ускорит исследования: например, вместо месяца на обучение модели теперь потребуется чуть больше недели.
«Дальше я планирую продолжить исследования в области генерации векторной графики, аугментации датасетов (увеличения числа обучающих изображений) и поиске архитектур нейронных сетей для компьютерного зрения. Мне бы хотелось проводить более фундаментальные исследования, которые принесут практическую пользу для промышленности. Например, мои исследования помогут находить дефекты производимой продукции, генерировать чертежи оборудования и его деталей, автоматизировать разработку ИИ и повысить качество предсказаний нейронных сетей», — подчеркнула Валерия Ефимова.
Курсы по машинному обучению
А лауреатом в номинации «Преподаватель ML» стал профессор ИТМО, управляющий директор в блоке «Технологическое развитие» Сбербанка, кандидат технических наук Алексей Шпильман. Он разработал несколько опенсорсных курсов в области машинного обучения.
Главный из них ― «Введение в машинное обучение» ― за восемь лет прошли уже более 500 студентов. Также преподаватель читал курсы по глубокому обучению, обучению с подкреплением, информационному поиску. Пару лет назад исследователь вместе с аспирантом Олегом Свидченко сделал телеграм-бота для проверки домашних заданий с автоматическими тестами и метриками по точности решения и времени его выполнения. Бот позволил сэкономить время на проверку домашних заданий: раньше на это могло уходить два дня в неделю.
«Выиграть премию Яндекса для меня означает получить признание моего труда как преподавателя. Сейчас я много думаю о том, как наука и преподавание должны меняться. Возможно классический формат с лекциями, семинарами, контрольными и экзаменами по расписанию — это уже не лучший путь учить людей. Образование должно развиваться вместе с технологиями: важно, чтобы появлялись новые цифровые и ИИ-инструменты, но при этом сохранялся человеческий контакт», — рассказал Алексей Шпильман.
Конкурс Yandex ML Prize (раньше ― научная премия Яндекса им. Ильи Сегаловича) проводится с 2019 года и охватывает 11 стран: Россию, Азербайджан, Армению, Беларусь, Казахстан, Кыргызстан, Молдову, Сербию, Таджикистан, Туркменистан и Узбекистан. Премию вручают в пяти номинациях: «Первая публикация», «Исследователи», «Молодые научные руководители», «Научные руководители», «Преподаватели ML».
Участвовать в конкурсе могут студенты, научные руководители и преподаватели, которые занимаются исследованиями в области машинного обучения: компьютерного зрения, информационного поиска, обработки естественных языков и машинного перевода или распознавания и синтеза речи, а также генеративных моделей.
Победители получают премию в размере от 500 тысяч до 1 млн рублей, а также грант на 500 тысяч рублей на все сервисы платформы Yandex Cloud, которые могут быть использованы для вычислений, хранения и публикации датасетов, обучения ML-моделей. Кроме того, созданные победителями алгоритмы, методы и технологии применяются во многих продуктах Яндекса, в том числе в Поиске, Алисе и беспилотном транспорте.