В последние годы машинному обучению находят всё новые применения в разных сферах — от управления транспортом до химии. Например, алгоритмы уже помогают ученым решать сложные задачи по химии и нанотехнологиям в два клика, улучшать существующие химические процессы и запускать новые, а также предсказывать результаты эксперимента при разработке новых лекарств.
Чтобы дать возможность школьникам и студентам узнать больше об этих направлениях, в ИТМО проведут воркшоп и хакатон DataCon ― его участники смогут познакомиться с передовыми проектами ИТМО в области искусственного интеллекта и машинного обучения в наномедицине.
«Цифровые направления в науке развиваются всё больше, и мы активно применяем их в наномедицине. Мы хотим привлечь студентов и школьников к участию в передовых проектах ИТМО. Для этого мы и организуем DataCon, который включает в себя две части — воркшоп и хакатон. Такая структура позволит и обучить тех, кто еще только интересуется темой, и провести конкурс среди более опытных участников. Мы приглашаем самых разных людей ― как по возрасту, так и по уровню подготовки», — прокомментировала организатор DataCon, аспирантка первого курса химико-биологического кластера Александра Фальчевская.
Как устроен DataCon
DataCon пройдет с 19 по 28 июля. Сначала, на воркшопе, преподаватели ИТМО расскажут участникам о том, каких результатов в науке и индустрии уже удалось достичь с помощью искусственного интеллекта и как его можно использовать для решения задач, связанных с химией, биологией и наномедициной.
«В ходе воркшопа участники ознакомятся с различными тематиками, узнают о роли искусственного интеллекта в химии и промышленности и получат необходимые знания и опыт работы с данными и алгоритмами ИИ в области химии. Лекции и практики адаптированы для участников с различным бэкграундом и включают все необходимые темы для подготовки к хакатону и будущей практике в центре искусственного интеллекта в химии Университета ИТМО», — добавила один из организаторов, эксперт DataCon, магистрантка второго курса химико-биологического кластера Юлия Разливина.
Также эксперты научат ребят работать с базами данных и алгоритмами машинного обучения и организовывать виртуальное пространство для совместного кодинга.
Как подчеркивает спикер DataCon, аспирант второго курса химико-биологического кластера Никита Серов, на занятиях участники смогут понять, какие инструменты необходимо задействовать при работе с химическими задачами, которые либо крайне сложно, либо и вовсе невозможно решить классическими экспериментальными подходами.
На лекциях специалисты расскажут, как можно собирать химические базы данных, как проверять их на разумность, наглядно визуализировать и проводить их автоматический анализ. А еще ― как на основе этих данных предсказывать с большой точностью результаты еще не проведенных и отсутствующих в базе исследований. Практическая часть предоставит участникам возможность самостоятельно пройти каждый из этих этапов и найти лучшее решение из возможных.
«Уже сейчас сложность задач в этой области перевешивает возможности классических подходов. Например, какую молекулу надо получить, чтобы убить раковую опухоль в конкретном органе или ткани, но при этом не задеть здоровые ткани? Как подобрать синтез так, чтобы получить наночастицы заранее определенной формы и размеров? Потребность в подобном обратном подходе на смену длительному прямому поиску методом проб и ошибок постоянно растет. Именно этому подходу участники и научатся в ходе DataCon», — рассказал Никита Серов.
На хакатоне, который пройдет с 29 июля по 1 августа, командам участников предстоит разработать предсказательную модель биологических свойств наночастиц, опираясь на настоящие данные. Презентацию проектов нужно будет заранее записать и показать на платформе Discord жюри конкурса.
«Команду победителей мы выявим с помощью множества критериев. Например, будем учитывать как первое впечатление после представления проекта, так и результаты более детального анализа решения. Будут оцениваться прозрачность, простота и лаконичность презентации и полнота описания ответа. Но вместе с тем мы рассмотрим интерпретируемость и точность работы модели, качество предобработки и анализа данных, читаемость и организацию кода», — объяснила Александра Фальчевская.
Список победителей станет известен в течение двух недель после DataCon. Первое место на хакатоне школьникам засчитают как индивидуальное достижение при поступлении в бакалавриат ИТМО в этом году, а студенты бакалавриата смогут поступить в магистратуру «Химия и искусственный интеллект» без вступительных экзаменов. Участники, которые успешно прошли воркшоп и хакатон, получат приглашение на стажировку по теме Data-driven nanomedicine в центр искусственного интеллекта в химии на базе SCAMT.
Как принять участие
Прежде всего DataCon будет полезен школьникам 9–11 классов и студентам бакалавриата, которые уверенно читают на английском языке, увлекаются химией, наномедициной и наноинжинирингом, умеют программировать и разбираются в искусственном интеллекте, машинном обучении и больших данных.
Чтобы участвовать в мероприятии, нужно подготовить мотивационное письмо и портфолио и прикрепить их к заявке на сайте. В первом документе надо пояснить, почему для вас важен DataCon, чем он будет полезен и каких целей вы хотите достичь с его помощью. Во втором ― организаторы ожидают увидеть основную информацию и опыт участия в похожих хакатонах, школах, конференциях и олимпиадах в сфере естественных наук и искусственного интеллекта.
Регистрации на DataCon две, а выбор дат зависит от целей:
- Если вы хотите послушать лекции экспертов и улучшить навыки работы с информационными технологиями на воркшопе, нужно зарегистрироваться до 19 июня. Отдельно регистрироваться на хакатон не нужно. А узнать, кого взяли на DataCon, можно будет не позднее 5 июля.
- Если же вы уже достаточно хорошо разбираетесь в программировании и химии, можно не участвовать в воркшопе, а подать заявку сразу на хакатон ― в этом случае зарегистрироваться нужно до 27 июля. Все участники, независимо от формата, смогут претендовать на призы хакатона.
Проект DataCon реализуется при поддержке программы «Приоритет-2030».