Как и зачем участвовать в Мегаолимпиаде ИТМО
Мегаолимпиада ИТМО — это шанс не только проверить свои знания, но и поступить в магистратуру университета, минуя этап вступительных испытаний. Регистрация в самом разгаре — в этом сезоне она продлится до 14 января. О том, как принять участие, мы рассказывали подробно в этом материале.
А для зарегистрировавшихся участников уже доступны демоверсии заданий по каждому из треков этого сезона. Заранее изучив их, можно эффективнее подготовиться к испытаниям. Выбирайте интересующий вас трек, знакомьтесь с разработчиками и сохраняйте советы!
Содержание:
- «Программная инженерия и компьютерные технологии»
- «Искусственный интеллект»
- «Аналитика данных»
- «Физика»
Как подготовиться к треку «Программная инженерия и компьютерные технологии»
Какие задания будут? На этом треке участников ждет несколько блоков заданий. Один из самых объемных посвящен темам разработки и анализа систем искусственного интеллекта. Он состоит из вопросов про алгоритмы машинного обучения и архитектуру нейронных сетей. Здесь проверяются знания в классификации и регрессии, балансировке данных, работе с гиперпараметрами и регуляризацией, а также умение работать с методами бинаризации и квантизации для ускорения моделей и повышения их эффективности.
Наибольшее количество баллов можно получить за блок «Программирование». Теоретических вопросов здесь почти нет — практически во всех заданиях нужно написать программу, выполняющую заданные в условии действия. Основное требование к полученному коду — программа должна работать.
Какие темы повторить? Для подготовки важно повторить теоретические основы по темам машинного обучения и нейронных сетей. Вспомнить, как работают алгоритмы анализа данных и прогнозирования, как создаются и оптимизируются модели для обработки информации. Особое внимание стоит уделить темам современных подходов к обучению нейросетей, улучшения точности моделей и повышения производительности систем с использованием разных методов. Кроме того, важно попрактиковаться в написании кода на языках программирования Pascal, C, C++, C#, Java, Python. Работать на олимпиаде можно будет с любым из них.
Как работать с демоверсией? Одни из разработчиков заданий, преподаватели ИТМО Антон Гаврилов и Анна Авдюшина советуют внимательно читать условия заданий и при его выполнении учитывать все указанные ограничения. Например, по времени работы программы. Кроме того, в условиях заданий приведены форматы входных и выходных данных, которые должны соблюдаться в ответе. Зачастую именно из-за несоответствия формату даже верные ответы не засчитывают.
Как отмечает Антон Гаврилов, к каждому заданию прилагается набор тестов, с помощью которых проверяется корректность работы программы. Если программа не прошла тесты, участник может исправить код и загрузить его заново.
Полезные ресурсы для подготовки. Для повтора теории по ИИ подойдет книга «Deep Learning» Иэна Гудфеллоу, а практические задачи по этой теме можно решать на Kaggle. Ответы на вопросы по библиотекам и алгоритмам можно найти в документации TensorFlow и PyTorch. Для отработки практических навыков будут полезны Scikit-learn и платформы по типу LeetCode. А для тренировки написания кода рекомендуется присмотреться к сервисам Codewars и LeetCode.
Как подготовиться к треку «Искусственный интеллект»
Какие задания будут? Испытание отборочного тура этого трека — классический тест из 30 вопросов. Они составлены по такими темам, как Python, ML, NLP, Computer Vision, DL, Dev Tools, статистика, теория вероятностей, Computer Science и базы данных.
В финале конкурсантам необходимо решить ML-задачу. В прошлом году участникам предстояло расклассифицировать сообщения пользователей чат-бота онлайн-банка по пяти категориям. Для этого были даны входные данные, разделенные на несколько выборок. В ответе необходимо было предоставить файл test.csv с заполненными значениями классов для каждого обращения и ссылку на Jupyter Notebook, содержащий весь программный код, использованный для решения задачи, включая предобработку данных, обучение модели и ее оценку. Жюри оценивала качество и оформление кода, а также главную метрику — F1 macro.
Организатор трека, преподаватель ИТМО Инна Карамова советует перед началом выполнения финального задания убедиться, что вы скачали инструкцию пошагового решения задачи на компьютер и четко следуете формату оформления. Не стремитесь сразу переходить к подбору алгоритма, а сначала изучите данные и поработайте с ними — при плохом качестве данных построить результативную модель будет сложно.
Какие темы повторить? Для финального испытания стоит ознакомиться с базовыми подходами решения ML-задач. Организатор советует обратить особое внимание на работу с табличными данными, задачами текста NLP и картинками computer vision — какие методы стоит применять в разных случаях и какие метрики могут помочь оценить качество выполнения алгоритма.
Стоит отточить и навыки работы с данными: уметь предобрабатывать их, очищать, находить ненужные и преобразовывать. Не обходите стороной и базу — повторите ключевые команды работы над проектами в Git для Dev tools, ключевые архитектуры современного DL для темы DL, базовые понятия и подходы CV для Computer Vision. Также присмотритесь к последним новинкам рынка ИИ — тому, что используют в исследованиях и для решения прикладных задач.
Как работать с демоверсией? Следует внимательно прорешать все задания демоверсии и выделить наиболее сложные для себя, чтобы сделать акцент при повторении тем именно на эти проблемы. При возникновении вопросов можно написать организаторам олимпиады на почту, указанную на сайте.
Полезные ресурсы для подготовки. Можно обращаться к материалам любого формата, главное, чтобы их было комфортно изучать вам. Организатор рекомендует хендбуки от Яндекса и канал StatQuest with Josh Starmer. Еще один совет: рассмотрите каждую из указанных тем с точки зрения разработчика ML-системы и подумайте, что необходимо знать для их решения. Составьте план повторения или изучения тем. Для его создания также можно использовать LLM-модели для дополнительной тренировки.
Как подготовиться к треку «Аналитика данных»
Какие задания будут? Трек «Аналитика данных» включает два раздела: машинное обучение и работа с системами управления базами данных (СУБД). В первом разделе необходимо решить задачи по машинному обучению. Здесь пригодятся знания в области обработки и анализа данных, а также навыки построения моделей машинного обучения. В разделе по СУБД участникам предстоит писать запросы к демонстрационным базам ИТМО. Доступ к СУБД PostgreSQL (версия 15) будет предоставлен через графическую оболочку PG Admin.
Организаторы трека, преподаватели ИТМО Дмитрий Волчек, Наталья Графеева и Мария Токман обращают внимание, что на заключительном этапе будет оцениваться в первую очередь решение, а не ответ. Предпочтение отдается тем участникам, кто решил задание более эффективным способом.
Какие темы повторить? Чтобы справиться с заданиями по машинному обучению, рекомендуется отточить несколько навыков.
- Работа с библиотеками для анализа данных, такими как Pandas и Numpy. Нужно уметь корректно загружать данные, объединять таблицы, обрабатывать пропущенные значения и проводить предварительный анализ данных.
- Использование библиотеки Scikit-learn для инженерии признаков и правильной подготовки набора данных для обучения и тестирования модели. Важно уметь применять методы нормировки данных, уменьшать размерность данных, корректно разбивать данные на обучающую и тестовую выборки.
- Использование библиотеки Scikit-learn для построения и обучения моделей машинного обучения (регрессия, классификация). Нужно знать области применимости моделей и их ограничения, предположения моделей, оценивать качество моделей регрессии и классификации, используя метрики, такие как R², MAE, Accuracy, F1 Score и другие, понимать, как интерпретировать результаты.
Для успешного выполнения задач по СУБД повторите следующие темы: различные типы данных, включая date и timestamp, работа с текстовыми данными, в том числе использование регулярных выражений для обработки строк, и использование диапазонов и мульти-диапазонов.
Организаторы также советуют уже сейчас зарегистрироваться или проверить доступ к своему аккаунту на платформе Kaggle, чтобы быть готовым к финальному испытанию.
Как работать с демоверсией? Главное в подготовке к олимпиаде — практиковаться, тестировать решения и использовать доступные ресурсы для углубления знаний.
В демоверсии в блоке заданий по машинному обучению представлено соревнование на Kaggle — финальная задача одного из прошлых сезонов. Участникам необходимо спрогнозировать стоимость квартиры с помощью методов машинного обучения. Свое решение этого задания можно проверить, сопоставив с реальными данными и результатами других конкурсантов в разделе Leaderboard. Особое внимание следует уделить формату отправляемых на проверку предсказаний.
В работе с демоверсией заданий по СУБД стоит придерживаться структурированного подхода: изучить формат задач, настроить доступ к СУБД и решать пошагово, выявляя свои слабые места и отрабатывая навыки SQL. Среди основных ошибок участников прошлых лет организаторы выделяют: неверное понимание структуры таблиц, пропущенные связи между ними или игнорирование условий задачи, недостаточное тестирование запросов на разных наборах данных, невнимательное прочтение условий заданий и требований к вводу полученных ответов.
Полезные ресурсы для подготовки. Полезно заглянуть на ресурс «MachineLearning» и послушать записи лекций и семинаров от преподавателей вузов на видеохостингах.
Для успешного выполнения заданий по СУБД организаторы советуют ознакомиться со следующими материалами:
- Е. П. Моргунов PostgreSQL. Основы языка SQL ;
- Б. А. Новиков, Е. А. Горшкова, Н. Г. Графеева PostgreSQL. Основы технологий баз данных;
- документация PostgreSQL. Раздел 9.7. Поиск по шаблону;
- документация PostgreSQL. Раздел 3.5. Оконные функции;
- документация PostgreSQL. Раздел 9.20. Диапазонные/мультидиапазонные функции и операторы.
Как подготовиться к треку «Физика»
Какие задания будут? В этом сезоне трек «Физика» будет разделен на два направления: фундаментальное и прикладное.
На «Фундаментальной физике» вас ждут вопросы по темам общих разделов этой науки: от классической механики до квантовой. Причем задачи будут схожи с теми, что проходят на первых курсах университета. Однако уровень их сложности будет не базовым.
На направлении «Прикладная физика» предстоит решить задачи, в которых описаны реальные процессы, связанные с лазерными технологиями. Например, удаление кожных новообразований, плавление или очистка металла.
Какие темы повторить? Для подготовки необходимо повторить все темы из общей физики: вспомнить основные формулы, заглянуть в методические пособия по лабораторным работам. Особе внимание стоит обратить на разделы оптики и квантовой механики — по статистике, они чаще всего вызывают трудности, а задачи по этим разделам есть в обоих направлениях. Если вы выберете прикладной трек, также не забудьте актуализировать знаниями по теме лазерных технологий: режимы работы, основные характеристики и взаимодействие лазерного излучения с веществом.
Как работать с демоверсией? Как отмечает организатор-модератор трека, менеджер по работе с абитуриентами Нового физтеха ИТМО Дмитрий Быков, в прошлом сезоне меньше всего правильных ответов было по разделам термодинамики и оптики — в демоверсии уделите этим задачам больше внимания.
Полезные ресурсы для подготовки. Для подготовки к заданиям теоретического раздела составители задач фундаментального трека рекомендуют следующие учебники: «Общий курс физики. В 5 т.» Д. В. Сивухин (2005 г.), «Курс физики в 5-ти томах» А. Н. Матвеев (1983 г.) и «Курс общей физики: учебное пособие для вузов: в 5 томах» И. В. Савельев (2022 г.).
Для отработки навыков решения задач подойдут «Задачи по общей физике. Учебное пособие для вузов» И. Е. Иродов (2012 г.) и «Сборник задач по общему курсу физики» А. В. Овчинкина (2009 г.).
К прикладному треку помогут подготовиться такие учебники по теории, как «Взаимодействие лазерного излучения с веществом. Силовая оптика» В. П. Вейко, М. Н. Либенсон, Г. Г. Червяков (2008 г.) и «Физические основы применения лазеров в медицине. Учебное пособие» E. A. Шахно (2012 г.). А порешать задачки можно в пособиях «Лазерные технологии в задачах и примерах: Учебное пособие» В. П. Вейко, Е. А. Шахно (2014 г.) и «Задачи по общей физике: учебное пособие для вузов» И. Е. Иродов (2020 г.).