Конференция «Молодые ученые» традиционно проходит на базе европейских технических университетов. В прошлом году площадкой мероприятия стал Афинский политехнический университет, а в этом — Научно-технический университет AGH в Кракове; соорганизаторами мероприятия выступили Университет ИТМО и Университет Амстердама. Как отмечает инженер НИИ наукоемких компьютерных технологий Университета ИТМО Марина Балахонцева, конференция молодых ученых нацелена на развитие диалога между настоящим и будущим вычислительной науки.
«Основная задача, стоящая перед нами как перед организаторами конференции, — это вовлечение молодых ученых в международную коллаборацию в области вычислительных наук, а также публикация статей участников в индексируемых изданиях. На этапе приема научных работ нами были обработаны 65 статей. Поскольку тематика конференции в этом году получилась достаточно обширной (от моделирования сложных систем и разработки численных алгоритмов до систем поддержки принятия решений в задачах урбанистики и биомедицины), то и задача подбора рецензентов оказалась нетривиальной. В итоге на каждую работу было получено от 2 до 4 рецензий, по результатам которых в список для публикации попали 43 статьи», — комментирует Марина Балахонцева.
В число тем, которые обсуждались на мероприятии, вошли моделирование и симуляция сложных систем (например, наводнений, промышленных сооружений), продвинутые вычислительные алгоритмы, приложения для решения проблем окружающей среды, технологии для Интернета, визуализация и виртуальная реальность, трансляционная медицина и биомедицина, вычисления для решения городских проблем. От Университета ИТМО с докладами выступили девять человек, и мы попросили некоторых из них рассказать о сути своих исследований и об их прикладных значениях.
Николай Никитин, аспирант кафедры высокопроизводительных вычислений
В Петербурге с момента основания существует высокий риск наводнений. Чтобы понять, как они происходят и к каким последствиям могут привести их разные типы, мы моделируем искусственные циклоны. Для симуляции циклона мы разработали специальный алгоритм, а само моделирование выполняется с помощью комплекса готовых моделей моря и волн.
Также мы воспроизводим последствия, которые вызывают эти циклоны на Балтийском море, Финском заливе, в самом городе. Для этого мы проанализировали статистику по уровню воды, параметрам циклонов и наводнений в Балтийском море за последние 50 лет. Алгоритм на основе этих данных может показать, каким именно будет поведение Балтийского моря в зависимости от параметров циклона. Например, мы сымитировали параметры шторма Святой Иуда, который реально прошел по северу Европы в 2013 году, и в итоге получили практически тот же уровень воды в Финском заливе, что и был во время урагана.
Некоторые научные группы из других стран ведут аналогичные разработки, но они, в основном, применяются для тропических циклонов. На Балтийском море не так много городов, которым такие исследования были бы полезны. Но благодаря нашим алгоритмам можно узнать, что в экстремальной ситуации может случиться с Петербургом.
Анастасия Функнер, сотрудник НИИ наукоемких компьютерных технологий
Я работаю в исследовательской группе «Трансляционная медицина» в сотрудничестве с медицинским центром имени Алмазова, и мое исследование заключается в предсказании времени до операции стентирования с использованием машинного обучения. То есть я пытаюсь вычислить, сколько времени пациент проведет в больнице в ожидании операции. Это нужно для того, чтобы выявить проблемы в процедурах приема пациентов и повысить эффективность работы центра.
Мы проанализировали данные 500 пациентов, которые делали в центре Алмазова плановую операцию. Это значит, что они должны быть полностью готовы к операции. Но оказалось, что и плановые пациенты могут проводить долгое время в больнице: все равно образуются очереди, некоторые пациенты повторно сдают анализы. Сначала мы пытались получить предоперационное время для всех пациентов, но потом разделили их на три класса, чтобы увеличить точность предсказания.
Елизавета Луценко, студентка магистратуры кафедры интеллектуальных технологий в гуманитарной сфере
Я занимаюсь моделированием так называемой конформационной подвижности белков с несколькими цепочками. Исследования подвижности белка необходимы, чтобы выявить его функцию. Это нужно как с теоретической, так и с прикладной точки зрения: эти сведения затем используются при разработке лекарств и вакцин, помогают определить их побочные эффекты.
В международной лаборатории «Структурная биоинформатика» был разработан алгоритм для моделирования движения белков с одной полипептидной цепью, потом было решено его расширить, чтобы алгоритм работал для белков с произвольным количеством цепочек. Многоцепочечные белки представляют особый интерес для изучения ионных каналов, белок-белковых комплексов и антител. Мы используем крупнозернистую модель, то есть учитываем только геометрическую структуру молекулы и упрощаем ее представление для моделирования. Это позволяет уменьшить вычислительную сложность.
Основная проблема заключается в самопересечении цепочек внутри белков. Существует несколько подходов для того, чтобы ее решить, и наиболее эффективный основан на добавлении виртуальных связей между самыми стабильными атомами всех цепочек. В большинстве рассмотренных белков самопересечения отсутствуют. Сравнительный анализ с наиболее эффективными аналогами (MinActionPath и MENM) показал, что предложенный метод меньше нарушает геометрическую структуру молекул.
Иван Сметанников, аспирант кафедры компьютерных технологий
Моя работа посвящена алгоритмам выбора признаков в машинном обучении, который является одним из основных шагов при предобработке данных. Эти алгоритмы позволяют убрать из наборов данных ненужные атрибуты, повышая качество работы для последующего применения алгоритмов машинного обучения. Самыми быстрыми среди алгоритмов выбора признаков являются алгоритмы фильтрации — при работе они используют заранее выбранную математическую метрику для оценки качества атрибутов, позволяя оценивать десятки тысяч атрибутов за очень короткое время.
В своей работе я предложил алгоритм, позволяющий связывать несколько математических метрик в одну, которая повышает качество работы алгоритма машинного обучения сильнее, чем любая из изначально предложенных. Этот метод подходит для предобработки относительно больших данных, когда число атрибутов достигает нескольких десятков тысяч и более. Например, его можно использовать при работе с ДНК-микрочипами и выявлять наличие или отсутствие у пациента раковых заболеваний. Сейчас я работаю над улучшением производительности своего метода, а затем планирую опробовать на актуальных медицинских данных.
Яна Мазур, студентка магистратуры кафедры прикладной и компьютерной оптики
Я занимаюсь моделированием фриформ-поверхностей для осветительной оптики. Сейчас написан алгоритм, а потом будет еще и приложение, которое позволяет синтезировать оптические фриформы, формирующие необходимую диаграмму направленности. Алгоритм сам выбирает необходимые форму и материал фриформ-элемента под заданные пользователем параметры, основные из них — тип источника излучения и заданная диаграмма направленности.
Такие разработки актуальны по всему миру, с помощью фриформ-поверхностей реализуют осветители для автомобилей, для хирургических инструментов, концентраторов света. В мире многие научные группы занимаются проектированием фриформ-оптики, но в России мы являемся одними из первых разработчиков таких систем. Математическое моделирование для создания фриформ я провожу в пакете программ MatLab.