Главная цель стипендиальной программы — поддержать разработку продуктовых проектов магистрантов первого курса ПИШ ИТМО. Конкурс длится в течение года и состоит из пяти этапов. Сначала студенты рассказывают, какой продукт они хотят разработать, затем доказывают состоятельность своей концепции — проще говоря, объясняют, почему их продукт точно найдет место на рынке. После этого им предстоит показать прототип, первую и финальную версию MVP. Присоединиться к программе можно как индивидуально, так и в составе группы. Участвовать можно на любом этапе, так как для каждого из участников конкурса стипендии согласуются отдельно.
Прочитайте также:
Команда ИТМО защитила проект Передовой инженерной школы
Правительство РФ: В ИТМО будет создана передовая инженерная школа
Завершен первый набор студентов передовой инженерной школы ИТМО
По итогам первого конкурса, который состоялся с 25 по 30 сентября, двадцать победителей первой степени выиграли стипендию в размере 30 тысяч рублей в месяц, а шесть победителей второй степени — 10 тысяч рублей в месяц. Мы узнали у нескольких победителей конкурса, над какими проектами они работают и как они планируют их развивать.
Иван Дубровский
магистрант первого курса Передовой инженерной школы
Работает над предсказательной системой морфологии наноматериалов, получаемых методами растворной химии
— Сейчас создавать наноматериалы с определенными свойствами довольно трудно. Сначала ученые проводят большое количество синтезов, а затем анализируют наноматериалы разными методами, например ― с помощью сканирующего электронного микроскопа (СЭМ). Но такой подход не гарантирует, что синтезированные материалы будут обладать нужными свойствами. В результате исследователям приходится заново проводить процесс синтеза и анализа, пока они не придут к подходящему результату.
Мой проект призван облегчить создание наноматериалов с определенными свойствами. Сейчас я разрабатываю систему, которая будет генерировать изображения, аналогичные данным с СЭМ. По этим изображениям можно будет получать информацию о размере, форме и морфологии наночастиц. При этом для работы системы необходимо будет лишь ввести информацию о методике синтеза наноматериала, например, из текста научных публикаций, а алгоритмы обработки естественного языка структурируют ее. Затем система генерации изображений переведет структурированную информацию о синтезе наночастиц в СЭМ-изображение. Если результат не подойдет ученому, он может просто сгенерировать новое изображение на основе информации о другом синтезе или же изменить методику существующего.
Это амбициозный и сложный проект, поэтому я его и выбрал. Мне хотелось серьезно окунуться в эту область и попробовать сделать что-то, что сможет изменить наше представление о подходах к созданию новых материалов. Моя разработка позволит снизить объем рутинной работы при синтезе наноматериалов с нужными нам свойствами. Это важно, ведь именно разные свойства (например, размер и форма наночастиц) часто определяют разные физико-химические характеристики наноматериала. Каталитическая активность важна в промышленности, а токсичность — в медицине. Но моя система также пригодится и в других областях — агрономии, экологии, электронике и многих других.
Сейчас я уже завершил часть, связанную с обработкой естественного языка, и работаю над созданием алгоритма генерации изображений. Проект требует достаточно серьезных вычислительных мощностей, поэтому полученную стипендию я планирую потратить на улучшение комплектующих моего компьютера. Это поможет мне более комфортно и быстро разрабатывать модели.
Кристина Желтова
магистрантка первого курса Передовой инженерной школы
Разрабатывает минималистичный фреймворк автоматического развертывания моделей машинного обучения DeployMe
— Общаясь со специалистами по данным, мы обнаружили в их работе несколько моментов, которые можно автоматизировать, чтобы получать эффективные результаты. Например, чтобы решать реальные задачи компании, среднестатистический ML-специалист тратит много времени на внедрение уже обученной модели машинного обучения в производство. Согласно отчету Algorithmia, на эту задачу у более чем половины опрошенных компаний уходит от 8 до 90 дней. Мы с другим магистрантом ПИШ Константином Темплиным считаем, что это время можно потратить на более полезные процессы, поэтому решили создать инструмент для автоматизации развертывания моделей машинного обучения.
Если раньше ML-разработчики вручную довольно долго писали и отлаживали определенное количество кода, то сейчас вместо этого, имея обученную модель, можно просто установить наш инструмент и вызвать функцию одной строкой с заданными параметрами. Таким инструментом могут пользоваться специалисты по данным, у которых нет большого опыта в разработке ML-решений полного цикла, чтобы решать задачи в разных сферах, например на хакатонах.
По сравнению с конкурентами у нашего решения есть несколько преимуществ. Оно более гибкое, может быстро оборачивать модели в сервис или в Docker-контейнер. Также оно поддерживает несколько инструментов для ML-специалистов — Scikit-Learn, LightAutoML и XGBoost.
Сейчас проект находится на стадии активной разработки. В будущем мы планируем создать руководство для разработчиков, рассказать об инструменте на открытых площадках, например ODS, Habr и Medium, и проработать стратегию монетизации.
Дарья Воронкина
магистрантка первого курса Передовой инженерной школы
Разрабатывает сервис для анализа геномных данных Deeploid
— Deeploid meta ― проект по анализу метагенома. Знаете ли вы, что в человеческом организме более 100 триллионов бактерий, а бактерий в почве и нефти — еще больше? Ученые доказали, что бактерии могут влиять на пищеварение, интеллект, здоровье кожи и зубов, а также плодородность почвы и качество нефти. Мы с другими магистрантами ПИШ Никитой Венедиктовым, Михаилом Гуревичем, Юрием Баландиным, а также магистрантками первого курса программы «Прикладная геномика» Маргаритой Ильиной и Валентиной Грушиной считаем, что с помощью управления метагеномом можно решать глобальные проблемы, и надеемся, что наш проект в этом поможет. Пока существующие базы данных не стандартизированы и сильно отличаются друг от друга. Мы же хотим сделать стандартизированную базу данных для метагенома и удобный UX/UI для пользователей. К тому же, наш продукт будет free for academic use — проще говоря, ученые смогут активно использовать его в своих исследовательских целях.
Мы хотим работать с ДНК, выделенными из объектов (кожи, слюны, кала, почвы, нефти), обрабатывать и анализировать состав микробиоты. Для этого планируем создать стандартизированную базу данных и реализовать интерфейс программирования приложений (API) и интерфейс командной строки (CLI) для доступа к ней. Мы считаем, что наш продукт позволит гораздо удобнее и быстрее узнавать всю необходимую информацию о микробиоте и его составе.
Сейчас мы уже перешли к этапу создания прототипа. В перспективе намерены привлечь инвестиции и в будущем развивать более детальный анализ метагенома.