Зачем учиться анализировать культурные данные
Если сотню лет назад у исследователей под рукой были десятки, сотни, в лучшем случае тысячи книг, то сегодня речь идет о миллионах источников информации. А если добавить сюда информацию социальных медиа, получится огромный массив данных, которые просто невозможно проанализировать вручную.
С увеличением количества данных, в том числе культурологических, появлением новых проектов и задач в этой сфере аналитики данных становятся все более востребованными специалистами на рынке. Среди перспективных областей для применения их компетенций — R&D отделы крупных IT-компаний, интернет-маркетинг и цифровая реклама, телекоммуникации, социальные сети, новые медиа, медиакомпании, а также музеи и другие культурные институции, которые сегодня тоже начинают видеть необходимость в сборе и анализе данных, а также специалистах, способных их интерпретировать и эффективно применять.
Активно развивается направление Digital Humanities, в рамках которого интердисциплинарные команды, состоящие из экспертов в области гуманитарных дисциплин и IT-специалистов, анализируют тексты, создают корпуса языков, строят по письмам и дневникам социальные сети великих поэтов, конструируют 3D-модели Древнего Рима, автоматически превращают в изображения тексты голливудских сценариев и выполняют сотни других проектов.
Таких специалистов, способных работать в интердисциплинарных командах, будут готовить на новой программе «Анализ культурных данных и визуализация» / Data, Culture and Visualization. Она разработана исследователями из международной научной лаборатории «Цифровые гуманитарные исследования» (DHLab) и лаборатории машинного обучения МНЛ «Компьютерные технологии».
Ключевые особенности программы
В процессе обучения на программе студенты смогут охватить этапы работы с культурными данными на протяжении всего жизненного цикла: от сбора и хранения до статистического анализа, интерпретации, визуализации и их дистрибуции.
Как подчеркивает Антонина Пучковская, руководитель DHlab и руководитель программы, ее главная особенность в том, что она имеет ярко выраженную интердисциплинарную направленность и поможет приобрести дополнительные компетенции как специалистам в гуманитарной сфере, так и IT-специалистам.
«В России есть программы в сфере Digital Humanities, однако их особенность в том, что они нацелены только на гуманитариев. Там их учат методам и алгоритмам, чтобы они умели анализировать данные. Наша программа преследует другую цель — объединить в одной группе гуманитариев и технарей, попробовать столкнуть два мировоззрения и сделать по-настоящему интердисциплинарную программу, — говорит она. — С одной стороны, мы повышаем стоимость и востребованность специалистов в гуманитарных дисциплинах на рынке труда, потому что даем им пул компетенций, которые необходимы сейчас. А с другой — помогаем расширить круг компетенций IT-специалистам, чтобы они выходили из университета не просто аналитиками данных или инженерами, заточенными под узкие задачи, а понимали весь процесс: от сбора данных и аналитики до подготовки продукта и презентации его заказчику».
Как будет строиться обучение
Обучение будет вестись на английском языке, программе уже присвоен статус МОП (международная образовательная программа). Однако есть возможность пройти отдельные треки и на русском. Помимо общеобразовательных (soft skills, дизайн-мышление, английский язык), программа будет включать ряд профильных дисциплин, посвященных дизайну данных, методам визуализации, картированию, майнингу культурных данных и методам их анализа, этике науки и технологии.
Всего в рамках программы в зависимости от предпочтений и желаемой траектории развития студента предусмотрено три трека:
1) трек для специалистов в гуманитарных областях.
В рамках этого трека они смогут изучить основы анализа данных: что вообще можно считать данными, какие методы необходимо использовать для сбора данных, их структурирования и последующего анализа. Кроме того, они смогут получить понимание о полноценной работе с данными, а также научатся правильно ставить задачи IT-специалистам для последующей эффективной работы в команде.
2) трек «Аналитика культурных данных»
Как отмечает Андрей Фильченков, руководитель лаборатории машинного обучения МНЛ «Компьютерные технологии» Университета ИТМО, в рамках этого трека студенты научатся работать с информационным поиском, рекомендательными системами, машинным обучением. При этом этот трек можно пройти на русском языке. В этом треке реализуется баланс между гуманитарными и техническим началами.
3) трек «Машинное обучение»
Трек направлен на получение глубоких знаний в области анализа данных, в том числе методов глубокого обучения, анализа текстов на естественном языке и социальных сетей.
«Этот трек ориентирован на студентов с техническим бэкграундом, которым интересно заниматься анализом данных гуманитарной природы, например, текстов или профилей в социальных сетях. Студенты научатся находить решения к аналитическим задачам с помощью современных методов data science», — говорит Андрей Фильченков.
Эксперты и партнеры программы
Как отмечает Антонина Пучковская, программа будет реализовываться в сотрудничестве с индустриальными партнерами — компаниями и различными культурными институциями (музеями, театрами, выставочными пространствами), которые и формируют спрос на специалистов такого профиля. Стратегическими партнерами программы является компания Huawei, Европейский Университет, а также ряд музеев Петербурга, среди которых «Государственный музей городской скульптуры Санкт-Петербурга» и «Музей истории религии». Кроме того, разработчики программы сотрудничают с лабораторией новых медиа при Александринском театре.
«В ближайшие 20 лет ожидается невероятный рост объемов данных и развитие технологий их передачи. Сегодня лучший ресурс — это данные, а не нефть. Поэтому те, кто владеет данными и может их анализировать, победит в технологическом соревновании. Когда вы знаете механизм, лежащий в основе создания данных, вы можете почувствовать, как они преобразуют технологии, отрасль и стиль вашей повседневной жизни. Магистерская программа Data, Culture and Visualization, определенно, может помочь студентам овладеть такими обязательными навыками работы с данными, в том числе всем, что касается их анализа и использования», — отмечает Джейсон Зенг, глава Санкт-Петербургского офиса компании Huawei.
В обучении студентов программы будут задействованы и международные эксперты — представители американского сообщества Digital Humanities. В частности, одним из преподавателей программы станет доцент Нью-Йоркского университета и соруководитель DHlab Кимон Керамидас (интервью с экспертом можно почитать здесь).
Кроме того, разработчикам программы уже удалось наладить партнерство со специалистами Принстонского университета (США), Университета Чикаго (США), Университетом Гринвича и Университетом Волвергемптона (Великобритания).
«Я очень рад видеть, что в Университете ИТМО растет интерес к области Digital Humanities, и рад быть причастным к созданию новой магистерской программы в этой сфере. Мы живем в то время, когда чрезвычайно важно понять, как технологии влияют на нашу повседневную жизнь. В этих условиях необходимо, чтобы у нас были учебные курсы, которые позволяют студентам научиться исследовать эти технологии, создавать новые способы анализа данных, а также разработать методы для их визуального представления. Благодаря своей истории, экспертизе и обширному опыту в области технических наук, а также расположению в Петербурге, который имеет богатое историческое и культурное наследие, Университет ИТМО становится уникальным местом для такой работы», — говорит Кимон Керамидас, доцент Нью-Йоркского университета наук и искусств, соруководитель лаборатории Digital Humanities Университета ИТМО.
«Новая магистерская программа MA Data, Culture, Visualization имеет все шансы перевернуть представление о высшем образовании в России. На мой взгляд, это одна из самых смелых и инновационных программ на сегодняшний день. Она сочетает в себе как обучение конкретным навыкам и инструментам для обработки больших данных — а это навыки, без которых сложно будет представить себе любую профессию будущего, — так и возможность переосмыслить использование этих данных в контексте эпохи post-digital и культуры в целом», — комментирует Мария Королькова, DPhil, старший преподаватель Школы дизайна Гринвичского университета (Великобритания).
Над какими проектами можно поработать
Помимо фундаментальной подготовки, обучение на программе предполагает проектную работу. Сотрудничество с индустрией позволяет студентам работать над реальными кейсами, которые поступают напрямую из компаний. Обучающиеся могут прийти со своим проектом, выбрать проект индустриального партнера (компании или музея), присоединиться к команде проектов, которые реализуются специалистами DHlab (подробнее об этих проектах можно почитать здесь и здесь), либо поработать в составе проекта, которые реализуются международными экспертами программы.
«Выбор проектов действительно широк: очень много кейсов предлагают нам наши партнеры — культурные институции и индустрия. И это актуальные и реальные, а не теоретические задачи, результаты которых можно положить в стол. Какие-то проекты будут поступать и от наших зарубежных партнеров. Например, у Кимона Керамидаса реализуется интересный проект с Эрмитажем по согдийской культуре. Он уже работает в рамках этого проекта со своими студентами в Нью-Йорке и готов привлекать новых ребят. И наконец, мы регулярно подаемся на гранты — РНФ, РФФИ, поэтому будут и другие проекты, в которые могут включаться наши студенты», — рассказывает Антонина Пучковская.
Она добавляет, что у студентов будет также возможность реализовать проекты в коллаборации с другими лабораториями Университета ИТМО. Особенно это актуально, если задача требует включения компонентов AR и VR. Используя технические возможности университета, студенты смогут довести проекты как минимум до стадии прототипирования, защитить на их основе магистерскую диссертацию, а в перспективе — с этой основой выходить уже на реальный продукт, уточняет руководитель программы.
Кроме того, магистранты смогут пройти научную практику в международной научной лаборатории Цифровых гуманитарных исследований, Лаборатории машинного обучения, а также других лабораториях Университета ИТМО, партнерских компаниях и вузах.
Кем и где можно работать после окончания программы
Программа предлагает несколько траекторий развития. Во-первых, успешно прошедшие обучение будут востребованы в академическом и исследовательском секторе. После окончания магистратуры они смогут продолжить обучение в аспирантуре и развить уже имеющийся исследовательский проект либо реализовать новый.
Во-вторых, компетенции выпускников программы — как специалистов в гуманитарных дисциплинах, так и IT-специалистов с сильной подготовкой в области машинного обучения и анализа данных — будут востребованы в индустрии.
Первые могут работать как аналитики и продакт-менеджеры в сфере аналитики, управлении метриками и взаимоотношениями с клиентами, цифровой рекламе, исследованиях социальных сетей и рынка в маркетинге, а также в области управления культурным наследием и других творческих отраслях.
Вторые будут претендовать на должности data scientist’ов (именно так специальность называется на рынке труда), а также специалистов в области анализа данных, участвовать в проектах, связанных с автоматической обработкой речи, изображений.
Как поступить на программу
Проще всего поступить на программу благодаря конкурсу «Портфолио» Университета ИТМО. Помимо своего бэкграунда и результатов работы за прошлые годы, в портфолио необходимо отразить успешные примеры реализации проектов или участия в них, указать, с какими данными вам хотелось бы работать в дальнейшем и в каких областях и проектах развивать свои компетенции. Заявки на конкурс портфолио принимаются до 9 июня (включительно).
Кроме того, без экзаменов на программу можно поступить благодаря конкурсу докладов «Конгресс молодых ученых», а также победе во Всероссийской олимпиаде студентов «Я — профессионал» (опция доступна для медалистов и победителей в треках: дизайн; филология; журналистика; социология; большие данные; искусственный интеллект; программирование и информационные технологии).