Сегодня миллионы людей по всему миру получают новые знания онлайн, в формате МООС (Massive open online courses). Массовые онлайн-курсы стали одним из наиболее удобных способов дистанционного образования, интерактивного и доступного каждому, кто имеет доступ к сети Интернет.

Открытая платформа Open EdX – одна из наиболее популярных платформ для размещения MOOC. Сейчас здесь можно встретить огромное количество разнообразных образовательных программ, предложенных различными учебными заведениями. Именно эти курсы составляют ядро образовательных материалов. Однако до недавнего времени между курсами не были установлены связи, которые помогли бы пользователю переходить от одного курса к другому, «путешествуя», таким образом, по смежным научным областям, чтобы получить комплексный пакет знаний.

Подобный подход к обучению хорош тем, что пользователю не нужно специально ничего искать самостоятельно: создатели курса упаковывают все необходимые данные в курс сами. Однако это не совсем удобно, если необходимо быстро найти ответ на конкретный вопрос. Именно над этой проблемой и работали ученые Университета ИТМО.

Для решения задачи аспиранты Университета ИТМО создали систему агрегации образовательного контента на основе семантических технологий под названием ECOLE. Система имела достаточно большое количество интересных решений, однако изначально не учитывала современные тренды в области MOOC.

«Проблема заключалась в том, что система работала изначально сама по себе, без привязки к платформе Open EdX или любой другой. Сейчас эта платформа стала очень распространенной, ей пользуется огромное количество пользователей Интернета, поэтому мы решили продолжить работу в этом направлении», – рассказал Дмитрий Волчек, аспирант кафедры информатики и прикладной математики Университета ИТМО.

Идея дальнейшей работы строилась вокруг решения задачи семантического представления образовательного контента МООС. В результате совместной работы сотрудников лаборатории ISST и специалиста из Яндекса ученым удалось создать онтологическую модель, описывающую все аспекты MOOC, сценарии их использования, участников процесса и так далее, а также выполнить программную реализацию в виде компонента, устанавливаемого в систему «из коробки».

«Речь идет о достаточно простом механизме установки для тех, кто использует систему Open EdX, которая расширяется при помощи такого понятия как Xblock – дополнительной сторонней разработки, которую несложно подключить к системе.  Ее используют приблизительно так же, как и любые другие программы, которые мы привыкли устанавливать у себя на компьютерах. Достаточно написать несколько строк кода на сервере, и произойдет установка», – поделился Дмитрий Волчек.

Благодаря такому решению разработчики смогли внедрить семантические технологии в образовательный процесс. Цель использования семантических технологий – выявить междисциплинарные связи между публикуемыми на платформе курсами. С помощью найденного решения пользователи могут увидеть, используется ли образовательный контент повторно в других курсах.

Прелесть семантических технологий в том, что с их помощью можно представить данные в удобочитаемом виде как для людей, так и для машин. Идея разработчиков в данном случае – разобрать онлайн-курсы и весь контент, который в них есть, для того, чтобы структурировать его согласно разработанной онтологии. Другими словами, ученые показывают, что чем является в курсе и какая часть курса за что отвечает: где основная глава, где подглавы, где видеолекции, а где текстовый контент, практические задания и так далее.

«С точки зрения алгоритмов NLP мы используем следующий механизм: берем текстовый контент из содержания курса (у видеолекций это субтитры) и из них при помощи алгоритмов выделяем ключевые слова – так называемые “концепты предметной области”. Эти концепты мы размечаем на подготовленной онтологии.  Таким образом, мы получаем смысловые единицы содержания в каждом курсе, при помощи которых мы можем связывать далее различные курсы по различным тематикам и различным предметным областям между собой, отслеживать, где у нас в курсе использованы те или иные концепты, где они использованы в других курсах, достаточно ли их. Также мы следим за качеством публикуемого образовательного контента: например, смотрим, достаточно ли в теоретических материалах освещены нужные сведения для того, чтобы слушатель курса смог проходить потом тесты, то есть смотрим соответствие этих концептов в тестах и в теоретических материалах», – рассказал Дмитрий Волчек.

Представьте, что вы проходите курс по математике и в ходе обучения встречаете неизвестное  понятие, например, «конвергенция». Теперь вы сможете просмотреть, где еще используется понятие «конвергенция», в каких других курсах или в каких предметных областях. Однако есть разделение по выявлению системой связей между образовательным контентом для создателей курсов и для обучающихся. Так,  у создателей курсов появляется доступ к ссылкам, где они могут просмотреть, в каких тестах используется тот же самый концепт, который они используют в своем курсе, и таким образом они могут рекомендовать своим студентам курсы из смежных областей.

«В первую очередь решалась задача адаптации разработки под существующую платформу Open EdX , которая сама по себе объемна и достаточно велика,  включает множество технологий, как серверных, так и технических, с точки зрения программирования решений. Вторая задача, над решением которой мы активно работали, – внедрение семантических технологий в сферу образования.  Многие занимаются либо образованием, либо семантикой, а наша разработка находится на стыке областей», – рассказал Дмитрий Волчек.

На данном этапе система находится в стадии разработки, сейчас ученые  ее тестируют. Первые результаты были представлены на конференции Open EdX Conference 2017, где ученые получили множество положительных отзывов.

В дальнейшем разработчикам предстоит углубиться в индивидуализацию построения образовательных траекторий, то есть отследить действия пользователей в системе, чтобы наилучшим образом адаптировать ее под требования конкретного человека.