Вы знаете, что МТС — это один из ключевых игроков на рынке телекоммуникаций, но на самом деле уже достаточно длительное время МТС – цифровая компания, которая развивает очень много направлений, связанных с искусственным интеллектом, анализом больших данных, облачными технологиями.
Чтобы развивать такие решения и помогать продуктам выходить на рынок, некоторое время назад в компании был создан Центр инноваций. Сейчас специалисты Центра работают с шестью ключевыми технологическими и продуктовыми направлениями. Среди них — облачные технологии, искусственный интеллект, eHealth, образование, киберспорт и акселератор MTS StartUp Hub.
Облачные технологии. У нас развивается направление, связанное с развертыванием облаков. Этот сервис предназначен как для внутреннего потребления, так и для внешних партнеров.
Почему в целом важно заниматься этим направлением? Сегодня существует ряд задач, которые связаны с определенными требованиями хранения, например, защищенных персональных данных. В этом случае должен быть обеспечен определенный уровень надежности и производительности таких сервисов. Наши ЦОД как раз позволяют предоставлять такую возможность клиентам.
eНealth. Это относительно недавно созданное направление, которое развивает такие технологии, как телемедицина, персонализированная медицина и связанные с этим сферы. В настоящее время в медицине одним из ключевых трендов является внедрение технологий обработки медицинских данных, аналитики, рекомендательных сервисов. Со всеми этими технологиями мы как раз и работаем в рамках большого направления eНealth.
Электронное образование. Безусловно, вы хорошо знакомы с такими известными МООС-платформами, как Coursera и другими аналогичными системами. Мы также занимаемся направлением, которое позволяет разворачивать электронные курсы, проводить обучение по разным направлениям — от изучения английского языка до знакомства с различными современными технологиями.
Киберспорт — это все, что связано с геймингом и кибериндустрией.
Акселератор MTS StartUp Hub является, образно говоря, точкой входа для молодых команд, стартапов, ученых, исследователей, которые обладают идеями и хотят развивать их вместе с индустриальным партнером.
И наконец искусственный интеллект. В рамках этого большого направления работает наше подразделение — функциональная группа AI.
Искусственный интеллект — это, безусловно, очень широкое понятие. Вы можете встретить множество определений — от классических до узкоспециальных. Для нас AI — это прежде всего набор технологий, подходов и практик, позволяющих вычислительным системам взаимодействовать с человеком на естественном языке, а также «понимать» окружающий мир, адаптируясь и накапливая новые знания.
Это важно, потому что наш клиент обладает эмоциями, он так или иначе взаимодействует с нами на естественном языке, будь то чат-бот система или голос. Поэтому мы придерживаемся этой парадигмы, развивая наши текущие и новые проекты.
Функциональная группа AI Центра инноваций МТС
Центр инноваций и входящая в него функциональная группа искусственного интеллекта объединяют разработчиков, программистов, математиков, лингвистов и специалистов по созданию продуктов. Главная цель — внедрять современные технологические решения, обеспечивающие принципиально новый уровень сервиса и услуг на естественном языке.
Мы развиваем компетенции в трех основных технологических направлениях AI — текст, голос и изображения с упором на три стратегически важные зоны бизнес-приложений МТС: внутренняя цифровизация, медицина и умные города.
Все, что мы делаем, мы в первую очередь тестируем на себе, на внутренних сервисах компании. Такой подход позволяет нам улучшать внутренние бизнес-процессы, оптимизировать работу, повышать эффективность того или иного направления — например, эффективность продаж и качества предоставления сервиса при взаимодействии с пользователем. Впоследствии мы также предоставляем эти решения и как внешние сервисы.
Ключевые направления и проекты
- Virtual assistant (Чат-бот, ASR, TTS, BSS)
Виртуальный ассистент, независимо от того, как он реализован, позволяет человеку общаться с системой и решать определенные проблемы или задачи, которые перед ним стоят. Это может быть, например, чат-бот типа «Алисы», который может с вами поболтать и отправить запрос в поисковик.
Мы пока реализуем чат-бот для внутренних нужд. Разработка ведется уже несколько лет, и на сегодняшний день нам удалось создать довольно мощного чат-бота, который обслуживает внутренних абонентов МТС. Зачастую, когда вы обращаетесь на сайт с запросом подключить интернет или поменять тариф, решить какую-то проблему и получить фидбэк, на самом деле вы делаете это через чат-бота. Его эффективность на данный момент достигает 75%, что является очень хорошим результатом для подобного рода системы.
Также мы, безусловно, занимаемся технологиями распознавания, синтеза речи и слепого разделения источников, то есть решаем проблему смеси голосов. Почему мы это делаем? На рынке существует уже много готовых решений, которые можно использовать. Но зачастую они покрыты патентами и ограничены определенными условиями. Например, в некоторых решениях от Google используется клиент-серверная архитектура, при которой данные отправляются за пределы территории РФ. В определенных случаях для нас это неприемлемо. И кроме того, мы хотим достичь высоких характеристик в распознавании речи.
- AI Medicine (Symptom-checker, Medical CV)
Мы реализуем проект SmartMed, в рамках которого работаем над телемедицинскими задачами. Другой проект — Symptom-checker — это система поддержки принятия решений. Она помогает врачу или пациенту оценить состояние больного и принять исходя из этого определенное решение. Это не система, которая ставит диагноз, но ее результаты можно использовать в качестве второго мнения. Система обучается на академической практике, поэтому в этом проекте искусственный интеллект используется в полном объеме.
И наконец, медицинское компьютерное зрение — это технология, связанная с распознаванием изображений. Мы также начали работать в этом направлении и планируем в дальнейшем развивать наши наработки.
- Document management (Legal Tech)
Порядка полугода назад наша команда начала работать в направлении Legal Tech. Это прежде всего технологии, которые позволяют автоматизировать все, что связано с обработкой юридических документов. Оказалось, что в юридической сфере существует достаточно много проблем, связанных с Document management. Технологии AI, в свою очередь, могут помочь автоматизировать этот процесс таким образом, что конечному пользователю будет достаточно просто использовать эту систему и ориентироваться в большом объеме документов.
Все проекты мы реализуем на базе технологий распознавания звука, обработки естественного языка (NLP), компьютерного зрения и машинного обучения (нейронных сетей, глубокого обучения и других подходов).
Ключевые вызовы
В направлении ASR (распознавание звука) мы хотим достичь мировой точности по качеству распознавания. Сегодня очень много информации на английском языке, поэтому специалистам в этой области очень легко сравнивать, анализировать и применять много классических подходов. Ресурсов по русскому языку, к сожалению, пока мало: нет открытых корпусов, очень сложно найти достоверную информацию, чтобы сравнить данные с base line, и существует достаточно мало открытых обученных моделей. Именно поэтому вести разработку в этой области крайне важно.
Мы разрабатываем технологии для того, чтобы потом их можно было «приземлить» на различные направления. Мы можем использовать их как облачные решения, решения для разработки конечных устройств. В каждом случае выдвигаются различные требования: технология может использоваться оффлайн, работать медленно, но при этом быть очень точной, либо она, напротив, должна работать очень быстро и потреблять мало энергии, адаптируясь при этом к словам, которые она не знает.
Из-за этого возникает проблема, что нам нужно получать различные решения. Именно поэтому системы, которые построены на технологиях AI, должны позволить проще масштабироваться и адаптироваться под наши требования.
В направлении, которое связано с синтезом речи, уже получены определенные результаты. На сегодняшний момент не проблема синтезировать речь на высоком уровне. Но главным вызовом является вопрос, как добавить в нее эмоциональную окраску.
И наконец, еще одной важной задачей является удаление структурных помех. Мы работаем с пользователями, которые могут находиться в совершенно произвольной обстановке — в помещении, на улице, где много посторонних шумов, где угодно. Со всем этим необходимо работать, чтобы в конечном счете мы обрабатывали только нужную информацию.
В отношении чат-бот систем актуальной остается задача эффективного извлечения фактов и целей, которые преследует пользователь, когда обращается в компанию. Отслеживание контекста — на сегодня это одна из самых сложных проблем, связанных с чат-ботами.
Проекты с Университетом ИТМО
В компании есть подразделение, которое занимается с университетами. Его курирует Максим Гашков, который некоторое время назад и познакомился со специалистами Университета ИТМО, в том числе с Александром Бухановским (директор мегафакультета трансляционных информационных технологий — прим.ред). У нас было несколько визитов в университет, по итогам которых мы выработали несколько направлений, в которых нам интересно работать совместно. В итоге эта работа вылилась в создание двух проектов.
- Разработка системы распознавания речи, генерации и анализа шумов (руководитель — Дмитрий Муромцев, руководитель международной лаборатории «Интеллектуальные методы обработки информации и семантические технологии» Университета ИТМО)
У команды Дмитрия Муромцева есть достаточно большой опыт в NLP, работе со всевозможными онтологиями. Наш совместный проект имеет прикладной характер и предполагает создание программно-аппаратного комплекса, который позволит проводить массовые тестирования систем распознавания речи, синтеза речи и работать с шумами.
- Разработка медицинской рекомендательной системы с возможностью персонализации (руководитель — Сергей Ковальчук, старший научный сотрудник НИИ НКТ Университета ИТМО)
Команда Сергея Ковальчука занимается медицинской тематикой. Наш совместный проект посвящен анализу открытых текстовых данных, получаемых из различных источников. Особенность в том, что специалисты работают с неструктурированными данными, и это далеко не самая простая задача. Главная цель — научиться с высокой точностью извлекать из таких данных различные факты, связанные с предметной областью.
Далее результаты этой работы, во-первых, будут подключены к нашей системе поддержки принятия решений, а во-вторых, на втором этапе мы нацелены на персонализацию. Безусловно, есть стандартизированные треки, протоколы лечения, рекомендации, по которым все идут, но каждый из нас индивидуален, и главной тенденцией на сегодня является персонализация медицины. Она предполагает поиск каких-то фактов, отклоняющихся от общего трека, что, в свою очередь, помогает оказывать более эффективную помощь.
Но подчеркну, что мы не занимаемся лечением, мы помогаем понять пациенту, куда ему обратиться. Таким образом, нашей задачей является маршрутизация на начальном этапе. Я надеюсь, что совместный проект поможет нам решить большой пласт этих задач.
Эти проекты важны как для нас, так и для университета. Студентам они прежде всего позволяют найти темы научных работ, дают возможность принять участие в решении сложных научных и технических задач, а также получить опыт работы с индустриальным партнером.
Какие специалисты нужны высокотехнологичным компаниям
Сейчас в нашей группе работает 40 специалистов, но в следующем году планируется увеличить число сотрудников в 2,5 раза.
Во-первых, войти в команду специалистов функциональной группы AI Центра инноваций МТС могут студенты от первого курса и старше. У нас есть позиции стажеров, где необходимо работать не менее 30 часов в неделю.
Из компетенций потребуется прежде всего сильная математика — теория вероятностей, функциональный анализ, а также хороший уровень программирования. Мы используем все современные популярные языки: Python, C++, JavaScript для всевозможных разработок, связанных с фронтендом. Также важно умение работать с современными библиотеками для машинного обучения.
Во-вторых, что касается уже состоявшихся специалистов, здесь мы ищем как разработчиков, так и руководителей проектов. Необходимыми в этом случае являются навыки по обработке текстов с использованием всевозможных подходов из области машинного обучения. Кроме того, очень важны специалисты, которые умеют работать в области обработки звука — работали с распознаванием, синтезом речи. И наконец, важны компетенции в области работы с рекомендательными системами.
Сегодня на рынке очень востребованы специалисты, которые могут легко переключаться между разными задачами в определенной области, а также в целом — правильно их формулировать. Есть несколько университетов, которые готовят специалистов с такой квалификацией. На мой взгляд, Университет ИТМО входит в число таких вузов. Это видно на примере тех двух проектов, которые мы уже ведем совместно с университетом.
Михаил Мишуровский более 10 лет работает в сфере создания новых технологий. С 2007 по 2018 работал в компаниях Intel и Московском исследовательском центре Samsung, где занимался вопросами разработки алгоритмов для видео-кодеков и новых поколений видео-кодирования, в том числе на основе технологий ML/AI, принимал участие в разработке AI-based решений по анализу качества видеопотока, улучшению эффективности видеокодирования. Сейчас он отвечает за разработку технологий обработки данных, получаемых из разных источников, включая данные на естественном языке, на основе методов машинного обучения в функциональной группе AI центра инноваций МТС.