— Расскажите поподробнее про МТС ИИ — не все знают, что дочерняя компания МТС занимается технологиями искусственного интеллекта.
― Основное направление МТС ИИ — это различные голосовые системы, куда входит много всего: распознавание команд, контекста, генерация голоса. Не так давно мы запустили проект по реализации наших наработок искусственного интеллекта на базе систем на кристалле от фирмы Kneron — МТС ИИ является одним из её инвесторов. Это китайско-американский стартап, который занимается разработкой специализированных микросхем — нейроускорителей, на базе которых можно делать нейрочипы. Это само по себе прорывное направление, которое позволяет решать совершенно иной спектр задач.
Подобные проекты на самом деле можно пересчитать по пальцам одной руки. Стоит отметить, что МТС несколько лет развивала наработки по искусственному интеллекту ― все они были предназначены для серьезных вычислительных систем: серверов, облачных структур. А в этом проекте компания решила эти наработки адаптировать и запустить на микросхемах. То есть по сути создать целое новое направление.
— В чем преимущество этой технологии?
― Технологический прорыв в том, что системы ИИ, которые работают на конечных устройствах, не нуждаются в связке с интернетом. Им не требуются внешние вычислительные мощности, и, соответственно, подключение к удаленным серверам. Всё вычисление, вся магия нейросетей происходит внутри устройства на кристалле.
Помимо того, что экономятся вычислительные мощности и колоссальное количество трафика для передачи информации, еще и решается проблема безопасности — мы не передаем сырые данные куда-то во внешний мир, всё сохраняется внутри. Это сразу открывает целый сегмент промышленности: контроль производства, системы безопасности, защита интеллектуальной собственности компаний.
В целом всё это — воплощение мечты инженеров прошлого о создании устройств, которые на самом деле могут «думать». Возьмём смартфон: он в принципе решает те же самые задачи, но отключи интернет — и всё, волшебство сразу заканчивается. Это иллюзия, на самом деле там нет никакого интеллекта. А здесь мы решаем все задачи сразу в одном флаконе. И это можно использовать в устройствах для работы в особо опасных средах, в космосе.
— Как давно появилась эта технология и используется ли она в коммерческих целях?
― Сами системы на кристаллах в их первоначальных вариантах появились достаточно давно, но в рамках лабораторий университетов, в основном в США и Китае. В коммерческий сектор это пришло относительно недавно, может быть, буквально пару лет назад. Сейчас можно с полной уверенностью сказать, что все главные ИТ-гиганты, в первую очередь Google, эту тему разрабатывают. Все прекрасно понимают, что за этим будущее.
Всё это больше инженерная дисциплина, чем научная. Ведь мы не изобретаем новые алгоритмы, инновационные подходы — мы модифицируем существующие наработки и адаптируем их, чтобы они заработали на «блохе», то есть на устройстве с мощностью смарт-часов. Технология Edge AI — это не про то, как решить какую-то новую задачу, а про минимизацию, энергосбережение, дешевизну в конце концов, компактность и встраиваемость.
Например, МТС ИИ владеет компанией VisionLabs, которая занимается интеллектуальными системами видеонаблюдения. В Санкт-Петербурге и многих других городах России VisionLabs использует технологии компьютерного зрения для обеспечения безопасности школ и университетов. Это куча видеокамер, которые пишут всё подряд в режиме 24 на 7. Неизбежно возникает потребность в экономии трафика и серверного пространства для хранения и обработки информации. Допустим, есть задача — детектировать нарушение периметра. В этом случае нас интересует: забор перелезает человек, кошка, собака или птица? Это так называемая система раннего обнаружения, встроенная в саму видеокамеру — она даёт команду внешней системе начать запись с конкретного момента, какого-то события. Например, это наличие человека в кадре, срабатывание сирены, лай сторожевой собаки, плач ребенка и так далее.
Технологии продолжают совершенствоваться, и так будет еще много лет. Но уже сейчас есть готовые продукты, которые можно интегрировать в различные системы и в том числе использовать для разработки собственных устройств.
— Вы сказали, что этим почти никто не занимается. То есть специалистов, которые умеют с этим работать, на рынке нет?
― О технологии Edge AI (периферийные вычисления) практически никто не знает. Когда в МТС ИИ принимали решение усилить данное направление, все прекрасно понимали, что всё это очень эксклюзивно, современно, свежо. И слишком сыро, чтобы можно было сразу подхватить большую армию разработчиков, которые смогли бы быстро войти в это всё. Специалисты, конечно, есть, но их крайне мало.
— МТС ИИ именно поэтому решил сотрудничать с ИТМО — чтобы подготовить таких специалистов?
― Одна из наших задач — это популяризация технологии для её дальнейшего развития. Для того, чтобы через сарафанное радио запустить весть, что в мире существует система, которая превосходит наши ожидания. И мы просто про это не знаем — это действительно что-то очень редкое, о чем пишут только в англоязычных научных журналах и редких публикациях на Habr. И если ты не варишься в этой теме, то никогда в жизни не узнаешь, что такое существует.
Конечно, здесь нужна работа с образовательными учреждениями. Потому что если студента вовремя заинтересовать интересной прорывной вещью, которая через 2–3 года станет лидером отрасли (как раз к тому моменту, когда он закончит институт), у него будет необходимый бэкграунд для того, чтобы эту отрасль подхватить.
Наша задача — именно показать, познакомить, заинтересовать, а дальше они уже сами должны разобраться. Всё-таки чтобы подобраться к разработке подобных систем, нужно иметь опыт зрелого инженера, который не может быть у студента по определению. В целом порог вхождения в эту тему достаточно высокий. Это смычка низкоуровневого программирования и работы с нейросетями. Единственный вариант облегчить этот путь — показать, как это работает на пальцах, без заумных речей и долгих лекций. До глубокого понимания они сами дойдут, если у них появится интерес.
— А кому будет легче это освоить: инженерам или программистам?
― Это технология на стыке, но, наверное, инженеру будет проще, чем математику-теоретику, который умеет делать что-то высокоуровневое на компьютере. Электроинженерия требует другого мышления, другого подхода. Обучить инженера с опытом разработки устройств тому, как в них встроить ИИ, проще, чем научить математика инженерному искусству за короткое время. Погружение в тему ИИ не кажется сложным, если у тебя есть бэкграунд в электронике.
Но у студентов в этом плане есть преимущество: у них, во-первых, ещё есть в голове место, куда положить огромное количество новых знаний, а, во-вторых, нет отторжения чего-то нового. Но надо поработать — причем в реальных практических проектах. Все самые интересные вещи, самые прорывные открытия совершаются на стыке дисциплин. Нужно одновременно знать очень много из разных сфер, иметь бэкграунд в абсолютно несочетаемых дисциплинах — и тогда получается открытие. Это тяжело и сложно, но всё равно пытаться надо.
Добавим, что недавно Антон Маслов также провел в ИТМО семинар по нейросетевым технологиям и современным программно-аппаратным решениям. На мероприятии студенты смогли увидеть два демообразца систем распознавания голосовых команд и обнаружения лиц, выполненных на базе процессоров Kneron. Видео встречи можно посмотреть здесь.