Как я узнал об Этом, или еще об одном нашем выдающемся выпускнике

Технология закадрового перевода видео от «Яндекса». Источник: yandex.ru

О чем ― об Этом ― я расскажу позже, а сначала ― как узнал.

Сначала (7 сентября 2021 г.) я увидел пост управляющего директора и члена совета директоров группы компаний «Яндекс» Тиграна Худавердяна, с которым Василий Филиппов познакомил меня: «Перевод видео с английского на русский ― на всех видео на YouTube! Это просто фантастика! Попробуйте. Просто отвал башки. Доступно: „Яндекс.Браузер“ для Windows, macOS, Linux и Android; Приложение „Яндекс“ для iOS и Android (надо перезапустить программу, чтобы фича бы активировалась)».

А вот комментарий Тиграна к этому тексту: «Вот тут пост Ромы Иванова, в котором об этом написано подробнее». Роман ― менеджер по продуктам в «Яндекс», а пост Романа также датируется 7 сентября.

Пошел читать этот пост и в первых же строках увидел очень важное и радостное для меня и кафедры «Компьютерные технологии» Университета ИТМО (причина станет ясна чуть ниже): «Запускаем перевод видео для всех. В сентябре прошлого года ко мне пришел Andrew Zakonov, который тогда руководил продуктовым развитием «Алисы», и рассказал об идее соединить технологии «Яндекса», над которыми мы работаем больше 10 лет, в нечто новое, чего нет у наших конкурентов перевод видео в Интернете.

Какие технологии?

1. Распознавание иностранной речи;

2. Биометрию для определения пола говорящего;

3. Машинный перевод, созданный «Яндексом» еще в 2011 г. ― он превращает английский текст в русский;

4. Голосовой синтез (он есть у «Яндекса» с 2012 г.), который позволяет переведенный текст озвучить, причем так, чтобы озвучка подошла по длине к оригиналу.

И вот сегодня мы рады рассказать, что эта технология в достаточной степени готова, чтобы ей могли воспользоваться все желающие: теперь приложение «Яндекс» для iOS и Android и «Яндекс.Браузер» для Windows, macOS, Linux и Android могут переводить видео с английского на русский для видео, размещенных на ряде хостингов, в том числе Youtube и Vimeo (число сервисов будем увеличивать).

Выглядит это все просто как магия: нажимаешь на кнопку перевода в десктопном браузере или мобильном приложении «Яндекса» и практически мгновенно получаешь видео с двухголосовой русской озвучкой.

В июле, сразу после публичного рассказа о работе над данной фичей и демонстрации первого видео, мы столкнулись с обвинениями в краже идеи: сначала их предъявил программист, разработавший расширение для озвучки субтитров на YouTube, а затем ― коммерческая платформа для републикации видео в других странах. Мы не крали эту идею: ее придумали фантасты очень много лет назад, а применить ее к нашим технологиям мы придумали сами в прошлом сентябре (Сообщение в Telegram: 28 сентября Andrew Zakonov создал группу «Перевод видео»).

Первая внутренняя версия, которую мы показали на всю компанию (пост видели тысячи коллег) была готова 18 марта («Журнала про „Яндекс“» (NDA) со следующим комментарием: «Видео без границ в „Яндекс.Браузере“». Видеопотребление растет в Интернете с каждым годом, и каждый день появляется огромное количество контента: от видеошоу на YouTube до курсов про магию во времена Средневековья на Coursera. Несмотря на обилие контента, большая его часть оставалась недоступна нашим пользователям из-за языкового барьера. Но языковый барьер ― это то, с чем «Яндекс.Переводчик» уже помог справиться миллионам пользователей, и теперь мы готовимся сделать большой следующий шаг: дать пользователям возможность потреблять любой контент".

Из изложенного можно понять, что работа над проектом перевода видео внутри «Яндекса» началась задолго до того, как были публично запущены похожие сервисы, которыми мы якобы «вдохновились».

Более того, я в марте нашел на Indiegogo в некотором смысле похожий проект ― наушники с функцией онлайн-перевода (примерно как Pixel Buds, но без привязки к «Андроиду» и США). Я даже заказал их тогда, но их еще не прислали ― продолжаю ждать, так как дико интересно потестировать. Все это лишь подчеркивает, что идея перевода видео совсем не уникальная, и нет ничего плохого в том, что разные бизнесы думают об одних и тех же задачах, но решают их по-своему и для разных аудиторий ― это только подчеркивает актуальность проблемы стирания языковых границ.

В общем, мы подробно описали на «Хабре» («Как Яндекс помогает преодолеть языковый барьер: нейросетевой перевод видео, картинок и текста»), как работа над реализацией этой идеи шла последние 11 лет. Надеюсь, спекуляции на тему воровства идеи перевода видео на этом прекратятся.

Попробуйте перевод сами, составьте собственное мнение".

Схема процесса перевода видео. Изображение из блога «Яндекса» на «Хабре» / habr.com
Схема процесса перевода видео. Изображение из блога «Яндекса» на «Хабре» / habr.com

В этот же день (7 сентября) появился и пост Андрея Законова: «В целом, в создании продукта есть три приятных момента.

1. Момент, когда идея зарождалась. Он всегда бинарный, вначале ничего непонятно, а потом сразу понятно все: надо разобраться с бэклогом, синтезом, распознаванием… Если из всего этого сложить пазл и это все через браузер дать пользователям, то мы любое видео в Интернете сможем перевести!

2. Момент первого прототипа. Особенно, когда не первую ночь экспериментируешь и тут, наконец-то, получилось так, как и было задумано. Нашел в переписке первый ролик, на котором я собирал демо.

3. Момент, когда придуманный продукт становится доступен миллионам пользователей. Ощущение, что в итоге получилось сделать что-то в этом мире немного лучше и удобнее для большого числа людей. Это в случае перевода видео сегодня. В приложении «Яндекса» и браузере на всех платформах можно включить русский перевод для любого английского видео с Youtube и Vimeo ― это магия. До третьего момента мало какие идеи доживают, поэтому он самый кайфовый. Спасибо команде, которая смогла меньше чем за год пройти от идеи в сентябре 2020 г. до запуска такого масштаба сегодня".

При этом отмечу, что еще 16 июля был опубликован текст «Яндекс создал прототип закадрового перевода видео в „Браузере“».

А теперь о причине моей особой радости: Андрей ― выпускник 2010 г. кафедры «Компьютерные технологии» Университета ИТМО. На этих фотографиях (1, 2) Андрей справа.

Андрей Законов (справа) с одногруппниками. Источник: is.ifmo.ru
Андрей Законов (справа) с одногруппниками. Источник: is.ifmo.ru

Интересно, что в 2008 г. под моим руководством защитил бакалаврскую работу на тему «Применение автоматного подхода при создании JavaCard-приложений», а в 2010 г. уже под руководством моего бывшего аспиранта Олега Степанова ― магистерскую диссертацию также по автоматной тематике «Применение генетических алгоритмов к генерации тестов для автоматных программ».

А вот «автоматный» курсовой проект, выполненный Андреем в 2007 г. в соавторстве со своим другом ― другим Андреем ― Клебановым на третьем курсе.

А вот «следы» научной деятельности Андрея. При этом хочу отметить, что наше сотрудничество продолжилось и после окончания им университета.

1. Zakonov A. A GA-Based Approach for Test Generation for Automata-Based Programms / Spring/Summer Young Researchers' Colloquium on Software Engineering 2010, Nizhny Novgorod.

2. Zakonov A., Stepanov O., Shalyto A. GA-Based and Design by Contract Approach to Test Generation for EFSMs / Proceedings of IEEE East-West Design and Test Symposium (EWDTS`10). St. Petersburg. 2010, pp. 152−155.

3. Zakonov A., Shalyto A. Automatic Extraction and Verification of State-Models of Web Applications // Lecture Notes in Electrical Enginiring. V. 133. Informatics in Control, Automation and Robotics. 2011. V.2, pp. 157−160.

4. Законов А.Ю., Шалыто А.А. Применение генетических алгоритмов для генерации тестов для автоматных программ // Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики. 2011. № 2, с. 66−72.

5. Zakonov A., Shalyto A. Extracting EFSMs of Web Application for Formal Requirements // Computer Safety, Reliability and Security. SAFECOMP 2012. Lecture Notes in Computer Science. Vol. 7612, pp. 161−172.

6. Zakonov A., Shalyto А. Towards Automated High Coverage Test Generation for Web Applications Using Abstract Syntax Trees Analysis / Proceedings 7th International Computer Science Symposium in Russia (CSR 2012). The Third Workshop on Program Semantics, Specification and Verification: Theory and Applications (PSSV 2012). Nizhny Novgorod. 2012.

В 2018 г. Андрей был одним из лекторов по курсу «Управление IT-проектами и продуктами», прочитанный с большим успехом в Университете ИТМО.

Интересно, что до работы в «Яндексе» он через семь лет после окончания университета стал директором по росту и исследованиям «ВКонтакте».

Вот его выступления в этой должности на тему «Prodact-driven подход к машинному обучению» в 2019 г. Андрей проработал во «ВКонтакте» пять лет.

25 ноября 2020 г. Алексей Пивоваров взял интервью об успехах «Яндекса» у Тиграна Худавердяна и ведущих специалистов в разных направлениях. В конце видео (засечки 1.00.26 по 1.05.50) ― о голосовом помощнике «Алиса» рассказывает Андрей Законов.

Запись беседы управляющего директора «Яндекса» Тиграна Худавердяна с журналистом Алексеем Пивоваровым, а также — интервью руководителей сервисов

До этого ― 21 октября ― стало известно, что Андрей назначен руководителем этого продукта в управлении машинного интеллекта и исследований «Яндекса». А что еще получилось у Андрея в «Яндексе» (а что еще получится), я описал выше!

Так что не только чемпионами мира по программированию славна кафедра «Компьютерные технологии»: его выпускники «приложили руку» к Yota, Kotlin, Cardano, статьям в Nature и Science и многому другому, а теперь и к созданию совершенно обалденной фичи, которая будет востребована миллионами людей.

Профессор факультета информационных технологий и программирования