О проблеме
Представьте, что вы смотрите видео на YouTube о том, как робот Boston Dynamics самостоятельно открывает двери. И тут вдруг появляется реклама губной помады, у которой «есть характер». Мало того, что раздражает, так и создается впечатление, что смотришь телеканал, где ты не можешь выбирать контент. Но ты смотришь на YouTube именно то, что сам выбрал. Понятное дело, что совсем уйти от рекламы невозможно. Но реклама, которая совсем не соответствует твоим интересам, бесит еще сильнее. Вот если бы милые железные «собачки» были бы прерваны, скажем, рекламой новых крутых дронов, возможно, вам это было бы даже интересно.
«Сегодня нативная реклама практически никак не анализируется насчет того, подходят ли она контенту, в который вставляется. Тебе предлагают купить подгузники, когда ты смотришь обзоры телефонов. Ты искал себе велосипед через поисковик, выбрал и купил, но затем еще несколько месяцев тебя преследует реклама этих велосипедов. В основном, при подборе контекстной рекламы берутся какие-либо демографические признаки – средний возраст, пол зрителей и так далее», – отметил Виталий Сотников.
Есть и другая проблема. Никакому рекламодателю не хочется, чтобы реклама его продуктов появлялась в социально неприемлемых видео. Но именно так произошло с рядом крупных компаний в ноябре прошлого года, когда их реклама появилась в YouTube-роликах с полуобнаженными детьми, под которыми к тому же были оставлены комментарии с оттенками педофилии. Представители таких компаний, как Diageo, Mars, Hewlett-Packard, Deutsche Bank и Mondelez отозвали свою рекламу с видеохостинга и Google в целом, назвав ситуацию шокирующей. В ответ на скандал Google объявил о наборе 10 тысяч сотрудников, которые займутся проверкой видеоконтента на YouTube. Также в IT-гиганте заявили, что работают над алгоритмами машинного обучения для распознавания видеоизображений.
Как NativeOS решает проблемы с помощью автоматизации
Стартап выпускника Университета ИТМО решает эти проблемы. Команда NativeOS создала нейросеть, которая может автономно анализировать не только то, какие объекты есть в видео, но и, самое главное, какую эмоциональную, социальную окраску имеет контент, иными словами, его содержание.
«Здесь как в кино. Мы понимаем смысл сцены не по тому, какие предметы есть в кадре, а по тому, как эти предметы взаимосвязаны между собой, какая атмосфера создается, какое настроение у эпизода. То есть наша нейросеть распознает тональность роликов. Некоторые рекламодатели не хотят, чтобы их ролики появлялись в видео определенной тематики. Мы можем давать им рекомендации, в какие видеоролики вставлять рекламу, а в какие – нет», – сказал Виталий Сотников.
Что за тональность? Виталий привел реальный кейс. Предположим, есть ролик, в котором монах поджигает себя на фоне храма. Нейросеть распознает самого монаха и огонь, но также в кадрах встречается объект «храм», что рождает тональность «религия». И не все рекламодатели хотят, чтобы их как-то ассоциировали с религией. Точно так же многие компании избегают рекламы в контенте, связанном с политикой, терроризмом, педофилией, насилием и другими неприемлемыми темами. Алгоритм NativeOS может распознавать эти тональности и делать это, самое важное, автоматически. То есть нанимать 10 тысяч человек для его работы не нужно.
Более того, благодаря распознаванию содержательного контекста видеороликов можно предлагать компаниям размещать рекламу именно в таких видео, которые с наибольшей вероятностью смотрят клиенты компаний. То есть предлагать покупателям то, чем они действительно могут заинтересоваться, а не выдавать девушке-гику, которая смотрит видео о технологиях и науке, рекламу помады только потому, что она девушка.
«Нативная реклама начинается именно тогда, когда мы делаем этот самый “мэтчинг”, то есть когда реклама совпадает с контентом и потребностями человека и может быть ему полезной. На самом деле, мы были даже удивлены, когда поняли, что до нас никто не пытался автоматизировать нативную рекламу в видео. Ведь все технологии для этого уже существуют, просто мы первые, кто разработал для них такое применение», – подчеркнул CEO NativeOS.
Какие технологии используются для автоматизации нативной рекламы
Для распознавания изображения используется нейросеть (подробнее о том, как работают нейросети, можно прочитать здесь). Чтобы обучать алгоритм, разработчики используют стоп-кадры из различных видеороликов, а также кинофильмов. На первичное обучение нейросети ушло около 15 месяцев. В работе алгоритма также применяются технологии компьютерного зрения. Однако недостаточно просто понять, какие объекты находятся в кадре. Нужно узнать, что связывает эти объекты, что эти связи могут значить. Для этого команда стартапа использует семантические технологии.
Что такое семантические технологии? Они не используют математические методы для описания данных и установления связей между ними. Для этого используются метаданные, то есть данные, которые описывают другие данные. Семантические связи строятся с помощью онтологий. Это документ или файл, формально задающий отношения между объектами семантических связей. Но здесь важно учитывать, что эти отношения должны оставаться неизменными и задаваться человеком, настраивающим семантическую сеть (подробнее о том, как такие технологии используются в медицине, в финансовом секторе, читайте здесь и здесь).
Как настраивается семантическая сеть для определения содержания видео? Предположим, на видео есть два объекта – человек и огонь. Если объекты рядом (вместе), то семантическая сеть может распознать, что это – горящий человек. Однако этого недостаточно. Например, в США проходит фестиваль современного искусства Burning Man. Вроде бы и неплохо разместить какую-либо рекламу в видео с этого фестиваля. Но для более полной картинки нужен дополнительный контекст. Например, если человек стоит на фоне храма, а на шее у него распознается крест, то эти объекты связываются между собой в значение «религия». А вот это уже не очень хорошо для большинства рекламодателей, как уже говорилось.
«Глупо показывать рекламу галстука в видео, где человек просто сидит в галстуке, без понимания окружающей его обстановки, то есть содержания происходящего», – сказал Виталий Сотников.
Сейчас NativeOS работают над улучшением качества нейросети и семантической сети, то есть увеличивает количество тегов тональности, которые можно распознавать в видеороликах с разным содержанием. Пока в компании ориентированы на анализ только изображений, однако в будущих планах – провести R&D в области sound recognition. Однако очень редко бывает так, когда звук и изображение не соответствуют друг другу по содержанию, отметил Виталий, поэтому в подавляющем большинстве случаев достаточно анализировать тональность только изображения.
У стартапа есть еще две отдельные гордости. Первая – это индекс нативной рекламы (INA), который позволяет оценить, насколько реклама действительно нативна для этого контента. Вторая – это алгоритм, благодаря которому можно встраивать нативную рекламу в видеоролик так, что его не распознает сервис по блокировке рекламы AdBlock. Обе разработки относятся к ноу-хау компании, поэтому сведения о принципах работы находятся под строгим NDA.
Также в планах у разработчиков – создать инструментарий для оценки конверсии рекламы, встроенной в видео по рекомендациям NativeOS. Однако для этого сначала нужно собрать большие данные о том, как происходит эта конверсия в реальности, то есть сколько переходов делают пользователи. Для этого сервис стартапа должен быть запущен и протестирован на сотнях кампаний.
О некоторых особенностях бизнеса в другой стране
До полноценного выхода на рынок стартапу нужно еще примерно полгода на доработку. Сейчас прототип тестируется при поддержке партнера, одного из крупнейших коммуникационных агентств мира Publicis Groupe. Запустить NativeOS планируется на рынках США.
«Дело в том, что в США люди более открыты новому, быстрее включаются в тестирование инновационных вещей. Здесь, в России, мы также пытались сотрудничать с некоторыми рекламными агентствами, но у нас ушло полгода только на то, чтобы объяснять ответственным менеджерам, как работает наша система. Потом начались всякие согласования, планирование… В целом, в Америке люди проще подходят к делу. Например, мы проводили встречу с директором по стратегии в достаточно крупном digital-агентстве с клиентами в виде Apple, Google, Facebook. Так вот, ему кто-то рассказал о нас, и он захотел встретиться с нами. В итоге спустя пару месяцев мы подписали все бумаги, и Илан присоединился к нам. Этот пример примерно характеризует то, как проходит коммуникации в США. Бюрократия тоже, конечно, никуда не делась, но люди изначально там более подготовлены для нового. Как и сам рынок. Рекламный рынок РФ отстает примерно на 5-6 лет», – прокомментировал Виталий Сотников.
Штаб-квартира NativeOS находится в Нью-Йорке. По словам главы стартапа, это отличный город для бизнеса, в нем очень много возможностей, но жить там – не самое приятное дело.
«Обычно петербуржцам не нравится Москва, потому что там нет единого архитектурного стиля, там другое давление и скорость жизни. В Петербурге есть какое-то архитектурное спокойствие – весь исторический центр еще со времен приказа Николая I не имеет зданий выше Зимнего дворца. Так вот, Нью-Йорк – это Москва, но только в два раза выше, в два раза грязнее», – пояснил он.
Также сложностей добавляет разница в часовых поясах, так как команда стартапа и партнеры работают из разных точек света. Сложно было поначалу и с языковым барьером, но к этому быстро привыкаешь.
«Мы действительно кайфуем от того, что делаем. Мной также движет давнее желание снять собственный сериал, сценарий которого я прорабатываю уже четыре года, а на производство требуются значительные ресурсы. Да и в целом, если мы сможем поменять рынок рекламы в лучшую сторону, как минимум стоит попробовать», – сказал Виталий Сотников.