Нейросети для бизнеса и не только: как научить компьютер «видеть»?
Этим вопросом ученые задались еще в середине прошлого века. Основы нейронных сетей как одного из методов машинного обучения зародились в далеком 1943 году. Первую версию нейрона (ячейку нейронной сети) предложили Уоррен Маккалок и Уолтер Питтс. А уже спустя 15 лет Фрэнк Розенблатт представил первую самую простую нейронную сеть, которая могла разделять, например, объекты в двухмерном пространстве. Впрочем, тогда анализ изображений все же не смог показать хороших результатов. Почему?
«Представьте, допустим, что у нас есть картинка размером 3 на 3 пикселя. Мы берем первые три пикселя, первый столбец, под него подставляем второй столбец и далее третий — получался вектор размером 9 пикселей. И каждый пиксель мы подаем на отдельный нейрон. Получается все равно, если мы возьмем книгу и прочитаем первую букву первой строки, первую букву второй строки, третьей и так далее на всей странице — да мы прочитаем страницу, но в итоге ничего не поймем. Точно так же искусственная нейронная сеть тогда не могла понять смысл изображения», — приводит пример магистрант Университета ИТМО, разработчик стартапа Kuznech Иван Бурцев.
Именно поэтому, чтобы картинка приобрела понятный для нейросети вид, нужна была предварительная обработка. Такой операцией стала свертка — появились так называемые сверточные сети, первую из которых предложил Ян Лекун. Ученый показал, как можно использовать такую сеть, чтобы значительно улучшить распознавание рукописного текста: многие чеки, выписанные в Соединенных Штатах, и сегодня обрабатываются с помощью этого метода. Как это работает? Изображение сворачивается в вектор, который подается на искусственную нейронную сеть. И именно благодаря сверткам, которые «ходят» по изображению и запоминают его геометрические особенности, удается оцифровать его в такой вектор, который становится понятен сверточной нейронной сети, объясняет Иван Бурцев.
После предложения Лекуна о нейронных сетях «забыли» еще почти на 20 лет. Одна из причин — отсутствие возможностей для быстрого обучения нейросетей. Новый скачок в развитии произошел лишь пять лет назад. В 2012 году исследователи из Университета Торонто одерживают победу на ImageNet, ежегодных соревнованиях по распознаванию визуальных образов. Одной из задач состязания является классификация объектов по 1000 категорий. Выиграть престижный конкурс помогает сверточная нейронная сеть. Что немаловажно, ее результат оказывается выше показателей ближайшего преследователя в два раза.
Сегодня Facebook без труда распознает лица на фотографиях, Twitter блокирует запрещенный контент без участия администраторов, а сервисы и приложения на базе API Microsoft Project Oxford одинаково легко определяют по фотографии настроение человека или породы собак. О тех или иных разработках с применением нейросетей мы узнаем каждый час: они уже научились одинаково хорошо работать в банковской сфере, маркетинге и вполне реалистично менять лица людей.
Российско-американский стартап Kuznech использует сверточные нейронные сети как в проектах для бизнеса, так и в приложениях для отдельных пользователей. Компания уже завоевала 12 престижных международных IT-премий, получила грант от фонда «Сколково», зарегистрировала несколько американских и российских патентов. Одним из продуктов Kuznech является приложение Logotrakr, которое позволяет фиксировать логотипы компаний, попадающие в кадр при трансляции различных мероприятий, в рекламных роликах, телепередачах, в фильмах и видеоклипах. Благодаря этому можно проанализировать, как часто появляется тот или иной бренд в различных соцсетях и следить за его продвижением.
Другое решение для бизнеса — визуальный мерчендайзинг. Чтобы определить текущее состояние полки магазина, сегодня требуется труд людей, которые вручную подсчитывают, какого товара не хватает в данный момент. Такую механическую работу вполне могут заменить нейросети, которые сделают анализ гораздо быстрее, говорит разработчик, магистрант Университета ИТМО Иван Бурцев. Принцип работы достаточно прост: по фотографии витрины нейросеть сама определяет, какие товары находятся там на данный момент, включая анализ бренда и цвета упаковки, и отправляет соответствующую информацию дальше.
Не для бизнеса Kuznech разработал проект LikeThis, принцип работы которого также основан на сверточных нейросетях. Приложение позволяет по фотографии определить, что надето на случайном прохожем, модели из журнала или человеке со скриншота модного сайта, найти что-то похожее и приобрести себе, не переплачивая сумму с «лишними нулями», объясняет Иван Бурцев.
«К примеру, вам понравилась футболка случайного прохожего на улице, вы делаете фото этого человека на смартфон, нажимаете “ОК”, а дальше происходит “магия”. Во-первых, нейросеть, анализируя изображение, находит области, которые, по ее мнению, больше всего похожи на одежду. Дальше уже с помощью другой сверточной нейронной сети мы отсеиваем то, что не является одеждой. Получается, что мы уже находим одежду, можем выделить ее и классифицировать, — говорит он. — Таким образом, мы делаем фото, отправляем его в систему, система ее классифицирует, говорит, например, что это платье в пол, и предлагает несколько похожих вариантов из каталогов магазинов наших партнеров. Фотографии можно делать на улице, можно делать фото из различных журналов, просто скриншоты из Сети — со всем этим умеет работать LikeThis».
Среди других проектов стартапа — разработка собственной системы фильтрации контента «для взрослых». Компания использует несколько методов, в том числе детектирование производителей соответствующего видео, текста-предупреждения, распознавание лиц, поз и даже кожи. Последнее, к слову, позволяет системе максимально точно не записать в неприемлемый контент произведения искусства, добавляет разработчик.
Будущее нейроинтерфейсов: насколько реальны планы Илона Маска?
Еще один перспективный «рынок будущего», обороты которого оцениваются в миллиарды долларов, — разработка нейрокомпьютерных интерфейсов. Неслучайно в развитие этого направления вкладываются не только крупнейшие научные центры передовых стран мира, но и ведущие высокотехнологичные компании — Facebook и корпорация Илона Маска Neuralink, о создании которой стало известно в апреле этого года. В основе идеи Neuralink — механизм, который позволит объединить компьютер и человеческий мозг. В новой компании создатель Tesla и SpaceX планирует заняться созданием технологии, которая в ближайшем будущем поможет людям со сложными мозговыми травмами, а в дальнейшем позволит человечеству избежать подчинения искусственному интеллекту и сделает людей умнее. Реализовать идею, по замыслу предпринимателя, позволит разработка технологии neural lace («нейронное кружево»), с помощью которой можно будет имплантировать в человеческий мозг крошечные электроды (подробнее об этой технологии мы писали здесь). Таким образом, предполагается, что между человеком и компьютером исчезнет посредник в виде клавиатуры, компьютерной мыши или тачскрина. Его должен заменить нейрокомпьютерный интерфейс.
Аналогичную идею взяли на вооружение в Facebook, где также занялись разработкой системы, которая должна устранить в общении посредников в виде мыши и клавиатуры и поменять саму суть взаимодействия гаджетов и людей. Цель компании — реализация системы, которая позволит печатать 100 слов в минуту, дешифруя нейронную деятельность, связанную с речью.
Как уточняет руководитель проектного офиса НейроНет Университета ИТМО Виталий Зубченко, история нейроинтерфейсов насчитывает уже более 50 лет. Например, первым нейроинтерфейсом может считаться Stimoceiver — электронное устройство, которое может управляться по беспроводной сети с помощью FM-радио. В 1950-е годы нейрохирург Йельского университета Хосе Дельгадо испытал его на мозге быка, впервые добившись изменения движения животного с помощью нейрокомпьютерного устройства. В 1988 году появилась «виртуальная клавиатура» Фарвела и Дончина — благодаря этому методу люди смогли набирать текст, мысленно выбирая нужную букву на пересечении символьных строк и рядов. Таким способом удалось «печатать» со скоростью примерно 5-6 символов в минуту, к примеру, традиционным способом человек может набирать на смартфоне в среднем 20 символов в минуту, говорит Виталий Зубченко.
Но когда Facebook увеличит эту скорость до 100 символов, а Илон Маск найдет способы эффективно внедрить «нейронное кружево» в мозг человека? Сам предприниматель называет срок от семи до восьми лет. Многие эксперты склоняются к 2035 году, рассказывает руководитель проектного офиса НейроНет Университета ИТМО. Впрочем, пока разработчикам еще предстоит реализовать механизм подключения к мозгу, а также решить проблему быстрой передачи информации.
WannaCry: как атакуют в сети и помогут ли нам элементарные правила «кибергигиены»
Но если о нейронных сетях и нейроинтерфейсах СМИ активно пишут уже последние несколько лет, то о WannaCry пользователи со всего мира заговорили впервые лишь в минувшую пятницу. 12 мая вирус-вымогатель атаковал компьютеры в 150 странах. WannaCry зашифровал файлы на зараженных компьютерах и требовал 300 долларов в биткоинах за дешифровальщик.
По масштабам распространения эту атаку уже назвали крупнейшей в истории. Компании, пострадавшие от WannaCry, до сих пор продолжают подсчитывать убытки. В общей сложности сумма ущерба была оценена аналитиками компании KnowBe4, специализирующейся на защите от кибератак, в один миллиард долларов. В эту сумму входит ущерб от потери данных, потеря производительности, нарушение бизнес-процессов, а также репутационный вред и другие факторы. Однако напрямую хакеры, распространившие вирус, получили от жертв не так много, считают специалисты компании McAfee. К настоящему моменту на их биткоин-кошельки поступило 302 перевода общей суммой 116 тысяч долларов.
По мнению аналитиков, главной целью хакеров могла стать не финансовая добыча, а желание громко заявить о себе. От нападения пострадали компания FedEx, автомобильные заводы Renault и Nissan, Испанский телекоммуникационный гигант Telefonica, 48 больниц Великобритании, а в России вирус затронул даже силовые структуры, включая МВД и Следственный комитет.
По меркам обычных сумм в сфере киберпреступности злоумышленники действительно заработали не так много, соглашается технический директор компании TS Solution, эксперт по информационной безопасности Михаил Зимин. Но стоит ли в принципе доверять обещаниям, что вам все-таки пришлют ключ для расшифровки данных, и заплатить требуемую сумму?
«Беда в том, что шифровальщики существуют уже много лет, последние лет пять они очень активно используются злоумышленниками, в первую очередь, для того, чтобы заработать деньги: сначала они шифруют, а потом предлагают заплатить. Но если кто-то из вас на практике столкнулся с такой ситуацией, то платить ни в коем случае не нужно. Сам механизм работы CryptoLocker не подразумевает, что вам после того, как вы заплатите деньги, вернут ключ для расшифровки данных», — отмечает Михаил Зимин.
Другой вопрос: почему вредоносная программа вызвала столь массовые заражения? С одной стороны, ее авторы использовали совершенно убийственный коктейль — смешали трояна-вымогателя с наиболее эффективным способом распространения — сетевым червем. С другой, не помешало распространению и то, что WannaCry использовал уязвимость, которая была известна еще в марте этого года.
«В марте об уязвимости узнали, в апреле компании выпустили “заплатки” или обновления, чтобы ее закрыть, а в мае мы, тем не менее, имеем такой фееричный эффект. Причина в том, что большинство систем как дома, у обычных пользователей, так и в корпоративном сегменте попросту не были обновлены. Если бы это произошло, такого масштабного заражения, скорее всего, удалось бы избежать», — подчеркивает спикер.
По мнению экспертов, волна заражений WannaCry идет на убыль, однако, скорее всего, уже в ближайшем будущем стоит ждать аналогичных атак. Именно поэтому даже вполне очевидными правилами «кибергигиены» пренебрегать все-таки не стоит. Программа минимум — своевременно позаботиться об установке обновлений, использовать антивирусы, делать бэкапы данных (разумеется, лучше несетевые), говорит Михаил Зимин. Компаниям же лучше всего позаботиться также и об использовании IPS-решений, добавляет он. Более подробный разбор ситуации от компании можно прочитать в блоге TS Solution на Хабре.
Организаторами фестиваля «Белая ночь технологий» выступили культурное пространство «Бенуа1890» и лекторий «Фонтанка.ру». В числе партнеров проекта — Университет ИТМО, бизнес-инкубатор «Ингрия», фаблаб «Политех» и сервис дополненной реальности 1Reality.