Хакатон «4SPB: машинное обучение для гражданских проектов» проводится в преддверии Международного дня открытых данных, который состоится 2 марта 2019 года. Организатор 4SPB — Теплица социальных технологий*, которая проводит хакатоны по открытым данным в Петербурге с 2012 года, а также оказывает системную поддержку проектам, помогающим улучшать город. Партнером хакатона выступил Университет ИТМО.
Как подчеркивают организаторы 4SPB, хакатон — это отличная возможность поработать с IT-проектами и решить социальные проблемы Петербурга. Идея заложена в названии: 4spb — это четыре тематических направления для проектов: безопасный город, инклюзивность, самоуправление и экология (safe city, inclusive city, self-governed city and clean city).
Участники хакатона решали одну из девяти задач, связанных с применением методов машинного обучения. Главная цель — представить и запустить полезные веб-сервисы или приложения. Отличительная особенность хакатона: все проекты представлены сотрудниками некоммерческих организаций, гражданскими активистами или же являются частными инициативами. Кроме того, все данные используются для решения социальных проблем с привязкой к городу и области. Как подчеркивает руководитель «Теплицы социальных технологий»* Алексей Сидоренко, участники хакатона работают с реальными проблемами, которые сегодня наиболее остро ощущаются в обществе.
«Очень важно, что в этом хакатоне участвовали не только программисты, но и общественные активисты, представители инициатив, которые разбираются в заявленных проблемах. Перед проведением хакатона наша команда сначала отбирала запросы и смотрела, какая боль есть у общественных организаций, после чего мы анализировали, как именно для решения их задач могут быть применены методы машинного обучения. И в итоге уже под конкретные проблемы мы также подбирали экспертов, менторов, которые работали с командами», — комментирует Алексей Сидоренко.
Участники хакатона могли присоединиться к команде проекта от некоммерческой организации, поработать самостоятельно с предложенными задачами или же со своими данными. В результате до финала дошли девять команд, каждая из которых представила решение в рамках отдельной социально значимой проблемы.
Сервис для фудшеринга, поиск незаконной рекламы и еще несколько инициатив, в развитии которых может помочь машинное обучение
Участники команды Food bot работали над задачей, поставленной участниками инициативы «Фудшеринг Спб». Фудшеринг — это социально-экологический проект по спасению пригодной к употреблению пищи; в последние годы движение активно развивается в Петербурге. Сейчас участники инициативы работают через группу во «ВКонтакте», где публикуются объявления желающих отдать ненужные, но пригодные продукты.
Пока участникам движения фудшеринга приходится вручную искать возможности для обмена продуктами, публикуя предложения в группе. Команда Food bot разработала и представила на хакатоне бота, который позволяет облегчить и автоматизировать процесс раздачи продуктов. Бот может уведомить тех, кто ищет еду, о новых объявлениях, кроме того, он способен ранжировать эти объявления по геолокации и искать для пользователей предложения рядом с ними. Начав общаться с ботом, можно сразу же указать место, где вам удобно будет забрать продукты, а после написать, какие продукты вы хотели бы найти в группе. Бот ищет по объявлениям и предлагает вам варианты, максимально удовлетворяющие вашему запросу.
В будущем команда также планирует проработать функцию рекомендаций: исходя из того, какие продукты чаще ищут пользователи, впоследствии бот сможет подсказывать им потенциально подходящие для них варианты.
Еще один кейс, проработанный другой командой, посвящен выработке решения по борьбе с незаконной рекламой на улицах Петербурга. Наверняка, каждый из нас видел фасады и окна зданий, повсеместно завешанные рекламой. Часть из таких объявлений находится нелегально, и это давно стало массовым явлением. За соблюдением законодательства в теории должны следить аудиторы, которые имеют право устранить незаконную рекламу. Кроме того, на нарушения могут подавать жалобы сами граждане. Сделать это можно через портал «Наш Санкт-Петербург». Однако следить за всем городом непросто. Чтобы надзор был регулярным, авторы проекта предложили автоматизировать процесс распознавания рекламы, используя панорамные карты и компьютерное зрение.
Участники команды, используя фотографии с гугл-карт, поставили перед собой задачу классификации и детекции изображений. В результате получилось разделить объекты на несколько классов. В дальнейшем участники также планируют научиться детектировать баннеры с камер наблюдения, использовать изображения, уже размещенные на портале «Наш Санкт-Петербург» пользователями, а также отладить процесс классификации баннеров на законные и незаконные.
Еще один проект, связанный с анализом информации, размещенной на портале «Наш Санкт-Петербург», на хакатоне представил Стив Каддинс, координатор общественного движения «Красивый Петербург», эксперт Института дизайна и урбанистики Университета ИТМО. Цель, которую ставили перед собой авторы проекта, — рассмотреть возможности для улучшения климата гражданской активности в городе.
Они проанализировали информацию за год, и эта работа позволила сделать несколько неожиданных выводов. В частности, они выяснили, что из 35 000 пользователей, которые публиковали обращения за исследуемый период, нашлось всего пять человек, которые генерировали 10% всех заявок по проблемам. Всего максимальную активность на портале проявляют топ-40 человек, которые публикуют заявки по проблемам из разных точек города. Основную же массу пользователей, как правило, беспокоят конкретные локальные проблемы, связанные с их местом жительства. Именно поэтому, по словам эксперта, важно задуматься и предложить решения, как переключить массу жителей на решение вопросов городской среды в целом.
Также команды представили решения, которые помогут автоматизировать процесс поиска пропавших домашних животных, ускорить и упростить подсчет реальной явки избирателей на выборах (проект от общественной организации Наблюдатели Петербурга), а также оптимизировать маршрут «Синего автобуса», мобильного пункта профилактики для помощи людям, употребляющим наркотики. Это специально оборудованный автобус, в котором работает команда квалифицированных специалистов.
Победителем хакатона была признана команда, которая работала над проектом инициативы «Женщина. Тюрьма. Общество». Автор проекта — Леонид Агафонов. Как поясняет Наталия Донскова, участница команды, в процессе хакатона участники немного переработали исходную задачу и сконцентрировались на проблеме нарушения прав заключенных тюрем, которые становятся жертвами насилия и вовлекаются в индустрию секс-услуг. Проект, реализованный на хакатоне, станет основой большого расследования. Оно будет состоять как в выявлении и анализе конкретных проблем, в том числе с использованием дата-компонента, так и в создании механизмов, которые позволят оказать помощь жертвам насилия.
На хакатоне с помощью машинного обучения команда реализовала инструмент, который позволит выявлять объявления в Сети, связанные с местами лишения свободы и в которых говорится об оказании услуг и распространении запрещенного видеоконтента. В процессе участники проекта планируют проанализировать 100 тысяч объявлений и определить, является ли этот бизнес системным явлением.
«Изначально мы планировали заявить другую тему, а эта проблема была отложена у нас для долгосрочной работы. Но в итоге, когда мы стали более детально прорабатывать социальную составляющую проекта, решили вернуться к первоначальной идее, — комментирует Наталия Донскова. — Естественно, мы планируем продолжать нашу работу. Победа на хакатоне предполагает помощь для завершения проекта, и я полагаю, что это работа не ближайшего месяца. Скорее всего, нам придется делать еще несколько заходов, связанных именно с аналитикой данных, проанализировать промежуточные итоги, а также ознакомить общественность с результатами этой работы. Все-таки тема стигматизирована, и далеко не все готовы о ней слышать».
Победитель хакатона получил 60 тысяч рублей на доработку проекта. Кроме того, организаторы хакатона также помогают команде сформировать и упаковать разработанное решение. И наконец «Теплица социальных технологий»* берет на себя запуск проекта и отслеживание его эффективности.
*Некоммерческая организация, признанная «иностранным агентом»