Видеоигры прочно вошли в современную жизнь: с каждым днем растет количество онлайн и оффлайн продуктов для различных платформ. В свою очередь, их пользователи с каждым днем генерируют все больше данных, которые можно использовать для разработки моделей игрового поведения или для определения персональных особенностей игроков. Это полезно, например, для раннего выявления игровой зависимости, а также для маркетинговых исследований в игровой сфере.
До сих пор все исследования игровых данных проводились вручную на небольших выборках. Однако, чтобы делать статистически значимые выводы, необходимо анализировать большие массивы игровых данных. Ученые из Университета ИТМО и Университета Сингапура одними из первых применили для этого машинное обучение. С помощью собранных ими данных о поведении пользователей игровой платформы Steam и специально разработанной и обученной модели, они смогли на основе игрового поведения предсказывать пол игрока.
Базу данных для анализа исследователи собирали на основе сервиса Player.me, который позволяет сопоставить аккаунты пользователей Steam с их профилями в таких социальных сетях, как Twitter, Facebook и Instagram. На основе этого сравнения исследователи искали связи между данными об игровом поведении и демографическими показателями. В итоге в основу модели легли следующие признаки: потраченное на игру время, полученные игровые достижения, предпочитаемые жанры игр, наличие внутриигровых платежей и т.д.
«Идея моего исследования в том, чтобы использовать игровые данные для изучения поведения человека в реальной жизни. Для этого сейчас пробуют использовать социальные сети, но там люди задумываются о своем поведении, выбирают, что постить, и фильтруют свои мысли. А в играх такого не происходит: там мы ведем себя так, как хотели бы в жизни. И на данном этапе работы мне удалось подтвердить, что игровые данные имеют отношение к реальным характеристикам людей», — отмечает Иван Самборский, аспирант факультета ИТиП.
По словам ученых, анализ игровых данных позволяет оценить интересы, локацию и демографию пользователей, а также учесть, сколько времени человек готов тратить на игры. Исследователи будут работать над улучшением полученной модели, чтобы повысить точность предсказаний о пользователях. Также модель планируют адаптировать для определения игровой зависимости.
«В интернете личность актора неизвестна, и часто нам остается только гадать, кто скрывается за аватаркой колкого комментатора или под ником соратника по клану. Приподнять завесу можно лишь анализируя косвенные признаки — поведение в онлайне. Узнать, кто же находится по ту сторону монитора, важно как гигантам типа Google, которые зарабатывают на рекламе, так и маленьким интернет-магазинам. Важный и интересный вопрос, который при этом встает: а каких данных для этого достаточно? В наших прошлых исследованиях мы использовали тексты, изображения и даже геолокацию. Однако поведение игроков описывается совершенно особым языком проведенных в игре часов и полученных достижений. Наше исследование показало, что даже этой информации хватает, чтобы предсказать пол игрока. Конечно, этим дело не ограничится, но сейчас мы просто показали, что игровое поведение можно анализировать и получать хорошие прогнозные значения. Помимо вездесущей персонализации рекламы, хорошие прогнозные модели можно использовать во многих прикладных исследованиях: социологических, психологических, спортивных и медицинских», — комментирует руководитель группы машинного обучения лаборатории «Компьютерные технологии» Университета ИТМО Андрей Фильченков.