Программисты из Университета ИТМО в Санкт-Петербурге и Национального университета Сингапура выяснили, что профилирование пользователя сразу по нескольким соцсетям позволяет уточнить его индивидуальные черты. В частности, исследователи сконцентрировались на такой характеристике, как семейное положение, и, объединив данные из Twitter, Instagram и Foursquare, научили алгоритм предсказывать этот параметр с точностью до 86%, что на 17% точнее, чем по одной из соцсетей.
Чтобы алгоритм понимал данные, на которых его будут обучать, ученые превратили активность пользователей из Нью-Йорка, Сингапура и Лондона в наборы, или векторы, из таких параметров, как средний размер твита, наиболее частые объекты на фото, распределение чекинов и так далее. Затем к этим векторам программисты применили базовые модели машинного обучения.
Способы описания личности человека по социальным сетям Ксения Бурая, соавтор статьи, магистрантка кафедры компьютерных технологий и научная сотрудница Международной лаборатории «Компьютерные технологии», исследует в рамках стажировки в Национальном университете Сингапура. Она собирает и анализирует данные пользователей, а затем адаптирует их под шкалу психотипов MBTI (Myers-Briggs Type Indicator), основанную на тезисах Юнга.
Данная шкала характеризует человека с точки зрения того, как он взаимодействует с миром, что, в свою очередь, проще всего узнать из соцсетей.
«Согласно многим научным источникам, психотип человека тесно связан с его семейным положением. Поэтому мы решили проверить, насколько точно сможем предсказать этот параметр, чтобы в будущем использовать его для определения психотипа», — объясняет Ксения Бурая.
Профилирование пользователя, как считает студентка, может быть полезно в широком спектре областей. Например, рекрутеры смогут заранее узнать больше о людях, которые устраиваются на работу. Если говорить глобально, характеристика личности по активности в соцсетях позволит вычислять членов опасных группировок, а также находить людей, склонных к депрессии или самоубийству, и предлагать им своевременную помощь.
Статья ученых прошла в финал студенческой секции, поэтому Ксения Бурая сможет представить трехминутный доклад о своем исследовании.
«Эта конференция — одна из самых уважаемых в своей области, выступление там открывает передо мной значительные перспективы в мире науки. Конечно, и попасть в число докладчиков было непросто: среди десятка отправленных от нашей лаборатории работ прошла только одна», — говорит студентка.
Авторы расценивают доклад на AAAI-17 как своего рода «задел» для дальнейшего исследования, поэтому в их планах продолжить работу, чтобы добиться публикации в рецензируемом международном журнале.
Конференция AAAI по искусственному интеллекту (AAAI Conference on Artificial Intelligence, AAAI-17) проводится в Северной Америке уже 31-й год. За это время мероприятие собрало вокруг себя пул выдающихся ученых и IT-компаний, занимающихся как прикладными, так и теоретическими исследованиями в области создания и обучения ИИ. В этом году на конференции выступят спикеры таких лидеров отрасли, как IBM Research, Baidu, Amazon, Tencent, Microsoft и Facebook.
Источник: Kseniya Buraya, Aleksandr Farseev, Andrey Filchenkov and Tat-Seng Chua (2017), Towards User Personality Profiling from Multiple Social Networks. In Proceedings of the Thirty-First AAAI Conference on Artificial Intelligence. AAAI.