Как работают мошенники
Алгоритм, разработанный студентами Университета ИТМО, является системой поддержки принятия решений для автостраховых компаний и позволяет определить, является ли тот или иной аварийный случай на дороге мошеннической схемой или нет. Сегодня мошенники могут специально подстраивать мелкие или крупные аварии, чтобы заставить «виновника» аварии выплачивать им страховые суммы. Бывает, когда страховую компанию пытается обмануть сам застрахованный, например, когда он поджигает свой автомобиль, инициирует еще какой-то ущерб, чтобы получить выплату.
По данным Российского союза автостраховщиков, в 2016 году ущерб страховых компаний от мошенничества в ОСАГО по всем направлениям мог составлять примерно 40 миллиардов рублей. В эту сумму, конечно, входят и другие виды мошенничества, в том числе подделка документов и другие случаи. С полной статистикой убытков, которые понесли страховые компании в 2016 году, можно ознакомиться здесь.
Как выявляются мошенники? На первом этапе в страховых компаниях проверяются абсолютно все документы, предоставленные вместе с заявлением о выплате, а подозрительные случаи проверяют специальные отделы. Проверяется, не были ли фотографии, предоставленные потерпевшими в ДТП, как-то графически изменены. Также изображение на фотографиях тщательно сверяется с тем, как, по заявлению участников ДТП, произошла авария. Например, на фотографиях может быть одно время суток, а по документам авария произошла в другое время. Некоторые проверки могут учитывать записи с видеорегистраторов, так как классические схемы «автоподстав», то есть инсценированных ДТП, известны сотрудникам служб безопасности страховых компаний.
Кроме того, во внимание могут приниматься и косвенные факторы. Например, в России существуют регионы, в которых происходит больше всего выплат по страховым случаям, что может указывать на то, что в этих регионах действуют больше мошенников. На том же сайте Российского союза автостраховщиков указывается, что высокие выплаты спровоцированы автоюристами, которые выкупают права требования к страховым компаниям у пострадавших в ДТП, а затем обращаются в суд, неправомерно увеличивая сумму реального ущерба. Так, на сегодняшний день к регионам с высокой выплатой относятся: Адыгея, Карачаево-Черкессия, Кабардино-Балкария, Северная Осетия – Алания, Краснодарский и Ставропольский край, Ингушетия, Ивановская, Ростовская, Амурская, Нижегородская и Ульяновская области, Камчатский край и Чеченская Республика.
Как в этом поможет искусственный интеллект
Крупные страховые компании хранят данные о всех страховых случаях, в том числе о случаях с выявленным мошенничеством. Машинное обучение может помочь сформировать в них закономерности. Таким образом, если в компанию будет попадать дело об очередной аварии, информацию о ней можно будет классифицировать по определенным параметрам и с помощью алгоритмов машинного обучения анализировать, насколько эти параметры соответствуют мошеннической схеме. И сейчас такой анализ проводится экспертами страховых компаний, однако здесь есть две проблемы: на это уходят крупные средства, а также присутствует человеческий фактор.
Разработать алгоритм для выявления мошеннических схем с ДТП и предложили участникам RAIF-Challenge 2017. В течение месяца команды могли работать над программой, которую затем представили экспертному жюри из компании-партнера чемпионата «АльфаСтрахование». Для создания алгоритма участники использовали данные, предоставленные компанией, в том числе.
Все команды получили 8,5 тысяч страховых случаев в результате ДТП, из которых 10% были подставными, рассказал капитан команды Университета ИТМО, магистрант Сергей Меньшов (также в состав команды входили Наталия Слепкова и Софья Титова). Таким образом, программисты заранее знали, какие схемы были мошенническими. Их задача была в том, чтобы классифицировать эти схемы, с помощью методов машинного обучения выявить закономерности и свести их к набору параметров, по которым искусственный интеллект сможет определять, является ли страховой случай мошенническим или нет.
Как работает ИИ для автострахования
Команда Университета ИТМО разработала несколько схем классификации. Например, по модели автомобиля. Автомобили были разбиты на более дорогие и все остальные, исходя из предположения, что преступникам выгоднее подстраивать ДТП с более дорогими транспортными средствами. Также магистранты использовали данные о регионах, в которых чаще всего выявляются мошеннические схемы для получения страховых выплат. Были классифицированы и другие признаки: стаж и возраст водителя, давность оформления страховки, цвет автомобиля, время суток ДТП – всего, по словам Сергея Меньшова, около 100 параметров.
«Наша задача состояла и в том, чтобы из этого огромного количества параметров вычленить те, по которым действительно можно определить мошенников. Так, мы выяснили, что цвет машины в таких преступных схемах не играет роль, а вот стаж водителя, который фальсифицирует ДТП, должен быть достаточно высоким – примерно пять лет. То есть мы должны были разработать, в первую очередь, алгоритм для правильной интерпретации данных, чтобы не оказалось так, что человека программа назвала мошенником, а он им не является», – прокомментировал капитан команды Университета ИТМО.
В любом случае, такие алгоритмы не будут играть определяющей роли при оценке «подлинности» ДТП, добавил он, а будут системами поддержки принятия решений. Просто они могут избавить экспертов по расследованию страховых случаев от лишней «механической» работы по первичному анализу и выявлению подозрительных случаев.
Для работы над программой для RAIF-Challenge 2017 магистранты Университета ИТМО использовали нейронную сеть и алгоритм машинного обучения AdaBoost. При разработке алгоритма сложность заключалась в том, что командам было дано очень мало данных о «поддельных» страховых случаях – всего 10% от общей выборки. Остальные случаи касались добропорядочных клиентов. Поэтому в своих выводах команда Университета ИТМО подчеркнула, что для продолжения работы над программой необходимо проанализировать больше информации об «автоподставах» – как минимум пять тысяч случаев мошенничества. Это позволит повысить точность алгоритма.
Итоги конкурса
«Нам было интересно решать задачу именно в области страхования, потому что здесь меньше факторов неопределенности. Нужно было разработать классификацию вполне конкретных параметров. Так, в других направлениях конкурса – “Ритейл” и “Банки” – было очень много факторов, по которым сложно сделать точные выводы, например, в “Ритейле” нужно было предсказать популярность продукта, а в “Банках” – отток клиентов. Кроме того, помогая выявлять мошенников, выполняешь и некоторую социальную миссию», – прокомментировал Сергей Меньшов.
Студенты Университета ИТМО вошли в список призеров конкурса и стали участниками форума RAIF (Российский форум по системам искусственного интеллекта). На форуме молодые специалисты смогли прослушать лекции от экспертов в области машинного обучения, в том числе, из компании «Яндекс», IBM, а также поучаствовать в тематических секции «AI в страховании». Сейчас страховые компании только начинают внедрять системы искусственного интеллекта в свою работу, но анализ баз данных будет расширяться, а системы поддержки принятия решений становиться более точными. Кроме того, компании будут расширять штаты сотрудников, которые занимаются этой проблемой, сообщалось на форуме.
Студенты Университета ИТМО намерены продолжать работать над своим проектом по распознаванию мошенников в страховании.