На конференции звучали доклады по пяти направлениям: eSociety (взаимодействие современных технологий и общественно-политических институтов), eCity, eHealth, eKnowledge и eScience. В рамках последнего направления обсуждались в том числе проблемы высокопроизводительных вычислений и BigData. Ричард Битч, Инесса Коллиер и Юрий Липунцов представили результаты своей работы по использованию глобального идентификатора финансовых инструментов FIGI (Financial Instrument Global Identifier) для информационной модели межведомственного взаимодействия. Предложенная система поможет упростить обмен информацией в мировом финансовом секторе. Но зачем это нужно и кто от этого выиграет?
Для начала определим, что такое идентификаторы. Когда между двумя игроками финансового рынка совершается какая-то сделка (например, один банк продает ценные бумаги другому банку), они используют специальные обозначения ценных бумаг. Эти обозначения и есть идентификаторы. Для чего они нужны? Чтобы оба участника сделки были уверены в том, какую именно сделку они совершают и что является ее объектом. Для международных финансовых инструментов существуют коды ISIN. Данные коды применяются для совершения расчетов после заключения сделок между участниками рынка, особенно в международной сфере. Правила присвоения ISIN-кодов описаны международной организацией по стандартизации International Organization for Standardization. Стандарт определяет порядок присвоения ISIN различным видам финансовых инструментов, а также список организаций, которые могут присваивать эти коды.
Казалось бы, все просто: есть код – пользуйтесь. Но дело в том, что существуют и национальные идентификаторы, и идентификаторы внутри компаний, что нередко приводит к путанице. Два банка хотят купить или продать акции какой-либо организации, выставленные на торги на Московской бирже. При этом один банк находится во Франции, а другой – в Великобритании. При совершении сделок купли-продажи их торговые системы отправляют электронный запрос в системы биржи, используя тикер (краткое название в биржевой информации котируемых инструментов (акций, облигаций, индексов) – прим. редакции), присвоенный данной акции на Московской бирже. Однако в своих внутренних базах данных они используют внутренние идентификаторы, то есть коды, созданные самим банком. Далее, после заключения сделки, необходимо провести расчетные операции через центральный депозитарий, что требует использование национальных идентификаторов (в России они отсутствуют, но являются обязательными во многих других странах). Но, поскольку это международная сделка, расчет проводится через международный депозитарий, для чего необходимы международные коды ISIN. Таким образом, на каждой бирже или торговой площадке, в каждом банке или другой финансовой организации есть свои идентификаторы.
Ситуация усложняется, когда коды ISIN и многие национальные коды изменяются из-за различных корпоративных действий – например, при слиянии и поглощении компаний, изменении названия или перемещении юридического адреса из одной страны в другую. Поэтому может возникнуть и такая ситуация, когда тот или иной участник сделки совершает финансовую операцию по обновленным идентификаторам, а второй участник такое обновление не сделал. В результате сделка срывается. Таким образом, существующие системы идентификации, хотя и имеющие свою роль в процессах международных расчетов, оказываются недостаточными для автоматизированных процессов. Более того, сейчас финансовых данных становится все больше и больше, и бизнес начинает понимать, что старые системы хранения и обработки информации становятся неэффективными и даже убыточными.
«У крупных финансовых компаний есть огромные инжиниринговые отделы, которые поддерживают отделы, занимающиеся обработкой данных. И пока эти отделы в большинстве своем работают с реляционными или структурированными базами данных. Семантические технологии предлагают совсем иной метод работы: с их помощью информация хранится и обрабатывается другим способом. Да, все, что можно делать с помощью семантических технологий, можно делать и с помощью баз данных. Но проблема в том, что базы данных не обладают таким функционалом, как семантические технологии. Кроме того, с помощью них обработка происходит в разы медленнее и требует больше ресурсов», – пояснил Ричард Битч.
Он добавил, что сегодня правительства разных стран, в том числе США, европейских и азиатских государств, требуют большей прозрачности от компаний по финансовым операциям, которые связаны с использованием Big Data. Проблема заключается в том, что такие данные очень быстро меняются, и, чтобы предоставлять правильные отчеты, компаниям необходимо увеличивать ресурсы на переработку информации. А это невыгодно. Поэтому финансовые организации постепенно внедряют семантические технологии.
В чем же отличие семантических технологий от баз данных? Главное отличие: семантические технологии не используют математические методы для описания данных и установления связей между ними. Для этого используются метаданные, то есть данные, которые описывают другие данные. Семантические данные представляют собой связанную между собой информацию, которая записывается в форме так называемого триплета «подлежащее-сказуемое-дополнение». Подлежащее – это объект, дополнение – это другой объект, который связывается с первым при помощи какого-либо семантического отношения (сказуемого). Например, фраза «перевод сделан на счет» имеет два объекта, которые связаны между собой определенной семантической связью. Семантические связи строятся с помощью онтологий. Это документ или файл, формально задающий отношения между терминами (концептами), то есть объектами семантических связей. При этом некоторые связи создаются автоматически на основе предоставленных определений. Но здесь важно учитывать, что значения терминов должны оставаться неизменными и задаваться человеком, настраивающим семантическую сеть.
Как это можно применить в финансовом секторе? Используя семантические технологии, участники рынка понимают семантически отношения между различными финансовыми понятиями: финансовыми инструментами и их взаимосвязями между собой, а также их связями с эмитентами. Для установления этих связей существуют различные онтологии, используемые участниками рынка. Одной из таких онтологий является Financial Industry Business Ontology (FIBO) – своеобразный «словарик» формальных отношений между объектами семантических связей в сфере финансов. FIBO была совместно разработана ассоциацией Enterprise Data Management Council и международной некоммерческой организацией Object Management Group, которая занимается стандартизацией в технических отраслях.
Организация Object Management Group также разработала систему уникальных идентификаторов FIGI, которая соотносится с онтологией FIBO. Стандарт FIGI – это 12-значный буквенно-цифровой код, генерируемый по случайному принципу, но включающий контрольное значение в конце кода. Коды FIGI не изменяются вследствие корпоративных действий компании, то есть являются стабильными. Данное свойство очень важно для поддержания баз данных и автоматизированных процессов.
«FIGI не просто является идентификатором, но помогает понять, как происходит идентификация. Целью создания кода FIGI не является замена всех других кодов; вместо этого он помогает понять, как эти коды взаимосвязаны между собой. Например, как можно указать определенную торговую площадку, на которой торгуется некий финансовый инструмент. Для этого может быть использована комбинация ISIN+MIC (иногда ISIN+MIC+CUR). Но с точки зрения управления данными использование одного кода обеспечит более высокое качество данных и снизит количество вероятных ошибок. Можно вместо этого использовать тикер. Но тогда необходимо поддерживать систему перекрестных ссылок, что создает определенные трудности, когда тикер меняется. Вместо этого, при использовании кода FIGI остальные идентификаторы, то есть тикер, ISIN, MIC и CFI, могут сохраняться в полях метаданных, что обеспечивает структурированность взаимосвязей», – прокомментировала Инесса Коллиер.
С помощью FIGI можно также существенно повысить эффективность анализа данных наряду с использованием традиционных методов. Например, можно анализировать возможные риски. Эксперты Bloomberg и МГУ представили на конференции работу, которая как раз опирается на использование идентификаторов FIGI. Уже существует более 400 миллионов кодов FIGI для различных финансовых активов, и это число постоянно растет.
«На конференции мы также хотели показать, как FIGI может работать, и обеспечить государство, академическую среду и сообщество финансистов некой “дорожной картой”, показывающей, как создать систему, в которой можно беспрепятственно обмениваться финансовыми данными», – подчеркнула Инесса Коллиер.
Внедрение единой системы идентификаторов может также содействовать развитию технологии Blockchain. Блокчейн – это система «доверительных» сделок, в которой информация обрабатывается децентрализованным образом и в масштабе времени, близком к реальному. В ней о любой сделке знают все заинтересованные актеры. Система контролируется самими участниками и, таким образом, нивелирует значение нотариального заверения ценных бумаг и финансовых операций. Однако блокчейн как интернет-система предполагает высокую скорость проводимых в ней операций. А это невозможно, если игроки финансового рынка по-прежнему будут использовать разные идентификаторы, добавила Инесса Коллиер.
«До того, как был разработан код FIGI, не было стандарта, который бы служил единым универсальным неизменяющимся идентификатором, который бы безоговорочно указывал бы на один и то же финансовый инструмент в разных банках. Таким образом, когда разные банки хотели совершить сделку между собой, они должны были провести маппинг внутренних идентификаторов к внешним, таким как тикер, ISIN. Это также необходимо при создании отчетности для различных регулирующих организаций. FIGI предоставляет единый идентификатор для всего сообщества финансистов. Это ключевое преимущество», – сказал Ричард Битч.
Доклад Ричарда Битч, Инессы Коллиер и Юрия Липунцова был признан лучшим в своей секции на конференции Digital Transformation & Global Society. Также коллеги из компании с мировым именем отметили, что ищут точки соприкосновения с Университетом ИТМО для дальнейшего сотрудничества, в частности – возможно проведение совместного круглого стола в рамках DTGS-2018.