Обновите браузер
Чтобы сайт работал корректно, обновите ваш браузер Unknown
IN ENGLISH
Название компании, адрес, телефон, сайт, домен, ФИО руководителя, совладельца, доверительного управляющего, ИНН, ОГРН, ОКПО, БИК

Илья МУНЕРМАН, исследовательский центр Интерфакс-ЛАБ, директор

 

Кризис заставляет эффективнее проверять контрагентов, не выходя за рамки прежних бюджетов. Рассмотрим, какие пути для этого существуют. Как интегрировать внутренние и внешние данные? В каких ситуациях могут применяться кастомизированные скоринги? Нужно ли перестраивать модель при поступлении новых подтвержденных данных о контрагенте?

 

Скоринги на публичных данных: сильные и слабые стороны

Преимущества публичных скорингов состоят в следующем. Во-первых, они строятся на данных о генеральной совокупности, а не на небольших выборках, что повышает их предсказательную силу и статистическую значимость (т.е. увеличивается вероятность того, что входящие в модель параметры, например коэффициенты в регрессионной модели, не нулевые). Во-вторых, сбор и обработка огромных массивов данных, как и моделирование, происходят на стороне поставщика таких скорингов, что существенно облегчает оценку контрагентов. В-третьих, публичные данные, как правило, открыты и верифицированы, что обеспечивает доверие как к самим данным, так и к моделям, построенным на них.

Слабая же сторона аналитических моделей, построенных на публичных данных, проявляется в том, что определенная часть факторного пространства по объективным причинам не может быть задействована, поскольку составляет коммерческую тайну или относится к другим чувствительным конфиденциальным сведениям. Однако на своей стороне банк может использовать в том числе и такие данные о своих контрагентах.

 

Что мы знаем о своем контрагенте?

Сегодня СПАРК-Интерфакс изменил алгоритмы учета отраслей: отрасли, наиболее пострадавшие от пандемии, получили новые поправки к скоринговой оценке. Резко возросло влияние факторов, данные по которым обновляются оперативно, в частности данные по платежной дисциплине, онлайн-кассам, исковой нагрузке и т.п.

Индекс платежной дисциплины показывает, насколько вовремя компания или ИП рассчитывается со своими поставщиками. Для этого СПАРК собирает от своих крупных партнеров (поставщиков сферы ЖКХ, телекоммуникационных и транспортных компаний, оптовиков) реальные сведения о своевременности оплаты счетов сотнями тысяч их контрагентов.

На возможное возражение о корректности передачи данных с точки зрения законодательства заметим, что информация о платежах передается в рамках проекта Dun & Bradstreet, которому более 75 лет и который работает более чем в 100 странах. Юридическую и этическую корректность передачи данных ежегодно аудирует PwC.

По опыту предыдущих лет, нарастание неплатежей предсказывало банкротства (которые теперь, правда, под мораторием). Девяносто процентов компаний, которые затем обанкротились, сначала задерживали платежи контрагентам. В то же время влияние отчетности компаний за 2019 г., которую мы увидим в сентябре 2020 г., на реальное положение вещей будет практически незначимым и позволит оценить только некий накопленный резерв прочности перед наступлением текущих событий. Кроме публичных данных, доступных, например, в СПАРК, организации также обладают внутренней информацией, характеризующей различные факторы и историю отношений с контрагентами. Это:

  • платежная дисциплина контрагента (на основе внутренних реестров);
  • наличие просроченной дебиторской задолженности по уже существующим контрактам;
  • при наличии соответствующего согласия — кредитная история контрагента и его ключевых персоналий;
  • наличие претензий к выполнению договорных обязательств;
  • наличие претензий со стороны официальных органов, о которых неизвестно широкому кругу лиц;
  • документы, подтверждающие наличие активов, основных средств, необходимого объема ресурсов;
  • налоговые декларации и выписки со счетов бухгалтерского учета, получаемые непосредственно из бухгалтерских программ.

Все эти (и не только эти) источники корпоративных данных могут сослужить хорошую службу при разработке кастомизированного скоринга, построенного на основе объединения внутренних и внешних данных.

 

Пример

Крупный нефтехимический холдинг построил работу по внедрению системы следующим образом.

На первом этапе для участия в эксперименте были приглашены примерно 2000 контрагентов, которые предоставляли перечисленные выше данные о себе в добровольном порядке. Это привело к формированию простой модели на основе бинарных признаков, которая позволяла скорректировать существующие публичные скоринги контрагента.

На втором этапе, когда количество контрагентов охватило уже около 50% по каждому региону и отрасли, рассчитывался средний уровень показателя, который использовался для сравнения вместе с бинарными признаками. При этом отклонение от среднего или медианы для каждого значимого показателя из предоставленных данных находилось в диапазоне 25–30%.

На третьем этапе, когда объем покрытия системой мониторинга контрагентов приблизился к 100% (тут важно отметить, что система мониторинга не охватывала особо крупные и всемирно известные компании и контрагентов с оборотами ниже критерия существенности), число бинарных признаков стало минимальным, а количественные признаки сравнивались не только со средним значением, но и со средним или модой или медианой по сегменту. В качестве сегментов использовались регион, отрасль, аналогичные компанииконкуренты и другие сегменты, для определения которых была применена кластеризация статистическими методами. Также на третьем этапе появилась возможность использовать шкалирование переменных.

Для расчета поправки на первом и втором этапах использовались простые линейные функции, на третьем — дерево решений.

 

Как интегрировать внутренние и внешние данные

Процесс интеграции внутренних и внешних данных основан на подключении данных из API СПАРК к данным внешних провайдеров и внутренних информационных систем. Этот процесс представляет собой комплекс интеграционных решений и требует существенной проработки с точки зрения как юридической, так и компьютерной безопасности. В отличие от терминального доступа, шлюз СПАРК позволяет выполнять непосредственные запросы к базе данных, минуя интерфейс. Это в гораздо большей степени соответствует современным стандартам бизнес-анализа, так как аналитик может на формальном языке описать запрос, который делался для того, чтобы получить данные, использованные для моделирования. Также можно оперативно отслеживать изменения показателей в режиме онлайн и строить динамические модели, что при наличии только терминального доступа не так просто.

Рассмотрим примеры.

 

Мониторинг дилерской сити, лизингополучателей и клиентов интернет-магазина

Основными потребителями такого подхода к мониторингу контрагентов являются крупные компании, которые предоставляют более мелким компаниям возможность пользоваться своими товарами с отсрочкой платежа. Это могут быть лизинговые компании, предоставляющие технику, транспорт и оборудование, металлургические, нефтехимические компании и др.

Всех этих пользователей систем мониторинга объединяет то, что они хотят обновлять данные о состоянии своего контрагента в режиме онлайн и, несмотря на разные профили своей деятельности, преследуют одну-единственную цель: оперативно мониторить финансовое состояние контрагента, определять текущий кредитный лимит, на который ему можно отгружать продукцию, резервировать нужное количество средств при наступлении неблагоприятных сценариев в работе с контрагентом.

Вторая общая черта этой группы — все они имеют примерно одни и те же наборы данных для кастомизации индекса финансового риска.

Во-первых, это история взаимоотношений с данным контрагентом, которая может быть получена без вовлечения каких-то дополнительных ресурсов или юридических согласований: достаточно только вести самостоятельный учет своевременности оплаты контрагентом выставленных счетов.

Во-вторых, мы можем предложить контрагенту регулярно предоставлять нам отчетность и налоговые декларации и рассчитывать коэффициенты на актуальные даты. На основе деклараций контрагентов и данных, накопленных провайдером услуг по кастомизации, выявляются значительные отклонения показателей, характеризующих налоговые и финансовые риски контрагента, от базисного уровня, в качестве которого выступают среднеотраслевой, среднерегиональный уровни, целевые показатели ФНС России и предыдущий период. Среди показателей рассчитываются совокупное и частное налоговое бремя, финансовые коэффициенты, абсолютные и относительные показатели доходов, расходов, активов и обязательств. Данные показатели позволяют в оперативном режиме выявить опасные отклонения от базисного уровня и рекомендовать либо прекращение отношений с контрагентом, либо запрос у него подробной объясняющей информации доказательственного характера.

В-третьих, мы можем получить согласие на обработку кредитной истории как самого дилера, так и его учредителей и директоров. Данный пункт вызывает самое большое количество дискуссий, так как не все компании (а тем более физические лица) согласны давать согласие на обработку своей кредитной истории. Также возникает техническая и юридическая проблема передачи полученных сведений провайдеру услуг по кастомизации. Возможным решением здесь могут быть скоринги, составленные совместно с бюро кредитных историй (в качестве примера можно привести совместный скоринг СПАРК–ОКБ).

Зачастую в этой группе решений возрастает роль отраслевой и региональной информации. Для ее анализа могут использоваться макроэкономические данные, которые относятся не к конкретной компании, а к отрасли в целом. Тогда их также можно получать в оперативном режиме и обновлять регулярно; это могут быть отраслевые индексы, ставки, доходности облигаций и другие параметры.

 

Расширенный анализ компаний

Несмотря на то, что предыдущий пример охватывает достаточно большой сегмент систем мониторинга, скоринг часто должен подстраиваться под специфические потребности.

В первую очередь такие специфические потребности возникают в отраслях, где присутствуют государственные финансы или высокая толерантность подрядчиков к коррупционным практикам, например в строительстве. В эту группу попадают компании — получатели государственных субсидий (в т.ч. через региональные корпорации развития), стартапы, профинансированные государством, резиденты особых экономических зон и др.

Для мониторинга таких компаний в режиме онлайн добавляется значительное количество требований в самых разных проявлениях их активности. Это и мониторинг прозрачности и эффективности закупочных процедур, и соблюдение процедур комплаенса, так как контрагенты получателей государственных средств не должны быть связаны с лицами, имеющими криминальное прошлое. Но главное — привязка транзакций этих контрагентов к проектному финансированию и ограничению нецелевого использования средств инвесторов.

Для данной группы скоринги играют роль в создании технологий премодерации транзакций, которая в силу определенных причин пока не получила широкого распространения. Представьте себе, что некая компания получила субсидию от корпорации развития региона и собирается направить деньги контрагенту, вызывающему серьезные опасения с точки зрения добросовестности. Очевидно, что разбираться потом, чем руководствовался менеджмент компании, будет гораздо сложнее, чем просто приостановить исполнение платежа и попросить оперативно предоставить объяснения.

Еще одна интересная сфера применения кастомизированных скорингов — это расширенный анализ компаний МСБ. Здесь уже накоплено много решений как со стороны банков, которые их кредитуют, так и со стороны провайдеров вне банковского сектора.

В этой сфере на первое место выходят данные онлайн-касс и транзакционные данные, так как отчетность малого бизнеса зачастую или отсутствует вовсе, или не позволяет рассчитать достаточно коэффициентов; отсутствуют данные об исковой нагрузке компаний (малый бизнес может обрушиться под воздействием всего одного крупного судебного процесса с большой компанией или государством). Важное значение имеет кредитная история и самой компании, и ее учредителей и директоров.

Наконец, непростой, но интересной задачей являются распознавание и анализ франчайзинговых сетей и расчет их параметров, таких как отношение открытых и закрытых франчайзи и их доходности. Важно отметить, что в последнее время многие собственники товарных знаков не заключают прозрачных договоров на их использование. Более того, зачастую широко известный потребителям товарный знак оказывается в собственности офшорной компании. Несмотря на эти сложности, расчет силы бренда на основе открытой информации и экстраполяция успехов или неудач правообладателя на всех лицензиатов являются довольно перспективными методами построения кастомизированных решений. Существуют решения для анализа силы крупных брендов, основанные на получении информации из медиапространства и соцсетей. Однако данные решения теряют свою значимость, если есть количественные критерии. Если мы знаем, сколько денег дал заработать бренд, то зачем нам анализировать его медийный фон?

Расширенный анализ компаний помогает и в тех случаях, когда мы смотрим на компанию с точки зрения работодателя. Это важно и при автоматическом анализе резюме претендентов, и при кредитовании физических лиц, работодатели которых не обслуживаются в банке, и во многих других случаях.

 

Как перестраивается скоринг

Одна из наиболее интересных тем сегодня — это возможность перестройки скоринга по мере поступления новых подтвержденных данных о контрагенте. Основные вопросы, которые при этом возникают:

  • как часто обновляются данные и как часто нужно обновлять скоринговую модель?
  • позволяют ли внутренние данные сделать поправку к скорингу или каждый раз нужно перестраивать модель по-новому?

Выделим два основных способа кастомизации скоринга:

1. Корректировка скоринга с использованием решающих правил:

а) на основе внутренних данных создаем решающие правила (факторы);

б) в зависимости от значения новых факторов находим значения x_i:

x_i = {1, если парам_i ≤ крит_знач_i, иначе 0},

где парам_i — строка отчетности, финансовый коэффициент или иная переменная;

крит_знач_i — критическое значение в зависимости от региона/отрасли;

в) рассчитываем s = SUM(w_i × x_i), где w_i — вес каждого параметра;

г) корректируем публичный скоринг на значение s.

2. Разработка кастомной регрессионной модели:

а) на основе внутренних данных компании рассчитываем регрессионные переменные (факторы);

б) полученные факторы вместе с публичным скорингом используем для создания индивидуальной регрессионной модели. В роли алгоритма могут выступать логистическая регрессия, дерево решений, случайный лес и др.

Первый способ имеет смысл использовать, когда объема внутренних данных не хватает для разработки статистически значимой регрессионной модели, а также при наличии эмпирического опыта и предметных знаний о влиянии тех или иных факторов на риск контрагента.

Второй способ более оптимален при наличии достаточного объема корпоративных данных, так как автоматизированные алгоритмы позволяют избежать когнитивных искажений, присущих экспертным оценкам.

Периодичность обновления скоринговой модели зависит от динамики изменений как макроэкономики, так и взаимоотношений с контрагентами. В целом при стабильной ситуации достаточно перестраивать скоринг раз в два года; в ином случае рекомендуемая частота обновления модели иногда возрастает до ежеквартальной.

Более сложные алгоритмы возникают тогда, когда используется обучение с подкреплением, которое позволяет нам оперативно реагировать на изменения окружающей среды и подстраивать модель под воздействием внешних факторов в режиме реального времени. Для применения таких алгоритмов требуется значительный объем данных, поступающий в режиме реального времени.

 

Как повысить эффективность

В силу того, что большая часть корпоративных знаний о контрагентах является конфиденциальной информацией, их обработка как перед моделированием, так и в рамках промышленного использования готовой модели происходит на стороне компании (в отличие от публичного скоринга). По этой причине на повышении эффективности использования кастомизированного скоринга сказываются имеющиеся ресурсы и внутренняя экспертиза по работе с такими данными.

Первым, достаточно очевидным, решением в такой ситуации является озеро данных. Для создания такого озера нам потребуется:

  • взять все источники внешних данных в режиме онлайн: это может быть API СПАРК, источник макроэкономических индикаторов, API БКИ, провайдер информации о социальном профиле физических лиц, данные онлайн-касс, оперативная ценовая информация и многое другое;
  • совместить их (соблюдая требования безопасности и юридические ограничения на использование персональных данных и данных, составляющих банковскую, налоговую или иную тайну) с данными корпоративной ERP и добавить к этому аналитический сервис для построения модели соответствующей сложности.

Проблема использования озера данных состоит в том, что в него могут попасть не всегда достоверные и легко проверяемые данные. Выходом здесь может быть использование блокчейн-сети. В таком случае за счет создания системы распределенного реестра отправка недостоверных данных в общую сеть не становится невозможной, но становится экономически бессмысленной. В перспективе это приведет к существенному повышению производительности системы, так как сейчас нам приходится за счет довольно сложного моделирования проверять и перепроверять данные, полученные из разных источников, не доверяя абсолютно ни одному из них. Технология распределенного реестра может решить эту проблему, что приведет к удешевлению построения доверительных систем расчетов с контрагентами и позволит заменить хлопотный процесс сбора информации из различных источников с последующей их обработкой методами сложного моделирования на довольно простые скрипты.

Еще одна важная проблема повышения эффективности кастомизированных скоринговых систем — это проблема черного ящика, когда скоринг выдает некое решение, не обосновывая его аналитически. Современный тренд настройки скоринговых моделей состоит в том, чтобы модель умела объяснять пользователю, почему приняла то или иное решение. Это повышает доверие к самому инструменту автоматизации принятия решений и позволяет устранить ошибки, когда модель по каким-то причинам использовала ошибочные данные: например, когда клиент получает отказ по кредиту на основе недостоверных данных, в силу технической ошибки оказавшихся в его кредитной истории.

 

За счет чего возникает экономия

Хотя построенные на публичных данных скоринги сами по себе обладают достаточно высокой предсказательной силой, кастомные модели дают возможность повысить точность оценивания контрагентов и более своевременно получать сигналы о повышенных рисках работы с некоторыми из них. Это позволяет вовремя приостановить взаимодействие и избежать финансового или репутационного ущерба.

Если говорить о масштабах экономии в материальном выражении, то наиболее адекватным критерием здесь может быть удельная стоимость проверки одного контрагента. Если говорить о годовой стоимости мониторинга одного контрагента, включающей стоимость всех используемых данных и регулярной калибровки моделей, то она довольно сильно разнится, однако на основе анализа уже реализованных успешных кейсов можно сказать, что такая стоимость колеблется в диапазоне от 500 до 3500 руб. на одного контрагента. Много это или мало?

Давайте представим себе сотрудника компании, обладающего компетенциями проводить финансовый анализ, рассчитывать кредитные лимиты, анализировать судебные дела и делать из них выводы, проводить комплаенс-процедуры и анализировать закупки. 

Сколько такой специалист может проверить компаний в ручном режиме, даже если данные по ним обновляются не каждый день? Пять или, может быть, десять? Кастомизированные системы скорингов обрабатывают данные десятков тысяч компаний, что дает колоссальную экономию средств.

Сегодня разработка кастомизированнных скорингов важна еще и потому, что даже до кризиса наблюдался заметный рост компаний, действующих в сфере неналогового мошенничества. Теперь же многие даже добросовестные предприниматели для спасения своего бизнеса будут готовы совершать не всегда законные действия в отношении своих контрагентов. Но и когда начнется восстановление экономики, именно скоринговые системы начнут сигнализировать о точках роста, восстановлении компаний и секторов и новых перспективных клиентах.

 

Источник: журнал «Риск менеджмент в кредитной организации»