Телеграм-бот для получения статистики участника госзаказа по ИНН

test

26 декабря 2018

Проект КГИ “Госзатраты” разработал телеграм-бота для получения справки об участнике госзаказа: о суммах и количестве контрактов, заказчиках и поставщиках, источниках финансирования и регионах.

Журналистам и участникам госзаказа часто требуется получить данные не о контракте, а об организации-участнике госзаказа. Профили заказчиков и поставщиков, доступные на сайте проекта КГИ “Госзатраты”, позволяют получить информацию о суммах и количествах контрактов, а также исследовать все контракты и контрагентов организации.

Теперь получать информацию можно не только на сайте и с помощью API, но и отправляя запросы телеграм-боту @csParticipantStatsBot. Если отправить ему ИНН организации, то в ответ пользователь получить краткую справку со следующими данными:

  • название и ИНН организации;
  • тип участия в госзаказе (заказчик, поставщик или и то, и другое);
  • количество контрактов, сумма контрактов и период участия в госзаказе;
  • статистика контрактов по ФЗ;
  • количество поставщиков или заказчиков (в зависимости от типа участия) и список самых крупных из них;
  • детализация расходов по бюджетам;
  • статистика по регионам;
  • статистика по годам.

Качество данных, содержащихся в ЕИС в сфере закупок (zakupki.gov.ru), на которых работает проект «Госзатраты», обладает рядом особенностей, которые необходимо учитывать при анализе госзаказа. Они влияют и на результаты выдачи телеграм-бота:

Годы. В базе данных проекта “Госзатраты” представлены в основном контракты, заключенные начиная с 2011 года. Тем не менее, встречаются и контракты, датированные более ранними годами (2001, 2005, даже 1987) или принципиально некорректными значениями (0201, 0211). Мы не исправляем эти значения (это и не всегда возможно, так как корректное значение неизвестно), а оставляем их в том виде, в котором они представлены в источнике. Когда бот подсчитывает, за какой период доступны данные о контрактации участника, он берет за отправную точку самый ранний из полученных годов. Но важно учитывать, что если у участника есть контракты, заключенные ранее 2011 года (и даже если датировка корректна), более ранние контракты представлены в базе лишь фрагментарно.

Подсчеты сумм по подрядчикам. Если бот обнаружил, что запрошенный участник фигурирует в качестве заказчика, то он должен посчитать статистику по тем подрядчикам, с которыми этот заказчик заключал контракты. Для этого он должен посчитать, какова сумма контрактов, заключенных с этими подрядчиками, и как эта сумма соотносится с общей суммой его заказа. Но здесь есть одна проблема, связанная с представлением данных Федеральным Казначейством. Дело в том, что контракт может быть заключен с несколькими подрядчиками. Но нам известна только его общая сумма, а как эта сумма распределяется между подрядчиками, узнать из данных невозможно. Если механически сложить сумму контракта для всех участвовавших в нем подрядчиков, получится заведомо некорректный результат. В связи с этим бот при подсчете статистики по подрядчикам вообще не считает суммы в таких случаях. Мы сочли это допустимым, потому что доля таких контрактов в принципе невелика, то есть на статистику топовых подрядчиков это влияет мало. Но следует учитывать, что в этих подсчетах показательнее процентное соотношение, в то время как абсолютные суммы, полученные подрядчиками, могут быть заниженными.

Подсчеты сумм по регионам. При подсчете статистики по регионам бот учитывает только те случаи, где он может определить регион. В базе есть контракты, в которых регион указан некорректно или не указан вообще. Такие случаи статистикой не учитываются.

Продолжительность сбора данных. Число контрактов у разных участников госзаказа сильно варьируется. У одного участника может быть всего несколько контрактов, у другого - десятки тысяч. Время обработки запроса зависит от того, сколько контрактов заключил искомый участник. При малом числе контрактов (в пределах сотни) запрос обрабатывается за секунды. Если у участника несколько тысяч контрактов, на обработку может уйти 3-4 минуты. На сбор 15 тысяч контрактов может уйти около 10 минут.

Вероятность ожидания при тяжелых запросах. Этот телеграм-бот обрабатывает по одному запросу за раз. Если к нему параллельно поступает несколько запросов, они выстраиваются в очередь и обрабатываются последовательно. При небольших запросах задержка может быть незаметной. Но если новый запрос поступил в тот момент, когда бот собирает информацию по большому числу контрактов, он не может ответить, пока не будет обработан текущий запрос. Поэтому если он принял запрос (сообщение отмечено как прочитанное), но при этом не выдает никакой реакции (уведомлений о том, что запрос взят в обработку), это значит, что он в этот момент занят обработкой более раннего запроса, а на новый ответит после того, как закончит эту обработку.

Источники данных

  • ЕИС в сфере закупок (zakupki.gov.ru)

  • АПИ проекта “Госзатраты” (clearspending.ru)

Вопросы и предложения о работе телеграм-бота можно присылать на почту: [email protected].

Проект Госзатраты размещает информацию, полученную исключительно из официальных источников.

Редакция Госзатрат не несет ответственности за публикацию неточных, неполных или неверных данных о юридических лицах, а также за раскрытие персональных данных физических лиц в случаях, если такие данные опубликованы на официальных источниках.

Запросы на исправление таких данных на сайте Госзатрат принимаются исключительно через форму «Напишите нам!» и рассматриваются не менее 5 рабочих дней.