РосРоскошь

РосРоскошь

Поиск закупок дорогих машин с помощью текстового анализа проектной документации. Цель данного проекта: автоматически находить закупки дорогих машин стоимостью от 1 000 000 р.

Актуальность проблемы:

  1. Детали гос-закупки (тип автомобиля и количество) находятся в документации, анализировать которую затратно для человека. Так необходимо не путать закупки автомобилей скорой помощи, 10 автомобилей Lada Kalina и одного Toyota Land Cruiser. Согласно проведенному анализу за 2013 г., каждый день появляются заказы автомобилей категории Люкс, оплачиваемые из средств бюджета.

Выполненные задачи проекта:

  1. Поиск контрактов по закупке легковых автомобилей через API ГосЗатраты
  2. Поиск документации по заключенным контрактам через сайт zakupki.gov.ru
  3. Создание статистической модели анализа текстов, способной выделять названия дорогих автомобилей, учитывающей возможные ошибки в написании, русские названия и вариативность лексики названий моделей автомобилей
  4. Анализ проектной документации разных форматов(PDF, Ms Word, Ms Excel, архивы)

Развитие проекта:

Модель можно масштабировать на поиск именных сущностей из других предметных областей

blog comments powered by Disqus

The Clearspending project places information obtained exclusively from official sources.

The editors of Clearspending are not responsible for the publication of inaccurate, incomplete or incorrect data on legal entities, as well as for the disclosure of personal data of individuals in cases where such data are published on official sources.

Requests for correction of such data on the Clearspending website are taken exclusively through the form "Write to us!" And are considered for at least 5 working days.