'
Научный журнал «Вестник науки»

Режим работы с 09:00 по 23:00

zhurnal@vestnik-nauki.com

Информационное письмо

  1. Главная
  2. Архив
  3. Вестник науки №12 (69) том 2
  4. Научная статья № 168

Просмотры  16 просмотров

Смирнов Н.С.

  


РАЗРАБОТКА СИСТЕМЫ МОНИТОРИНГА САЙТА ГОСУДАРСТВЕННЫХ ЗАКУПОК С ЦЕЛЬЮ НАХОЖДЕНИЯ ПОТЕНЦИАЛЬНЫХ ЗАКАЗОВ *

  


Аннотация:
в данной работе рассмотрен автоматизированный метод поиска потенциальных клиентов на сайте государственных закупок Российской Федерации. Раскрыты особенности парсинга данных, которые позволяет автоматически собирать данные, в целях ускорения сбора информации и минимизации участия человека в этом процесса.   

Ключевые слова:
парсинг, парсер, система государственных закупок   


В современном мире сбор данных о потенциальных клиентах является ключевой задачей для работы и развития любого бизнеса. Очевидно, что государство является самым крупным клиентом и ежегодно приобретает товары и услуги на десятки триллионов рублей. Преимущественно такие закупки проходят в форме аукциона на электронных торговых площадках, основная из которых - www.zakupki.gov.ru.Данный сайт содержит в себе огромную базу контрактов, которые были или будут реализованы какими-либо сторонними компаниями. Там хранится информация о том, какая организация закупает какие товары и на каких условиях. Владея такими данными, компания может найти будущих покупателей, определить своих конкурентов, понять, по каким ценам продают аналогичное оборудование, изучить характеристики оборудования, которое побеждает в конкурсах, чтобы в дальнейшем предлагать клиенту наиболее выгодные условия сделки. На данный момент существуют всего два варианта получения информации с данного ресурса: ручной сбор данных с сайта государственных закупок и использование сторонних веб-сервисов. Однако они имеют недостатки, такие как:1. затраты огромного количества времени для выполнения этого процесса,2. информация, получаемая такими способами, является недостаточной для дальнейшей работы.Для устранения этих проблем в рамках данного исследования было решено разработать программное обеспечение, называемое парсер, который будет помогать собирать необходимые данные из системы государственных закупок, чтобы находить клиентов из огромного количества завершенных аукционов. При этом данные будут загружаться быстро, а участие человека в их поиске будет минимальным. Глагол "to parse" имеет буквальное значение "разбирать". Парсинг (parsing) представляет собой метод, применяемый для анализа синтаксической структуры текста. Этот метод основан на анализе слов в соответствии с определенной базовой грамматикой, которая подчиняется выбранному языку. Понятие "парсить" подразумевает организацию и сбор информации, доступной на различных веб-ресурсах, с использованием специализированных программ, способных автоматизировать данный процесс.Согласно закону "Об информации, информационных технологиях и о защите информации" и статье 29 Конституции Российской Федерации, парсинг информации является законным, при условии соблюдения требований законодательства. Это означает, что разрешено использовать информацию, находящуюся в открытом доступе и не защищенную авторскими правами, соблюдая законные методы сбора и без ущерба для функционирования сайтов в сети интернет и конкуренции.Однако, запрещены определенные виды действий, включая взлом сайтов для доступа к личным кабинетам пользователей, использование DDOS-атак для создания излишней нагрузки на сайты в результате парсинга, а также копирование авторского контента, включая фотографии с авторскими правами или уникальные тексты с подлинностью, подтвержденной нотариусом.На данный момент информацию сайта государственных закупок можно получить следующими способами.Во-первых, Можно зайти на сайт в ручную, выставить необходимые фильтры и искать информацию самому, но данный способ является крайне не эффективный, так как человеку нужно просматривать каждую страниц на наличие необходимой информации из-за это возникает возможность возникновения ошибок, связанные с человеческим фактором, а также это занимает огромное количество времениВо-вторых, существуют платные ресурсы, которые за определенную сумму предоставят эту информацию, но информация получаемая такими способами, может являться недостаточной для дальнейшей работы.На основании этого было решено разработать алгоритм сбора информации с сайта государственных закупок.Независимо от того на каком языке написан парсер, алгоритм остается примерно одним и тем же:1. Выход в интернет, получение доступа к веб-ресурсу и его скачивание.2. Чтение и обработка информации.3. Представление извлеченных данных в удобном для пользователя виде.В ходе анализа сайта было замечено, что на нем находится очень большое количество информации. В связи с этим нужно было найти универсальное решение для всех страниц контрактов на этом сайте. Так как для получение необходимых данных нужно проходить по различным ссылкам, переключаясь между ними, было решено, что будет удобно считывать их с помощью CSS - селекторов. CSS-селекторы применяются для установки стилей HTML элементов на веб-странице. В данный момент существует огромный выбор CSS-селекторов, которые позволяют точно использовать различные элементы для стилизации. При разработке алгоритма было выявлено, что все необходимые ссылки находятся на одних и тех же css селекторах, следовательно, нужно реализовать считывание с них ссылок, которые подходят под указанный формат и организовать переход на следующую. С помощью данного алгоритма можно написать парсер на любом языке программирования, который позволит собирать данные с сайта с минимальным участием человека, что в разы увеличит скорость сбора информации и уменьшит вероятность возникновения ошибок.Исходя из этого можно сказать, что анализ данных, доступных на сайте государственных закупок, имеет большой потенциал для исследований в области экономики, бизнеса и государственного управления. Понимание динамики рынка через изучение контрактов и тендеров позволяет выявлять тенденции, прогнозировать развитие отраслей, а также определять стратегии конкурентов. Более тщательный анализ данных с этого ресурса может способствовать улучшению процессов государственных закупок, повышению прозрачности и эффективности деятельности организаций, участвующих в госзаказах. Несомненно, использование сайта государственных закупок как инструмента анализа предоставляет уникальные возможности для исследований и практического применения в различных сферах деятельности.   


Полная версия статьи PDF

Номер журнала Вестник науки №12 (69) том 2

  


Ссылка для цитирования:

Смирнов Н.С. РАЗРАБОТКА СИСТЕМЫ МОНИТОРИНГА САЙТА ГОСУДАРСТВЕННЫХ ЗАКУПОК С ЦЕЛЬЮ НАХОЖДЕНИЯ ПОТЕНЦИАЛЬНЫХ ЗАКАЗОВ // Вестник науки №12 (69) том 2. С. 1125 - 1129. 2023 г. ISSN 2712-8849 // Электронный ресурс: https://www.вестник-науки.рф/article/11521 (дата обращения: 19.05.2024 г.)


Альтернативная ссылка латинскими символами: vestnik-nauki.com/article/11521



Нашли грубую ошибку (плагиат, фальсифицированные данные или иные нарушения научно-издательской этики) ?
- напишите письмо в редакцию журнала: zhurnal@vestnik-nauki.com


Вестник науки СМИ ЭЛ № ФС 77 - 84401 © 2023.    16+




* В выпусках журнала могут упоминаться организации (Meta, Facebook, Instagram) в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25 июля 2002 года № 114-ФЗ 'О противодействии экстремистской деятельности' (далее - Федеральный закон 'О противодействии экстремистской деятельности'), или об организации, включенной в опубликованный единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими, без указания на то, что соответствующее общественное объединение или иная организация ликвидированы или их деятельность запрещена.