РАЗРАБОТКА ВЕБ-СЕРВИСА ОБРАБОТКИ ДАННЫХ ИЗ ЭЛЕКТРОННЫХ ОБРАЗОВ ГРАДОСТРОИТЕЛЬНЫХ ПЛАНОВ ЗЕМЕЛЬНЫХ УЧАСТКОВ
Аннотация и ключевые слова
Аннотация (русский):
В статье дано представление о содержании градостроительных планов земельных участков (ГПЗУ), их назначение, а также обоснована актуальность разработки сервиса по автоматическому распознаванию данных из электронного образа документа. Проанализированы существующие сервисы по автоматической обработке документов, а также представлено разработанное авторами техническое решение в виде веб-сервиса для разбора и структурирования электронных образов ГПЗУ. Дано описание структуры и работы веб-сервиса, а также алгоритма преобразования данных, реализованных в решении.

Ключевые слова:
градостроительный план земельных участков, ГПЗУ, автоматическая обработка данных, веб-сервис
Текст

Введение

Основой для строительства и реконструкции объектов капитального строительства является проектная документация. Для ее формирования необходимо иметь представление о территории застройки, существующих зданиях, границах участка и другой информации. Перед началом разработки проекта собираются сведения о территории, на которой возводится здание и формируются в единый документ — градостроительный план земельного участка (ГПЗУ), в котором детально отображаются основные характеристики и параметры территории, ограничения использования земельного участка. В состав градостроительного плана входит информация о местоположении других объектов, находящихся в непосредственной близости как к планируемым объектам нового строительства или реконструкции, так и уже ранее возведенным [1].

Градостроительный план земельного участка выдается в целях обеспечения субъектов градостроительной деятельности информацией, необходимой для архитектурно-строительного проектирования, строительства, реконструкции объектов капитального строительства в границах земельного участка [2]. Это позволяет разработчику проекта верно спланировать возведение объекта капитального строительства и учесть особенности планировки территории. Также в ГПЗУ содержатся актуальные нормативы и многочисленные требования, которые должны учитываться застройщиками при возведении объекта и на основании которых регулируется процесс строительства.


Рис.1. Градостроительный план земельного участка [3,4]

Информация в документе представлена в различном виде и содержит таблицы, чертежи, а также большой объем текстовых данных (рис.1). При работе с такими данными одной из самых больших проблем является процесс их сбора, так как в настоящее время документы преимущественно обрабатываются человеком. Поиск, анализ, структурирование и проверка, полученной информации довольно длительный и трудоемкий процесс.

Вместе с тем, в строительной индустрии автоматизация процессов коснулась практически всех производственных областей: начиная от разработки проектной документации, заканчивая программами, автоматизирующими работу служб снабжения [3]. 

Данный факт подтверждается значительным количеством публикаций, посвященных цифровой трансформации строительной отрасли [5-11] при управлении жизненным циклом объектов капитального строительства. 

При этом стоит отметить, что современные информационные технологии предоставляют широкий спектр методов и инструментов для разработки различных сервисов распознавания и работы с данными электронных образов документов, что позволяет значительно ускорить и упростить работу специалистов, реализовать возможность мониторинга и исправления ошибок, хранить полученную информацию в полном объеме. Необходимость в автоматизации обработки данных Градостроительных планов земельных участков заключается в том, что полученная информация позволяет строить объективную аналитику о застройке территорий в автоматическом режиме, проводить анализ градостроительного потенциала территорий в целях планирования и мониторинга достижения плановых показателей по вводу в эксплуатацию строительных объектов.

Материалы и методы

В настоящее время существует значительное количество программ и сервисов для распознавания и редактирования текстовых документов, таблиц и изображений, требующих извлечения информации. Современные технологические решения позволяют найти и отредактировать текстовые данные из электронных документов, экспортировать файлы, однако они ограничены в скорости обработки данных и объеме загружаемых файлов, некоторые требуют участие человека для настройки системы распознавания. Такие программы обычно используются для сканирования документов, сохранения данных в другом формате, формирования электронной литературы из печатных экземпляров и других операций. Особенность электронных образов Градостроительных планов от большинства других документов состоит в том, что не все содержащиеся в них данные структурированы, это значит, что их нужно не просто извлечь из файла, но и обработать таким образом, чтобы сохранить их целостность. 

Кроме того, после распознавания и обработки данных необходимо упорядочить и хранить полученную информацию. На данный момент доступных решений данной задачи не имеется, однако используя современные средства автоматизации, языки программирования и различные модули по обработке электронных документов — это возможно реализовать. Одним из способов является разработка веб-сервиса. У такого решения есть ряд преимуществ – оператору не нужно устанавливать и обновлять программное обеспечение, что позволяет сократить время при работе с приложением, так как пользователь будет выполнять только предназначенные ему действия. Приложение будет работать одинаково на разных операционных системах и их версиях. Масштабируемость веб-сервисов позволяет добавлять новые методы, такое решение можно интегрировать с другими модулями. 

Результаты

Проведенные исследования позволили выявить основные недостатки существующих решений и разработать веб-сервис, позволяющий производить автоматизированный разбор документов градостроительных планов земельных участков и структурировать результат обработки. Основные элементы данного сервиса: интерфейс (front-end), сервер (back-end) и модуль, который реализует процесс получения и обработки данных из оцифрованных документов ГПЗУ.

Интерфейс разработан на языке TypeScript с использованием фреймворка React. Спроектирован с учетом того, что оператор, который будет использовать сервис может не обладать достаточным пользовательским опытом для того, чтобы разобраться в сложно организованном меню. Для загрузки документов на сервис создана отдельная страница, на которой с помощью менеджера файлов конкретной операционной системы можно использовать данное решение. После загрузки файлов отображается список документов, для которых успешно завершились операции отправки на сервер и чтения данных. Если во время выполнения одного из вышеупомянутых процессов произошла ошибка, в списке данный файл будет помечен флажком красного цвета, а также будет описана причина ошибки. Все файлы обрабатываются во время загрузки на сервер, а, следовательно, после получения ответа об успешно выполненной операции можно в отдельном окне просмотреть результат обработки в виде сформированной таблицы, где каждый столбец — это параметр, прочитанный из документа, а каждая строка – отдельный файл, который был загружен на сервис (рис.2). 

Серверная часть приложения разработана на языке Python с использованием технологии WebSocket. Для создания сервера использован фреймворк FastAPI, который предоставляет удобные инструменты для серверного программирования. Созданы обработчики запросов, которые отвечают за команды: загрузку файлов ГПЗУ, отображение всех файлов и произведение расчета. Одним из ключевых компонентов серверной части приложения является локальная база данных sqlite, в которой хранятся результаты анализа файлов ГПЗУ. Она отлично подходит для локального использования, так как не требует много ресурсов и обеспечивает быстрый доступ к данным.

Для более быстрой передачи информации между интерфейсом пользователя и сервером задействована технология WebSocket, которая позволяет установить двустороннее соединение между веб-браузером и сервером, что обеспечивает обмен данными в режиме реального времени. Это очень важно для приложений, которые требуют постоянного обновления информации на экране. Благодаря технологии WebSocket разработанное приложение может быстро и без задержек передавать информацию между клиентом и сервером, что повышает его эффективность и удобство использования. Также создана swagger документация, по которой можно использовать сервер как API или же создать индивидуальный или более универсальный интерфейс.

 
Рис.2. Пример вывода данных после обработки файла

Модуль, обрабатывающий цифровые копии документов ГПЗУ реализован на языке Python. Работа алгоритма состоит из трех взаимосвязанных этапов: 

На первом этапе алгоритм, используя библиотеку fitz (библиотека, предоставляющая средства просмотра, рендеринга, а также инструменты работы с такими форматами как PDF, XPS, OpenXPS и. т. д.), считывает все текстовые данные, включая таблицы из загруженного документа и сохраняет их в виде строки (тип данных в языке Python позволяющий хранить символы). 

На втором этапе алгоритм использует регулярные выражения. Для каждого параметра имеется отдельное регулярное выражение. Для оптимизации чтения и сопоставления данных регулярным выражениям, были определены в каких разделах документа встречаются конкретные параметры.

Список параметров, которые могут быть обработаны алгоритмом:

 
Рис.3. Список параметров, обрабатываемых алгоритмом

Третий этап работы алгоритма заключается в составлении Python словаря из параметров, выделенных ранее. В случае если все операции по обработке документа были завершены успешно, то результатом работы будет файл в формате JSON и определенными полями данных, в противном случае в данном файле будет содержаться описание и код ошибки. 

Выводы

Градостроительный план земельного участка, необходимый документ для формирования проектной документации, в котором детально отображаются основные характеристики и параметры использования территории, содержатся актуальные нормативы и требования, которые учитываются застройщиками при возведении объекта и на основании которых регулируется процесс строительства. 

Вместе с тем, информация в документах представлена в различном виде, структурирована не в полном объеме, а так как обработкой этих данных занимается оператор, то их сбор и упорядочивание трудозатратны.

В тоже время существует много методов и инструментов для разработки сервисов распознавания и работы с данными электронных документов, что позволяет значительно ускорить и упростить работу специалистов, реализовать возможность мониторинга и исправления ошибок, хранить полученную информацию в полном объеме. 

Автоматизация разбора и упорядочивания информации из ГПЗУ позволит строить объективную аналитику о застройке территорий в автоматическом режиме, проводить анализ градостроительного потенциала территорий в целях планирования и мониторинга достижения плановых показателей по вводу в эксплуатацию строительных объектов. 

Основные этапы обработки информации из электронных документов рассмотрены на примере разработанного веб-сервиса, использование которого позволит:

  • сократить трудозатраты на ручной разбор и внесение информации в информационные системы;
  • повысить качество аналитических данных, предоставляемых для принятия градостроительных решений;
  • обеспечить мониторинг градостроительного потенциала жилищного строительства и планирование резервов.
Список литературы

1. Демид Е.Н. Особенности организации реконструкции промышленных объектов // Международный научный журнал «Символ науки» № 05/2017. C. 191-192.

2. Градостроительный кодекс Российской Федерации от 29.12.2004 N 190-ФЗ (ред. от 19.12.2022) (с изм. и доп., вступ. в силу с 03.02.2023) [Электронный ресурс] URL: http://www.consultant.ru/document/cons_doc_LAW_51040/fb76ce1fdb5356574b298a9dcdafcfc8fc6c937b/ (дата обращения: 18.02.2023)

3. Бондарев М. Градостроительный план земельного участка: подготовка и выдача, документы для получения [Электронный ресурс] URL: https://nedexpert.ru/zemlja/gradostroitelnyj-plan-zemelnogo-uchastka/

4. Гордеева А. Градостроительный план земельного участка: что это такое в строительстве, расшифровка - сроки выдачи, получение ГПЗУ, какие документы нужны [Электронный ресурс] URL: https://avirondevelopment.ru/blog/gradostroitelnyj-plan-zemelnogo-uchastka-chto-eto-takoe-v-stroitelstve-rasshifrovka/

5. Новиков М.А., Беляев А.В., Юдин С.В. Некоторые вопросы создания проектной документации в строительном проектировании //Вестник МГСУ. 2011. № 6/2011. С. 458-459.

6. Адамцевич Л.А., Сорокин И.В., Настычук А.В. Перспективные в условиях цифровой трансформации строительной отрасли технологии индустрии 4.0//Строительство и архитектура. 2022. Т. 10. № 4. С. 101-105.

7. Гинзбург А.В., Адамцевич Л.А., Адамцевич А.О. Строительная отрасль и концепция "Индустрия 4.0": обзор // Вестник МГСУ. 2021. Т. 16. № 7. С. 885-911.

8. Пешков А. В., Матвеева М. В., Безруких О. А., Рогов Д.С. Обеспечение процессов контроля качества на всех этапах жизненного цикла объектов капитального строительства в рамках концепции «Строительство 4.0» // Известия вузов. Инвестиции. Строительство. Недвижимость. 2022. №1 (40).

9. Янцен О.В., Канхва В.С., Гогина Е.С. Управление техническими и технологическими рисками очистных сооружений на всех стадиях жизненного цикла//Биосферная совместимость: человек, регион, технологии. 2022 №1(37). С.97-105.

10. Восковых К. А. Особенности цифровизации в строительной отрасли как важный фактор ее устойчивого развития // Бюллетень науки и практики. 2021. №12.

11. Матвеева М. В., Адегбола А. А.А. К вопросу организации процессов 4D-моделирования и управления ими в строительстве // Известия вузов. Инвестиции. Строительство. Недвижимость. 2022. №2 (41).

12. Пешков В. В., Зданович Н. В. Цифровизация процессов управления реализацией муниципальных программ капитального строительства // Baikal Research Journal. 2022. №3. URL: https://cyberleninka.ru/article/n/tsifrovizatsiya-protsessov-upravleniya-realizatsiey-munitsipalnyh-programm-kapitalnogo-stroitelstva (дата обращения: 05.03.2023).

13. Лапидус А. А. Организационно-технологическая платформа строительства // Вестник МГСУ. 2022. №4. URL: https://cyberleninka.ru/article/n/organizatsionno-tehnologicheskaya-platforma-stroitelstva (дата обращения: 05.03.2023).


Войти или Создать
* Забыли пароль?