Применение искусственного интеллекта для мониторинга строительной техники в условиях комплексного освоения и развития территорий

Гаряев Андрей Николаевич; Железнов Максим Максимович; Кудрявцев Александр Александрович; Адамцевич Любовь Андреевна

doi:doi:10.29039/2308-0191-2025-13-3-C0004

Главная / Журналы / Строительство и архитектура / Том 13 Номер 3 / Применение искусственного интеллекта для мониторинга строительной техники в условиях комплексного освоения и развития территорий

Применение искусственного интеллекта для мониторинга строительной техники в условиях комплексного освоения и развития территорий

Отправить рукопись

Цитировать

Цитирований:

ПРИМЕНЕНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ МОНИТОРИНГА СТРОИТЕЛЬНОЙ ТЕХНИКИ В УСЛОВИЯХ КОМПЛЕКСНОГО ОСВОЕНИЯ И РАЗВИТИЯ ТЕРРИТОРИЙ

Журнал: СТРОИТЕЛЬСТВО И АРХИТЕКТУРА Том 13 № 3 , 2025

Рубрики: 2.1.14. УПРАВЛЕНИЕ ЖИЗНЕННЫМ ЦИКЛОМ ОБЪЕКТОВ СТРОИТЕЛЬСТВА (ТЕХНИЧЕСКИЕ НАУКИ)

Гаряев Андрей Николаевич ¹

Железнов Максим Максимович ²

Кудрявцев Александр Александрович ³

Адамцевич Любовь Андреевна ⁴

Информация об авторах и публикации

Авторы:

1. Московский государственный строительный университет (магистр)

Россия

2. Московский государственный строительный университет (Кафедра Информационных систем, технологий и автоматизации в строительстве, Профессор)

Москва, г. Москва и Московская область, Россия

3. Московский Государственный Строительный Университет (кафедра Информационных систем, технологий и автоматизации в строительстве, аспирант)

Россия

4. Московский государственный строительный университет (Кафедра Информационных систем, технологий и автоматизации в строительстве, Доцент)

Россия

Тип:

Статья

DOI:

https://doi.org/10.29039/2308-0191-2025-13-3-C0004

EDN:

https://elibrary.ru/wfsjoy

Номер статьи :

C0004

Статус:

Опубликован

Получено:

16.09.2025

Одобрено:

02.10.2025

Опубликовано:

05.11.2025

Классификаторы:

ВАК 2.1.14 Управление жизненным циклом объектов строительства (Технические науки)
УДК 681.5 Автоматика. Теория, методы расчета и аппаратура систем автоматического управления и регулирования. Техническая кибернетика. Техника автоматизации
ГРНТИ 67.01 Общие вопросы строительства
ББК 308 Монтаж, эксплуатация, ремонт машин и промышленного оборудования

Язык материала:

русский

Ключевые слова:

комплексное развитие территорий, строительная техника, мониторинг парка техники, нейронные сети, CNN

Аннотация и ключевые слова

Аннотация:
В статье рассмотрены методы параллельного выполнения работ и проблемы при их совмещении в строительстве с опорой на теорию очередей. В статье приводятся преимущества использования параллельного метода исполнения работы. Уделено внимание также неопределенности и вариантам снижения риска в процессах параллельного выполнения работ. Рассмотрены варианты запараллеливания неритмичных потоков организации работ и оптимизация аликвотных ритмичных параллельных исполнений. Выделены три уровня организации бизнес-процессов, подлежащих совмещению: макро-, микро- и мезо-уровни. Выделены этапы выполнения работ, доступные для совмещения при реализации строительного проекта.

Ключевые слова:
комплексное развитие территорий, строительная техника, мониторинг парка техники, нейронные сети, CNN

Текст

Введение

Масштаб современных строек, подобных району «Академический» в Екатеринбурге, делает традиционные методы контроля техники малоэффективными, ручной же мониторинг не может справиться с объемами данных и обеспечить оперативность. В связи с этим актуальным становится вопрос применения технологии компьютерного зрения.

Исследование существующих решений [1,2,7] выявило наиболее перспективные архитектуры нейронных сетей, а анализ работ [3-14] позволил составить сбалансированное представление о возможностях и ограничениях этих технологий.

Таким образом, к сильным сторонам нейронных сетей можно отнести возможность выявления сложных неочевидных зависимостей в данных и их обработку, включая работу с зашумленными данными и неполной информацией. При этом в отличие от линейных моделей нейронные сети эффективно моделируют сложные, нелинейные взаимосвязи, а один и тот же класс алгоритмов применим для решения разнородных задач — от классификации изображений до распознавания речи.

В то же время следует учитывать ряд ограничений применения нейронных сетей, к которым относятся следующие:

решения нейронных сетей представляют собой «черный ящик», т.е. их интерпретация остается сложной задачей;
риск переобучения, когда модель точно «предсказывает» результат на уже знакомых данных, но делает ошибки на новых;
процесс обучения требует значительных вычислительных мощностей и времени;
для достижения высокой точности необходимы большие массивы размеченных данных, подготовка которых трудоемка.

Данное исследование фокусируется на преодолении этих ограничений применительно к задаче распознавания строительной техники, а основной целью является идентификация в реальном времени строительных машин, таких как экскаваторы, бульдозеры и краны.

Материалы и методы

В основе исследования лежит анализ видеопотока с камер наблюдения, установленных на строительных площадках. Перед применением моделей использовались методы предобработки и аугментации изображений, которые повышают способность модели к обобщению и ее устойчивость к изменчивым условиям съемки (освещение, ракурс, погода).

Набор данных

Для обучения модели необходимы наборы данных. Наиболее распространенными являются датасеты машин Stanford Cars Dataset и Construction Vehicle Images:

Stanford Cars Dataset содержит 16 185 изображений автомобилей 196 классов (марка, модель, год), однако несмотря на качество данных, набор сфокусирован на легковых автомобилях, что ограничивает его применимость для распознавания строительной спецтехники.
Construction Vehicle Images включает более 20 000 изображений строительной техники, снятых в различных условиях.

Поскольку готовые датасеты не полностью соответствовали задачам проекта, был создан новый, специализированный набор изображений, основой для формирования которого стал датасет Construction Vehicle Images.

Пользовательский датасет, содержащий 18 283 изображения, был разделен на обучающую (16 002), валидационную (1 524) и тестовую (757) выборки.

Выбор нейронной сети

Проведенный сравнительный анализ существующих архитектур нейронных сетей (см. табл. 1) позволил выбрать нейронную сеть, оптимальную для рассматриваемых условий по критериям точности и скорости работы.

Таблица 1

Анализ существующих нейронных сетей

Нейронная сеть	Область применения	Описание	Плюсы/ Минусы
FNN (Feedforward Neural Network)	Различные задачи машинного обучения	Нейронная сеть прямого распространения, где каждый нейрон в одном слое соединен со всеми нейронами в предыдущем и следующем слоях.	+ Гибкость в архитектуре и обучении; - Требует большого объема данных для обучения.
RNN (Recurrent Neural Network)	Обработка последовательных данных	Рекуррентная нейронная сеть, способная обрабатывать последовательные данные с использованием обратной связи, что позволяет учитывать предыдущие состояния.	+ Способность обрабатывать долгосрочные зависимости; - Проблемы с исчезающим/взрывающимся градиентом.
CNN (Convolutional Neural Network)	Обработка изображений и видео	Сверточная нейронная сеть, использующая операции свертки для извлечения пространственных признаков из входных данных.	+ Эффективное извлечение пространственных признаков; - Требует больших объемов данных и вычислительных ресурсов.
DNN (Deep Neural Network)	Различные задачи машинного обучения	Глубокая нейронная сеть с множеством слоев, способная извлекать сложные зависимости из данных.	+ Может обучаться на больших наборах данных и улавливать сложные зависимости; - Требует высоких вычислительных ресурсов и склонна к переобучению.

Для решения задачи распознавания авторы использовали сверточные нейронные сети (CNN), архитектура которых ориентирована под анализ изображений. CNN самостоятельно выделяют ключевые визуальные особенности, что обеспечивает высокую точность классификации.

Методы оценки результатов

Для оценки качества работы нейронных сетей использовались такие метрики, как точность (precision), полнота (recall), достоверность (confidence) и F-мера (F1-score). Метрика precision измеряет долю положительных прогнозов, сделанных моделью, которые действительно являются положительными и вычисляется по формуле (1):

$$P =\frac{TP}{( TP + FP)},$$

(1)

где TP (True Positive) — количество истинно положительных прогнозов модели, FP (False Positive) — количество ложноположительных прогнозов.

Метрика recall отражает, какую долю положительных объектов модель смогла обнаружить из всех действительно существующих положительных объектов и определяется по формуле (2):

$$R =\frac{TP}{( TP + FN )},$$

(2)

где FN (False Negative) — количество ложноотрицательных прогнозов.

Метрика F-мера (F1-score) позволяет оценить качество модели классификации в машинном обучении и статистической классификации, является гармоническим среднем между точностью и полнотой, характеризуя баланс между ложноположительными и ложноотрицательными ошибками и рассчитывается по формуле (3):

$$F1 =\frac{2×P × R}{(P+R)},$$

(3)

Для проведения комплексной оценки производительности моделей классификации целесообразно также использовать матрицу ошибок (рис.1), которая обеспечивает наглядное распределение прогнозов модели по категориям. Применительно к задаче, рассматриваемой в статье, матрица ошибок количественно характеризует успешные распознавания целевых объектов (TP), ошибочные срабатывания на посторонних объектах (FP), случаи необнаружения строительной техники (FN) и корректное игнорирование фоновых элементов (TN).

Рис. 1. Матрица ошибок

Используемое программное обеспечение и вычислительные ресурсы

Модели разработаны с использованием таких библиотек, как TensorFlow и PyTorch. Обучение проводилось с использованием мощных графических процессоров NVIDIA RTX 3050.

Объект апробации системы

Практическое тестирование и апробация разработанной системы мониторинга строительной техники на основе глубокого обучения были проведены на территории жилого района «Академический» в городе Екатеринбурге. Выбор данного объекта в качестве полигона для испытаний обусловлен тем, что «Академический» представляет собой один из крупнейших в России проектов комплексного развития и освоения территорий с запланированным объемом строительства свыше 2 млн кв. м. жилья, что обеспечило высокую концентрацию и разнообразие строительной техники в рамках одной площадки. Кроме того, реализация проекта ведется непрерывно с одновременным ведением работ на множестве участков, включая жилую застройку, объекты социальной и инженерной инфраструктуры, дорожное строительство, что создает сложную динамичную среду для тестирования устойчивости алгоритмов.

Результаты исследования

Обучение проводилось в течение 10 эпох (epochs). На каждом этапе записывались показатели средней точность (mean Average Precision, mAP) при различных порогах IoU (Intersection over Union). Результаты обучения в течение 10 эпох представлены в Табл. 2.

Таблица 2

Показатели точности по эпохам

Эпоха	mAP50	mAP50-95	Эпоха	mAP50	mAP50-95
1	0.711	0.417	6	0.801	0.65
2	0.705	0.478	7	0.886	0.679
3	0.8	0.563	8	0.904	0.707
4	0.826	0.588	9	0.911	0.72
5	0.853	0.629	10	0.917	0.737

Индекс mAP50 показывает среднюю точность при пороге IoU, равном 0.5, а индекс mAP50-95 показывает среднюю точность при порогах IoU от 0.5 до 0.95. IoU (Intersection over Union) — это индекс пересечения по объединению, также известный как индекс Джакарда, который используется для измерения степени перекрытия двух областей на изображении. IoU вычисляется по формуле (4) как отношение площади пересечения двух областей к площади их объединения:

$$IoU =\frac{S_I}{S},$$

(4)

где S_I— площадь пересечения двух областей, S — площадь объединения двух областей.

Результаты обучения показали, что средняя точность для всех классов превышает 70%.

Была построена кривая Precision-Recall (Рис. 2), которая является графическим представлением взаимосвязи между точностью и полнотой при различных порогах классификации. При этом ось Х – показывает сколько реальных положительных случаев модель правильно идентифицировала, а ось У – сколько предсказанных положительных случаев были действительно правильными.

Рис. 2. Кривая Precision-Recall

Для оценки эффективности модели использована кривая F1-Confidence, которая показывает зависимость F1-меры от достоверности прогнозов модели (Рис. 3).

Рис. 3. Кривая F1-Confidence

Кривая recall-confidence демонстрирует зависимость полноты модели от уровня достоверности прогнозов, что является ключевым фактором при диагностике ее производительности. В идеальном сценарии рост достоверности сопровождается увеличением полноты, что может свидетельствовать о способности модели эффективно идентифицировать положительные примеры при высокой уверенности, но на практике может быть обратная ситуация, когда повышение порога достоверности приводит к снижению полноты, указывая на пропуск значительного числа релевантных объектов.

В представленном исследовании показатели монотонно возрастают с увеличением достоверности до значения в 0.7, после чего отмечается спад, достигающий нулевых значений при достоверности в 0.97 для всех классов (Рис. 4), что свидетельствует о наличии оптимального диапазона достоверности для максимизации полноты модели.

Полученные результаты демонстрируют конкурентноспособную производительность предложенного авторами подхода, т.к. на 10 эпохе обучения модель достигла средней точности в 91%, что прямо указывает на ее высокую эффективность при решении задачи классификации строительной техники. Значение метрики mAP50-95 в 73,7% подтверждает устойчивость алгоритма к вариации порога пересечения, что является критически важным для практического применения.

Вместе с тем исследование характеристик precisson-recall выявило значительное влияние объема тренировочных данных на качество классификации строительных машин. Максимальные показатели precission достигнуты для класса «самосвал», который представлен в датасете больше всего.

Оптимизационный анализ на основе зависимостей F1-confidence и Recall-confidence позволил определить оптимальный порог достоверности, максимизирующий компромисс между точностью и полнотой прогнозов модели.

Таким образом, на основе проведенных экспериментов можно сделать вывод, что использование нейронных сетей, в первую очередь глубоких архитектур, демонстрирует высокую точность в распознавании строительной техники по сравнению с традиционными методами. Практическая апробация разработанной системы мониторинга была успешно проведена на территории жилого района «Академический» (г. Екатеринбург) — одного из крупнейших проектов комплексного развития территорий в России. Также следует отметить, что для достижения наилучших результатов требуются большие объемы размеченных данных и использование методов аугментации данных. Эти факторы повышают стабильность и универсальность модели, особенно в условиях реальных строительных площадок и масштабных проектов, подобных «Академическому».

Заключение

Проведенное исследование позволило сделать следующие ключевые выводы относительно применения глубокого обучения для распознавания строительной техники.

Полученные результаты подтвердили эффективность применения сверточных нейронных сетей, таких как CNN. Установлена важная зависимость между качеством распознавания и объемом информации в обучающей выборке. При этом стоит обратить внимание на методы предобработки изображений для повышения качества модели в изменчивых условиях съемки.

В рамках перспективных направлений дальнейших исследований авторами рассматривается возможность применения архитектур трансформеров и методов обучения на малом количестве данных без потери качества модели.

Список литературы

1. Акинин М.В., Никифоров М.Б., Таганов А.И. Нейросетевые системы искусственного интеллекта в обработке изображений. М.: РИЦ, 2016. 152 с.

2. Барретт Д. Последнее изобретение человечества: Искусственный интеллект и конец эры Homo sapiens. М.: Альпина нон-фикшн, 2015. 304 с.

3. Иванов Н.А., Миннахметова Н.Н. Искусственный интеллект в строительстве: новые возможности для анализа причин несоответствий и повышения качества // Экономика и предпринимательство. 2025. № 6 (179). С. 1179-1182. DOI: https://doi.org/10.34925/EIP.2025.179.6.216; EDN: https://elibrary.ru/NNEBLS

4. Демкин В.И., Луков Д.К. История и перспективы развития нейронных сетей // Вестник современных исследований. 2018. 6.1 (21). C. 366-368. EDN: https://elibrary.ru/XURJSX

5. Джонс М.Т. Программирование искусственного интеллекта в приложениях. Пер. с англ. Осипова А.И. М.: ДМК Пресс, 2018. 311 с.

6. Бизина Е.И., Железнов Е.М., Гришин А.К. Применение технологий искусственного интеллекта для мониторинга строительства с использование беспилотных летательных аппаратов // Строительство и архитектура. 2025. Т. 13. № 2 (47). С. 2. DOI: https://doi.org/10.29039/2308-0191-2025-13-2-2-2; EDN: https://elibrary.ru/CRZWLM

7. Исаков Ю.А. Искусственный интеллект // Современная наука. 2018. 6-1, C. 25-27.

8. Garyaev N., Garyaeva V. Big data technology in construction // E3S Web of Conferences, 2019. 01032. doi:https://doi.org/10.1051/e3sconf/20199701032 EDN: https://elibrary.ru/ACSXEI

9. Каменский Д.П., Гаряев Н.А. Имитационное моделирование и система поддержки принятия решений // Вестник МГСУ, 2011. № 6, C. 359-362. EDN: https://elibrary.ru/OWFSMX

10. Гаряев Н.А., Аюб Ф., Гаряев А.Н. Информационная обработка цифровых моделей зданий для выявления элементов инженерных коммуникаций с истекшим сроком службы // Научно-технический вестник Поволжья. 2022. № 4. C. 57-60. EDN: https://elibrary.ru/OEYFHX

11. Гаряева В.В., Гаряев А.Н. Информационная обработка в автоматизации проектирования строительства с использованием технологии генеративного дизайна // Научно-технический вестник Поволжья. 2022. № 4, C. 61-63. EDN: https://elibrary.ru/RWILTM

12. Гаряев Н.А., Рыбакова А.О. Облачные технологии для взаимодействия в проектировании и строительстве // Вестник строительной техники (БСТ). 2018. № 4 (1004), C. 28-31.

13. Гаряев Н.А., Рыбина А.В. Имитационная модель материально-технического обеспечения строительных объектов // Системные технологии. 2018. 1 (26), C. 142-150. EDN: https://elibrary.ru/UQGHOZ

14. Гранкин С.Л., Гаряев Н.А., Применение вычислительной сети физических объектов // Научное обозрение. 2015. 13, C. 159-162. EDN: https://elibrary.ru/UMLQTV

Контент доступен под лицензией Creative Commons Attribution 4.0 International

Отправить рукопись JATS XML