СИСТЕМА ИНТЕЛЛЕКТУАЛЬНОГО КОНТРОЛЯ ТЕХНИКИ БЕЗОПАСНОСТИ НА СТРОИТЕЛЬНЫХ ОБЪЕКТАХ
Аннотация и ключевые слова
Аннотация (русский):
В данной статье рассматриваются актуальные подходы к использованию технологий компьютерного зрения в задачах обеспечения техники безопасности на строительных объектах. Особое внимание уделяется методам детекции средств индивидуальной защиты, архитектурам нейронных сетей, применяемым для анализа визуальных данных, а также практическим аспектам интеграции таких решений в реальные производственные процессы. Разработана система автоматизированного контроля на базе архитектуры модели искусственного интеллекта YOLOv12. Система предназначена для анализа видеопотока в реальном времени с целью выявления нарушений, связанных с отсутствием средств индивидуальной защиты, в частности строительных касок. В системе реализованы три основных модуля. Модули обработки данных видеосъемки, детекции и классификации нарушений, автоматической генерации отчетов. Обучение модели выполнено на основе реальных видеоданных, что обеспечивает адаптацию к условиям строительной площадки с переменным освещением, перекрытиями объектов и фоновым шумом. Ограничения работы алгоритмов связаны с зонами низкой видимости и частичным перекрыванием объектов. В дальнейшем планируется расширение функционала системы для контроля других видов средств индивидуальной защиты и интеграция с информационными системами управления строительством.

Ключевые слова:
строительная площадка, охрана труда, средства индивидуальной защиты, автоматизация контроля, компьютерное зрение, искусственные нейронные сети, YOLOv12
Текст

Введение

Строительная отрасль традиционно относится к числу наименее безопасных секторов экономики как в Российской Федерации, так и за рубежом. Высокий уровень производственного травматизма в данной сфере обусловлен множеством факторов: сложностью технологических процессов, многообразием задействованных механизмов и оборудования, а также высоким уровнем человеческого участия, особенно на этапах строительных и монтажных работ. Около 6% случаев травматизма напрямую связаны с нарушением требований по использованию средств индивидуальной защиты (СИЗ), включая каски, специальную обувь, страховочные пояса и иные элементы защиты [1]. Основополагающим нормативным актом, определяющим принципы охраны труда в Российской Федерации, выступает Трудовой кодекс РФ. К числу обязательных требований отнесено применение СИЗ. «Обязанность по предоставлению сертифицированных СИЗ возлагается на работодателя, в то время как работник обязан использовать их в установленном порядке. Нарушение этих требований квалифицируется как административное правонарушение».

Действующая система обеспечения техники безопасности на строительных объектах в значительной степени полагается на визуальное наблюдение со стороны инженеров по охране труда, периодические проверки и ручную фиксацию нарушений. Эти методы относятся к трудоёмким, а также значительно зависимым от человеческого фактора, включая субъективность оценок и ограниченность внимания. В последние годы наблюдается активное внедрение цифровых технологий в сферу охраны труда, в том числе искусственного интеллекта и нейросетевых алгоритмов. Наиболее перспективным направлением является применение систем компьютерного зрения для автоматического мониторинга строительных площадок. Исследования показывают, что использование нейросетей позволяет существенно повысить точность и скорость выявления нарушений, а также снизить нагрузку на инспекционный персонал [1, 2].

При автоматизации мониторинга безопасности источником информации могут служить видеозаписи с камер, контролирующих зоны строительной площадки. При этом отмечено, что «одной из наиболее сложных и актуальных задач обработки видеоизображения является проблема выделения и распознавания движущихся объектов при наличии различного рода помех» [3].

Современный уровень развития «компьютерного зрения» позволяет улучшить качество изображения, обрабатывать большие объемы данных, выделять необходимые «зоны внимания» и распознавать их содержимое. Развитие интеллектуальных алгоритмов машинного обучения, в частности методов глубокого обучения, открыло новые возможности для автоматизации задач визуального контроля в режиме реального времени. Такие алгоритмы способны детектировать отсутствие СИЗ на работниках и фиксировать потенциально опасные ситуации. Есть мировой опыт создания и применения различных моделей искусственных нейронных сетей для распознавания объектов.

В [4] для обеспечения безопасности на строительной площадке были разработаны три модели распознавания объектов. Первая модель проверяет, есть ли на площадке строительные рабочие. Вторая модель оценивает риск падения строителей при работе на высоте. Третья модель определяет, правильно ли рабочие надели защитные каски и жилеты.

В [5] предлагается решение на основе компьютерного зрения для идентификации работников в защитных касках и без них, в том числе с SMS-уведомлением менеджера и работника об опасной ситуации.

В программе[2], использующей камеры видеонаблюдения, реализован контроль за наличием защитных касок, размещением работников и использованием рабочего времени на строительной площадке. Также предусмотрена автоматизация функции эскалации тревог при выявлении нарушений техники безопасности.

В «Реестре российского программного обеспечения для строительной отрасли»[3] имеется ряд программных комплексов, использующих интеллектуальный анализ видеопотока изображений. Например, «Видеоинтеллект»[4] — информационно-аналитическая система на базе интеллектуальной платформы видеонаблюдения с использованием систем распознавания лиц на строительной площадке на основе искусственного интеллекта. «Qmonitoring»[5] — платформа на базе искусственного интеллекта, которая при помощи установленных уличных камер может анализировать эффективность работы строителей и спецтехники, анализировать прогресс строительства объекта и предупреждать о чрезвычайных ситуациях. 

Для собственных разработок необходимо определить подходящий метод искусственного интеллекта. В [6] анализируются виды сверточных нейронных сетей для выбора подходящей модели детекции объектов на видеоизображениях. Выбрана модель YOLO v12.

В [7] в качестве средства детекции используется модель YOLO v5, а затем проводится ее последовательная модификация и обучение для повышения скорости обработки данных и точности результатов.

Применение YOLO v5 и v8 для распознавания факторов риска для безопасности позволило добиться точности mAP@50 94,1% и 95,1% соответственно, что указывает на значительный потенциал для улучшения систем управления безопасностью строительства [8].

YOLOv8 был использован для автоматического определения использования защитных касок на строительных площадках, что позволило достичь средней точности обнаружения защитного снаряжения в 78% [9].

Несмотря на то, что сети YOLO предлагают передовые решения для контроля безопасности, сохраняются проблемы, связанные с разнообразием наборов данных и необходимостью непрерывного обучения моделей для адаптации к меняющимся условиям строительства.

Материалы и методы

Исследование сосредоточено на создании системы автоматизированного контроля за соблюдением техники безопасности на строительных площадках. Основное внимание уделено нарушениям, связанным с отсутствием строительных касок — одной из самых частых и в то же время легко идентифицируемых категорий несоблюдения правил охраны труда. Исследование имеет экспериментальный характер с использованием как реальных, так и синтетических данных. Алгоритмы системы интегрированы с нормативно-правовыми и нормативно-техническими документами РФ.  Предполагается, что система будет работать на основе алгоритмов компьютерного зрения, способных в режиме реального времени фиксировать нарушения и классифицировать их с высокой точностью.

Работа охватывает несколько уровней: от анализа нормативной базы до прикладной реализации алгоритма и его испытаний в реальной среде. Последовательность действий определена необходимостью выстроить систему, способную устойчиво функционировать в разнообразных условиях строительного процесса. Цель исследования - создание работоспособного инструмента, способного стать частью реальной системы безопасности на строительной площадке.

В исследовании поставлены следующие задачи:

  • Сформулировать требования к системе, включая состав оборудования, архитектуру программного обеспечения и формат выходных данных.
  • Разработать алгоритм фиксации нарушений, способный интегрироваться с видеопотоком и действовать без задержек, сохраняя при этом интерпретируемость решений.
  • Построить и обучить модель на основе архитектуры YOLOv12, адаптированной под задачи распознавания СИЗ в условиях строительной среды.
  • Провести тестирование системы в реальных условиях, включая многоракурсные съёмки,  оценить точность, надёжность и скорость её работы.

Требования к применению касок сформулированы в «Правилах по охране труда при строительстве, реконструкции и ремонте». Документ устанавливает прямую обязанность всех работников, находящихся на строительной площадке, использовать защитные каски, независимо от характера выполняемых работ. «Контроль за соблюдением требований возлагается на работодателя, предполагая наличие устойчивой и документированной системы мониторинга»[6].

СНиП 12-03-2001 «Безопасность труда в строительстве. Часть 1. Общие требования» устанавливает совокупность технических и организационных мер, направленных на предотвращение производственного травматизма. Нахождение в зонах с риском механического воздействия без защитной каски является недопустимым. Регламентируется обязательность регулярной проверки и оценки состояния охраны труда, включая контроль за использованием СИЗ.

ГОСТ 12.4.087–84 «Каски строительные. Технические условия» устанавливает конструктивные, эргономические и эксплуатационные требования к строительным каскам, включая испытания на ударопрочность, стойкость к температурным воздействиям и проникающим предметам. С позиции задач компьютерного зрения ГОСТ имеет особую значимость, поскольку задаёт детерминированные визуальные характеристики касок (геометрические параметры, допустимые цветовые гаммы), что критично при формировании обучающих выборок и алгоритмов детекции. Стандартизация формы и цветового спектра повышает устойчивость модели к ложным срабатываниям и улучшает интерпретируемость результатов.

СП 12-132-99 «Макеты стандартов предприятий по безопасности труда для организаций строительства, промышленности строительных материалов и жилищно-коммунального хозяйства» представляет собой документ, регулирующий организационно-методические аспекты функционирования систем охраны труда на предприятиях строительного сектора. Типовая форма журнала трёхступенчатого контроля позволяет систематизировать данные о проведённых проверках, зафиксированных нарушениях и мерах их устранения. Журнал может быть легко интегрирован в цифровую инфраструктуру посредством автоматического экспорта данных из видеопотока.

В рамках исследования был проведён целенаправленный анализ современных архитектур глубокого обучения, ориентированных на решение задач детекции объектов в видеопотоках, с акцентом на применимость в условиях строительной среды. Рассматривались как классические модели, зарекомендовавшие себя в академической и прикладной практике (Faster R-CNN, SSD) [10, 11], так и новейшие итерации серии YOLO, включая лёгкие модификации, оптимизированные для устройств с ограниченными вычислительными ресурсами. Особое внимание было уделено архитектуре YOLOv12n, представляющей собой компромисс между вычислительной эффективностью и устойчивостью к типичным артефактам строительной сцены — нестабильному освещению, частичной окклюзии, размытию и климатическим искажениям. За счёт внедрения механизмов зонального внимания и оптимизированной схемы предсказания YOLOv12n[7] демонстрирует высокую производительность в условиях реального времени без критического снижения точности [12].

Для обучения модели YOLOv12n использовались видеопотоки, полученные с реальных строительных площадок. Видеопотоки были преобразованы в последовательность кадров с последующей ручной аннотацией объектов двух классов: «каска» (helmet) и «голова без каски» (no_helmet). Для повышения устойчивости модели к вариациям условий освещения, углов обзора и масштабов объектов применялись методы аугментации данных, включая повороты, изменения яркости, контрастности и добавление шума.

Обучение проводилось на GPU NVIDIA RTX 4050 в среде Python с параметрами: 50 эпох, learning rate 0.001, batch size 16, оптимизатор AdamW. Применялась ранняя остановка при стагнации mAP@50 в течение 10 эпох. Длительность обучения: ~12 часов.

Контроль качества обучения осуществлялся с использованием метрик mAP@50, Precision и Recall, вычисленных на валидационной выборке.

Производительность модели на этапе инференса оценивалась по метрике FPS (кадров в секунду). Графики, иллюстрирующие динамику метрик (mAP@50, Precision, Recall) и функцию потерь модели в процессе обучения, представлены на Рис. 1.

Рис.1. Динамика потерь и метрик по эпохам (составлено авторами)

Полученные значения mAP@50 свидетельствуют о высокой точности модели в задаче детекции объектов, особенно для класса «helmet» (0.928), что указывает на эффективное распознавание касок в условиях строительных площадок. Несколько меньшее значение mAP@50 для класса «no_helmet» (0.890) может быть связано с большей вариабельностью внешнего вида объектов этого класса. Метрики Precision (0.898) и Recall (0.888) демонстрируют сбалансированное соотношение между точностью и полнотой детекции, что подтверждает применимость модели для реальных сценариев.

Представленные графики обучения и результативности подтверждают состоятельность предложенного подхода как с точки зрения точности, так и с позиции производительности.

Результаты

Разработан алгоритм, обеспечивающий обработку потокового видеосигнала в режиме реального времени. Архитектура системы контроля техники безопасности начинается с модуля диагностики видеоканалов: в случае отсутствия сигнала инициируется повторная проверка с последующим уведомлением о неисправности. При подтверждённой работоспособности видеопоток направляется на сервер, где последовательно выполняются процедуры буферизации, стабилизации изображения, подавления шумов и дискретизации по кадровой структуре.

Полученные кадры анализируются с использованием сверточной нейросети на архитектуре YOLO, настроенной на детекцию объектов классов «человек» и «каска» (Рис. 2).

Рис. 2. Визуализация результатов анализа
с цветными ограничивающими рамками
и текстовыми метками

Детекции фильтруются по уровню доверия (≥ 0.7). Далее для каждого идентифицированного человека вычисляется положение головы и расстояние до ближайшей каски. Отсутствие каски в пределах допустимого радиуса интерпретируется как нарушение правил охраны труда. На изображениях человек без каски показан в красной рамке.

Для повышения устойчивости алгоритма к ложноположительным срабатываниям введён механизм сквозной проверки по ряду последовательных кадров. Алгоритм адаптирован к колебаниям параметров видеопотока и различным условиям освещённости.

Система дополнена модулем генерации инцидент-отчётов и функцией оповещения через мессенджер, что обеспечивает интеграцию в реальную эксплуатационную среду (Рис. 3).

Рис. 3. Система интеллектуального контроля техники безопасности

Факт нарушения регистрируется в базе, сопровождается сохранением фрагмента изображения с нарушением и автоматической отправкой уведомления ответственному лицу через мессенджер Telegram. Система формирует агрегированные статистические отчёты на основе накопленных событий, включая суточные и недельные сводки.

Тестирование системы автоматизированного контроля средств индивидуальной защиты проводилось на действующем строительном объекте с использованием данных с 4 камер, установленных под различными углами и в условиях разнообразных фонов. В тестировании участвовали 27 работников с различными типами касок, одеждой и степенью видимости головы.

Система обработала видеоматериалы и корректно идентифицировала 24 из 27 работников, что составляет 88.9% охвата. Отсутствие детекции трёх работников связано с их нахождением в зонах с недостаточной видимостью, что подчеркивает необходимость оптимизации размещения камер и расширения углов обзора.

Из 24 успешно распознанных объектов система верно классифицировала 20 человек как находящихся в защитных касках и 2 — как находящихся без касок. В двух случаях система ошибочно классифицировала сварочный шлем как отсутствие СИЗ головы. С учётом классификационных ошибок точность распознавания наличия защитного головного убора составила 91.7%.

В результате проведённой работы реализован инструментальный комплекс для автоматизированного мониторинга соблюдения требований техники безопасности на строительных объектах. Цель исследования достигнута — разработана и апробирована система, способная функционировать в условиях поточного видеонаблюдения и предоставлять операторам достоверную информацию о нарушениях.

Выводы и обсуждение

Современные технологии автоматизации контроля безопасности на строительной площадке с успехом могут применять искусственный интеллект для детекции нарушений по видеоизображениям производственной ситуации.

Архитектура искусственной нейронной сети YOLOv12n показала устойчивые метрики качества при тестировании на валидационной выборке. Детектирование реализовано с учётом временной устойчивости признаков и пространственного контекста, что позволило снизить долю ложных срабатываний. Точность детекции нарушений должна увеличиваться в процессе эксплуатации и накопления большего количества фактических данных для обучения нейронной сети.

Ограничения применения алгоритмов детекции связано с недостаточной видимостью или перекрыванием объектов. В этом случае необходимо изменить расположение или число видеокамер.

Практическая значимость разработанной системы состоит в автоматизации всего процесса контроля, начиная с анализа кадров видеосъемки и кончая формированием отчетности для журнала контроля техники безопасности.

Применение компьютерного зрения позволяет не только повысить эффективность контроля, но и значительно сократить временные издержки и уровень травматизма на строительных площадках за счёт своевременного реагирования на выявленные риски.

Возможно расширение функционала подсистемы обнаружения нарушений техники безопасности в части наличия у работников всего комплекса средств индивидуальной защиты (перчаток, жилетов, строительной обуви и т.п.).

Автоматизация контроля охраны труда переходит из разряда вспомогательных средств в инструмент производственной безопасности с измеримым воздействием на снижение травматизма. 

 


[1] Статистика травматизма на строительных объектах в Российской Федерации за 2022 год / Министерство труда и социальной защиты РФ. – М.: Минтруд России, 2023. – 45 с.

[2] Общество с ограниченной ответственностью «Техинтегратор» (RU). Система строительной видеоаналитики с использованием технологий искусственного интеллекта. Номер регистрации (свидетельства): 2025610195. Дата регистрации: 09.01.2025.

[3] Реестр российского программного обеспечения для строительной отрасли [Электронный ресурс]. – Режим доступа: https://наш.дом.рф/технологии-информационного-моделирования (дата обращения: 06.05.2025).

[4] Видеонтеллект. Системы предиктивной видеоаналитики объектов [Электронный ресурс]. – Режим доступа: https://videointellect.com (дата обращения: 06.05.2025).

[5] QMonitoring. Система аналитики для мониторинга строительных работ на базе ИИ [Электронный ресурс]. – Режим доступа: https://qmonitoring.ru (дата обращения: 06.05.2025).

[6] О Правилах по охране труда при строительстве, реконструкции и капитальном ремонте: приказ Минтруда России от 11 декабря 2020 г. № 883н // КонсультантПлюс. – URL: https://www.consultant.ru/document/cons_doc_LAW_372506/ (дата обращения: 06.05.2025).

[7] Ultralytics. YOLOv12: модели обнаружения объектов [Электронный ресурс]. – URL: https://docs.ultralytics.com/ru/models/yolo12/#detection-performance-coco-val2017 (дата обращения: 06.05.2025).

Список литературы

1. Левщанов С. В. Применения нейронных сетей для мониторинга техники безопасности на строительных площадках // Вестник науки. 2024. Т. 4. №. 7 (76). С. 247–251. EDN: https://elibrary.ru/WCZIBI

2. Аманаков А., Мырадова А. О., Сердаров Х. Безопасность на строительных площадках // Инновационная наука. 2024. №. 10-2-1. С. 153–154. URL: https://cyberleninka.ru/article/n/bezopasnost-na-stroitelnyh-ploschadkah/viewer (дата обращения: 06.05.2025) EDN: https://elibrary.ru/TIQQGU

3. Токарев В. Л., Абрамов Д. А. Построение системы видеоаналитики // Известия ТулГУ. Технические науки. 2013. Вып. 9. Ч. 1.С. 270–276. EDN: https://elibrary.ru/RVRWST

4. Lee J., Lee S. Construction Site Safety Management: A Computer Vision and Deep Learning Approach // Sensors. 2023. Vol. 23, No. 2. https://doi.org/10.3390/s23020944. EDN: https://elibrary.ru/ASIIWZ

5. Sharjeel Anjum, Syed Farhan Alam Zaidi, Rabia Khalid, Chansik Park. Artificial Intelligence-based Safety Helmet Recognition on Embedded Devices to Enhance Safety Monitoring Process // Buildings. 2025. Vol. 15. 1386. https://doi.org/10.3390/buildings15081386.

6. Мишукова А. С., Мишукова М. С. Сравнение эффективности сверточных моделей нейронных сетей на этапе обучения и детекции объектов // Сборник докладов научно-технической конференции по итогам научно-исследовательских работ студентов института цифровых технологий и моделирования в строительстве НИУ МГСУ (г. Москва, 24–28 февраля 2025 г.). Москва : Издательство МИСИ – МГСУ, 2025. С. 354–357. URL: https://mgsu.ru/resources/izdatelskaya-deyatelnost/izdaniya/izdaniya-otkr-dostupa/

7. Han K., Zeng X. Deep Learning-Based Workers Safety Helmet Wearing Detection on Construction Sites Using Multi-Scale Features // IEEE Access. 2022. Vol. 10. pp. 718–729. https://doi.org/10.1109/access.2021.3138407 (дата обращения: 06.05.2025). EDN: https://elibrary.ru/FTDAXE

8. Kim, K., Kim, K., & Jeong, S.Application of YOLO v5 and v8 for Recognition of Safety Risk Factors at Construction Sites. Sustainability. (2023). https://doi.org/10.3390/su152015179 (дата обращения: 06.05.2025).

9. Fatkhin, N., & Fadjeri, A.Pembelajaran Mesin Untuk Deteksi Helm Keselamatan Menggunakan Algoritma YOLOv8. Jurnal Ilmiah Sinus, 22(2), 77. (2024) https://doi.org/10.30646/sinus.v22i2.843 (дата обращения: 06.05.2025)

10. Girshick R. Fast R-CNN // Proceedings of the IEEE International Conference on Computer Vision. 2015. pp. 1440–1448.https://doi.org/10.1109/ICCV.2015.169

11. Liu W. et al. SSD: Single Shot MultiBox Detector // Computer Vision – ECCV 2016: 14th European Conference, Amsterdam, The Netherlands, October 11–14, 2016, Proceedings, Part I 14. Springer International Publishing, 2016. pp. 21–37.

12. Tian Y., Ye Q., Doermann D. YOLOv12: Attention-centric real-time object detectors // arXiv preprint arXiv:2502.12524. 2025. URL: https://arxiv.org/abs/2502.12524 (дата обращения: 06.05.2025).


Войти или Создать
* Забыли пароль?