Разработка методики анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений
Аннотация и ключевые слова
Аннотация (русский):
Введение. Технологии анализа «Больших данных» являются основой развития информационного общества. Хранение и обработка «Больших данных» требует значительных затрат вычислительной мощности, дорогостоящих систем хранения данных. В сфере строительства основным источником «Больших данных» являются технологии «Умного дома» и «Умного города». Разработка методики анализа больших данных, направлена на снижение затрат по эксплуатации элементов инженерного оборудования, своевременное обслуживание, с целью безаварийной эксплуатации. Представленную методику анализа можно распространить на любые элементы оборудования, собирающего данные о своей работе и состоянии. Материалы и методы. Использованы данные из открытых источников. Данные для анализа получены от управляющей компании ООО «Южный». Предметом исследования является шаровый кран с электроприводом. Подготовка и визуализация информации выполнялась при помощи Microsoft Office Excel. Результаты. Разработанная методики анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений, по результатам предварительного анализа показала свою работоспособность. Высокую результативность в задаче выявления бракованных изделий продемонстрировал метод с использованием «Контрольных карт Шухарта». Применение методов кластерного и квалиметрического анализа в несвойственных для них сценариях, позволило предсказать изменение фаз жизненного цикла с приемлемой для задач исследования точностью. Выводы. Методика анализа основана на использовании современных алгоритмов. Сами алгоритмы часто используются в целях обработки больших данных. Научная новизна состоит в подходе к анализу, в котором в отличие от классических схем, где кластерный и квалиметрический методы анализа используются для поиска наилучшего управленческого решения, в данной работе целью анализа, является поиск элементов оборудования близких к изменению фазы жизненного цикла.

Ключевые слова:
большие данные, жизненный цикл, инженерное оборудование, интеллектуальный анализ данных, кластерный анализ, квалиметрия, фазы жизненного цикла, системы прогнозирования, контрольные карты Шухарта
Текст
Текст (PDF): Читать Скачать

Введение

В современной науке достаточно широкое распространение получили подходы, связанные с обработкой, хранением и анализом больших массивов данных. Такое направление, связанное с изменением технологии обработки и анализа данных, с развитием распределенных систем хранения и обработки информации, с уходом от традиционных баз и банков, получил общее наименование «Big Data» (большие данные) [1-3]. Термин «Data Mining», который часто переводится как "Интеллектуальный анализ данных" или "Раскопка данных", описывает систему поиска закономерностей и, возможно, прогнозирования тенденций проявления данных.

Научный интерес к этой области знаний возрастает год от года. В качестве примера можно привести несколько наиболее значимых статей за последние годы: Lu W., «Big data analytics to identify illegal construction waste dumping: A Hong Kong study. »; Zhang, Z. and Xie, X «Towards testing big data analytics software: the essential role of metamorphic testing»; Youssra Riahi, Sara Riahi «Big Data and Big Data Analytics: Concepts, Types and Technologies»; Blazquez, D. and Domenech, J., «Big Data sources and methods for social and economic analyses»; Breed, D.G. and Verster, T., «An empirical investigation of alternative semi-supervised segmentation methodologies.»; Lekhwar, S., Yadav, S. and Singh, A., 2019. Lekhwar, S., Yadav, S. and Singh, A., «Big Data Analytics in Retail» [4-9].

Всё чаще такой подход применяется и в строительстве в связи с дальнейшим развитием цифровых технологий в отрасли «Умного дома» [10-16].

В качестве примера такого подхода рассмотрим методику анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений, которая, в итоге, направлена на снижение издержек при проектировании и реализации систем инженерного оборудования зданий за счёт отказа от многоуровневого дублирования, упрощение работы обслуживающего персонала снижения аварийности в процессе эксплуатации зданий и сооружений. Данное исследование является развитием идей, представленных автором в статье «Predicting the Elements Operation of Buildings’ Engineering Equipment Using the Big Data Analysis Technologies» [17]. 

Материалы и методы

Данные для анализа получены от управляющей компании ООО «Южный», путём оцифровки сведений, содержащихся в рабочих и аварийных журналах. В качестве предмета исследования использовались данные о установленных в жилых домах шаровых кранах с электроприводом, регистрирующих своё текущее состояние и ежедневно отправляющие данные по своему состоянию в управляющую компанию. 
Структура приложения включает шесть основных блоков.

1.База данных, - в блоке хранятся данные необходимые для анализа;
2.Блок «Предварительной оценки», — где с использованием «контрольных карт Шухарта» отделяются данные по бракованным и наиболее удачным устройствам, вышедшим из эксплуатации; 
3.Блок «Эталонная модель стандартная», — где с использованием метода кластерного анализа моделируется динамическая эталонная модель на основе данных, собранных с устройств, вышедших из строя в процессе эксплуатации;
4.Блок «Эталонная модель брак», — где с использованием метода кластерного анализа моделируется динамическая эталонная модель на основе данных, собранных с устройств, вышедших из строя в результате допущенного брака;
5.«Блок предсказания стандартный» — в блоке на основании эталонной модели и исходных данных из первого блока, с использованием квалиметрического и экспертного анализа, прогнозируются сроки выхода изделий из строя и формируются рекомендации сервисным службам для их проверки или замены;
6.«Блок предсказания брак», — в блоке на основании эталонной модели и исходных данных из первого блока, с использованием квалиметрического и экспертного анализа, прогнозируются сроки выхода изделий из строя и формируются рекомендации сервисным службам для их первоочередной проверки или замены. (Рис.1).

 

Рис.1. Структура приложения

Алгоритм работы приложения (Рис. 2):

Внешние данные поступают в логический блок, где проверяется, является ли изделие работающим? Если оно работает, передаём данные в блок прогнозирования. Если устройство не работает, снимаем дампы данных и передаём в следующий логический блок, где с использованием метода «Контрольных карт Шухарта» определяется является ли вышедшее изделие браком [18]. Если устройство вышло из строя штатно, данные передаются в модуль перерасчёта «Эталонной модели стандартной» с использованием метода «Кластерного анализа» [19]. Данные, полученные от работающего изделия, обрабатываются методом «Квалиметрического анализа» с эталоном, полученным в блоке «Эталонная модель стандартная» [20]. Если полученные данные приближаются к эталонной модели, выдаётся рекомендация на проверку состояния устройства, в противном случае никаких действий не предпринимается. Если устройство вышло из строя с показателями, находящимися в области «Брака», данные передаются в модуль перерасчёта «Эталонной модели брак» с использованием метода «Кластерного анализа». Данные, полученные от работающего изделия, обрабатываются методом «Квалиметрического анализа» с эталоном, полученным в блоке «Эталонная модель брак». Если полученные данные приближаются к эталонной модели выдаётся первоочередная рекомендация на проверку состояния устройства, в противном случае никаких действий не предпринимается (Рис.2).

 

Рис.2. Алгоритм работы приложения

Результаты исследования

Расчёты производились на массиве данных, сгенерированном для проверки работоспособности математической модели в приложении Microsoft Excel. Каждый объект описывается набором своих характеристик, называемых параметрами. Параметры могут быть числовыми или нечисловыми. Исходные данные на первоначальном этапе фильтруются с использованием экспертного метода и контрольных карт Шухарта (Рис.3.) Для построения карт были выбраны следующие параметры: наработка часов фактическая, количество включений, количество пропущенной воды. Для построения CL — центральной линии использовали среднее геометрическое значение параметров:

где  —  среднее геометрическое, n — число показателей, а t1×t2×….tn – набор показателей.

Рис.3. Контрольные карты Шухарта

С целью приведения параметров к сопоставимым величинам перед началом анализа используется метод нормализации данных:
           
где tj — нормализованный параметр, 
ti — ненормализованный параметр, 
  — сумма исходных значений параметра t, нуждающегося в нормализации
Для поиска расстояний между объектами в матрице несходства использовалась формула нахождения евклидова расстояния:


где d (x, y) — евклидово расстояние,
m — количество параметров у сравниваемых объектов,
xi, yi — значения параметров [21].
На первом этапе квалиметрического анализа рассчитывается процент ошибки на основании данных из эталонной модели кластерного анализа и показателей:

где q% — величина ошибки в процентах, 
tЭ — эталонное значение параметра, 
i=1…n — диапазон текущих параметров, 
– среднее геометрическое параметров, рассчитывается по формуле

где t — значение параметра для соответствующего устройства.

Параллельно указывается величина ошибки, полученная экспертным методом и все вычисления идут параллельно.

На втором этапе квалиметрического анализа нормализуем данные для анализа, используя следующие формулы:

1. Отклонение от эталонного значения параметра (∆ti):

 где ti — исходный параметр,
 tэ — эталонное значение параметра. 

2. Интегральный показатель качества (Qинт):

где ∆ti — отклонение от эталонного значения параметра, 
q% — величина ошибки в процентах.

На завершающем этапе квалиметрического анализа находим среднее значение по объектам, сортируем их по возрастанию, вычисляем интервалы в полученной последовательности и находим среднее геометрическое интервалов. На основании вычисленной среднегеометрической делим получившуюся последовательность на кластеры. Объединив результаты вычислений, полученных с использованием математического и экспертного методов, получаем итоговую диаграмму с прогнозом (Рис.4) [22].

 
Рис.4. Итоговая диаграмма прогноза

Заключение и обсуждение

Методика анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений основана на использовании современных алгоритмов. Сами алгоритмы часто используются в целях обработки больших данных.

В качестве примера можно привести алгоритмы машинного обучения RFR (Random Forest Regressor), GBC (Gradient Busting Classifier) и GBR (Gradient Busting Regressor) описанные М.Р. Салиховым и Р.А. Юрьевой в статье «Алгоритм прогнозирования состояния оборудования на основе машинного обучения» [23].

Научная новизна состоит в подходе к анализу, в котором в отличие от классических схем, где кластерный и квалиметрический методы анализа используются для поиска наилучшего управленческого решения, в данной работе целью анализа, является поиск элементов оборудования близких к изменению фазы жизненного цикла.

На сегодняшний день исследование находится в активной фазе тестирования методики расчётов. Конечным результатом проведённого исследования будет являться полнофункциональный, гибкий программный комплекс, пригодный как для предприятия, от которого получены исходные данные, так и для любого предприятия строительной сферы, с целью увеличения эффективности обслуживания элементов инженерного оборудования.

Список литературы

1. Форман Д. Много чисел: анализ больших данных с помощью Excel. Альпина Паблишер, Москва, 2016, стр. 464.

2. Прокопец А. Конкурентное программирование на Scala ДМК-Пресс, Москва, 2018 стр.342.

3. Kagan P. Big data sets in construction. E3S Web Conf., International Science Conference SPbWOSCE-2018 “Business Technologies for Sustainable Urban Development”. 2019, Volume 110, Number 3, pages: 80-84, doihttps://doi.org/10.1088/1757-899X/869/2/022004; ; EDN: https://elibrary.ru/LKXHMP

4. Lu W., Big data analytics to identify illegal construction waste dumping: A Hong Kong study. Resources, Conservation and Recycling, 2019. Vol., 141, pp.264-272. https://doi.org/10.1016/j.resconrec.2018.10.039

5. Zhang Z. and Xie X., Towards testing big data analytics software: the essential role of metamorphic testing. Biophysical reviews, 2019, Vol. 11(1), pp.123-125 https://doi.org/10.1007/s12551-019-00500-x

6. Youssra Riahi, Sara Riahi, 2018, Big Data and Big Data Analytics: Concepts, Types and Technologies, International Journal of Research and Engineering. | September-October 2018 |, Vol. 5 No. 9, PP. 524-528 DOI:https://doi.org/10.21276/ijre.2018.5.9.5

7. Blazquez D. and Domenech, J., 2018. Big Data sources and methods for social and economic analyses. Technological Forecasting and Social Change journal, Volume 130, pp. 99--113. https://doi.org/10.1016/j.techfore.2017.07.027

8. Breed D.G. and Verster T., 2019. An empirical investigation of alternative semi-supervised segmentation methodologies. South African Journal of Science, Volume 115, pp. pp.92-98. http://dx.doi.org/10.17159/sajs.2019/5359.

9. Lekhwar S., Yadav S. and Singh, A., Big Data Analytics in Retail. Singapore, Springer, 2019, pp. 469-477. DOIhttps://doi.org/10.1007/978-981-13-1747-7_45.

10. Асаул В.В., Лушников А.С. РЕАЛИЗАЦИЯ ЭЛЕМЕНТОВ ЦИФРОВОЙ ЭКОНОМИКИ В СТРОИТЕЛЬСТВЕ: ОТЕЧЕСТВЕННЫЙ И ЗАРУБЕЖНЫЙ ОПЫТ / Сборник «Экономические проблемы в архитектуре, градостроительстве и инвестиционно-строительной деятельности. Современное состояние и проблемы» - материалы Всероссийской научно-практической конференции членов РААСН, ППС, молодых ученых СПбГАСУ и специалистов инвестиционно-строительной отрасли. Санкт-Петербург, 2019, стр. 89-93. DOIhttps://doi.org/10.17513/vaael.1729.

11. Травуш В.И. Цифровые технологии в строительстве Академия. Архитектура и строительство. 2018, том 3 стр. 107-117. DOIhttps://doi.org/10.22337/2077-9038-2018-3-107-117.; ; EDN: https://elibrary.ru/VJBYXC

12. Травуш В.И. Белостоцкий А.М., Акимов П.А. ЦИФРОВЫЕ ТЕХНОЛОГИИ В СТРОИТЕЛЬСТВЕ: ДЕКЛАРАЦИИ И РЕАЛЬНОСТЬ. ЧАСТЬ 2. ЭКСПЕРИМЕНТАЛЬНЫЕ И ЛОКАЛЬНЫЕ ИССЛЕДОВАНИЯ, ПРОИЗВОДСТВО МАТЕРИАЛОВ, ИЗДЕЛИЙ И КОНСТРУКЦИЙ, МАТЕРИАЛОВЕДЕНИЕ, ЭКОНОМИКА СТРОИТЕЛЬСТВА, ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ / Сборник «Устойчивое развитие региона: архитектура, строительство, транспорт». Материалы 5-й Международной научно-практической конференции Института архитектуры, строительства и транспорта. 2018, С. 25-38.; EDN: https://elibrary.ru/VARTKC

13. Добрынин А.П., Черных К.Ю., Куприяновский В.П., Куприяновский П.В., Синягов С.А. Цифровая экономика - различные пути эффективного применения технологий (BIM, PLM, CAD, IOT, Smart City, BIG DATA и др.) International Журнал открытых информационных технологий, 2016, том 4, выпуск 1, стр. 4-11. DOI:https://doi.org/10.23968/1999-5571-2020-17-2-4-11.

14. Корабельникова С.С., Корабельникова С.К. ЦИФРОВЫЕ ТЕХНОЛОГИИ КАК ЭЛЕМЕНТ СНИЖЕНИЯ РИСКОВ В СТРОИТЕЛЬСТВЕ. Дискуссия. 2019, том 2 (93) С. 18-27. DOI: 24411/2077-7639-2019-10002.; DOI: https://doi.org/10.24411/2077-7639-2018-10002; EDN: https://elibrary.ru/ZSCLCX

15. Лескова Ю.Г. ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ (ЦИФРОВЫХ) ТЕХНОЛОГИЙ В САМОРЕГУЛИРОВАНИИ КАК УСЛОВИЕ РАЗВИТИЯ СТРОИТЕЛЬНОЙ ОТРАСЛИ И ПРАВОВОЕ РЕГУЛИРОВАНИЕ Издательская группа "Юрист". Гражданское право. 2018, том 5 стр. 9-11 DOI:https://doi.org/10.18572/2070-2140-2018-5-9-11.; ; EDN: https://elibrary.ru/XZCIHR

16. Kagan P. The use of digital technologies in building organizational and technological design. E3S Web Conf. 2021, Vol. 263, XXIV International Scientific Conference “Construction the Formation of Living Environment” (FORM-2021), Article Number 04040, https://doi.org/10.1051/e3sconf/202126304040; ; EDN: https://elibrary.ru/NDEWOE

17. Kagan P., Sigitov A. Predicting the Elements Operation of Buildings’ Engineering Equipment Using the Big Data Analysis Technologies. Lecture Notes in Civil Engineering, 2022, 231, стр. 87-93. DOI:https://doi.org/10.1007/978-3-030-96206-7_9.; ; EDN: https://elibrary.ru/UVZAOR

18. Дорофеев М. Практикум использования контрольных карт Шухарта. Электронный ресурс. Электронный журнал Хабр. Публ. от 07.03.2012. - URL: https://habr.com/ru/post/139596/ (дата обращения: апрель 2022). - Текст: электронный.

19. Университет ИТМО. Кластерный анализ - каждому. Электронный ресурс. Электронный журнал Хабр. Публ. от 19.01.2021. - URL: https://habr.com/ru/company/spbifmo/blog/534410/ (дата обращения: апрель 2021). - Текст: электронный

20. Азгальдов Г.Г., Азгальдова Л.А., Количественная оценка качества (Квалиметрия). - М.: Издательство стандартов, 1971, 176 с. - УДК 658.562.003.12 (048) - 5000 экз. - Текст: непосредственный.; EDN: https://elibrary.ru/NSBLCW

21. Дюран Б., Одель П.: Кластерный анализ, «Статистика», Москва (1977).

22. Азгальдов Г.Г., Костин А.В., Садов В.В.: Квалиметрия для всех. «ИнформЗнание», Москва (2012).

23. Салихов М.Р., Юрьева Р.А., Алгоритм прогнозирования состояния оборудования на основе машинного обучения // Изв. Вузов. Приборостроение. 2022. Т. 65, №9. С. 648-655. DOI:https://doi.org/10.17586/0021-3454-2022-65-9-648-655; ; EDN: https://elibrary.ru/FBHJVU


Войти или Создать
* Забыли пароль?