Разработка методики анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений
Аннотация и ключевые слова
Аннотация (русский):
Введение. Технологии анализа «Больших данных» являются основой развития информационного общества. Хранение и обработка «Больших данных» требует значительных затрат вычислительной мощности, дорогостоящих систем хранения данных. В сфере строительства основным источником «Больших данных» являются технологии «Умного дома» и «Умного города». Разработка методики анализа больших данных, направлена на снижение затрат по эксплуатации элементов инженерного оборудования, своевременное обслуживание, с целью безаварийной эксплуатации. Представленную методику анализа можно распространить на любые элементы оборудования, собирающего данные о своей работе и состоянии. Материалы и методы. Использованы данные из открытых источников. Данные для анализа получены от управляющей компании ООО «Южный». Предметом исследования является шаровый кран с электроприводом. Подготовка и визуализация информации выполнялась при помощи Microsoft Office Excel. Результаты. Разработанная методики анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений, по результатам предварительного анализа показала свою работоспособность. Высокую результативность в задаче выявления бракованных изделий продемонстрировал метод с использованием «Контрольных карт Шухарта». Применение методов кластерного и квалиметрического анализа в несвойственных для них сценариях, позволило предсказать изменение фаз жизненного цикла с приемлемой для задач исследования точностью. Выводы. Методика анализа основана на использовании современных алгоритмов. Сами алгоритмы часто используются в целях обработки больших данных. Научная новизна состоит в подходе к анализу, в котором в отличие от классических схем, где кластерный и квалиметрический методы анализа используются для поиска наилучшего управленческого решения, в данной работе целью анализа, является поиск элементов оборудования близких к изменению фазы жизненного цикла.

Ключевые слова:
большие данные, жизненный цикл, инженерное оборудование, интеллектуальный анализ данных, кластерный анализ, квалиметрия, фазы жизненного цикла, системы прогнозирования, контрольные карты Шухарта
Текст
Текст (PDF): Читать Скачать

Введение

В современной науке достаточно широкое распространение получили подходы, связанные с обработкой, хранением и анализом больших массивов данных. Такое направление, связанное с изменением технологии обработки и анализа данных, с развитием распределенных систем хранения и обработки информации, с уходом от традиционных баз и банков, получил общее наименование «Big Data» (большие данные) [1-3]. Термин «Data Mining», который часто переводится как "Интеллектуальный анализ данных" или "Раскопка данных", описывает систему поиска закономерностей и, возможно, прогнозирования тенденций проявления данных.

Научный интерес к этой области знаний возрастает год от года. В качестве примера можно привести несколько наиболее значимых статей за последние годы: Lu W., «Big data analytics to identify illegal construction waste dumping: A Hong Kong study. »; Zhang, Z. and Xie, X «Towards testing big data analytics software: the essential role of metamorphic testing»; Youssra Riahi, Sara Riahi «Big Data and Big Data Analytics: Concepts, Types and Technologies»; Blazquez, D. and Domenech, J., «Big Data sources and methods for social and economic analyses»; Breed, D.G. and Verster, T., «An empirical investigation of alternative semi-supervised segmentation methodologies.»; Lekhwar, S., Yadav, S. and Singh, A., 2019. Lekhwar, S., Yadav, S. and Singh, A., «Big Data Analytics in Retail» [4-9].

Всё чаще такой подход применяется и в строительстве в связи с дальнейшим развитием цифровых технологий в отрасли «Умного дома» [10-16].

В качестве примера такого подхода рассмотрим методику анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений, которая, в итоге, направлена на снижение издержек при проектировании и реализации систем инженерного оборудования зданий за счёт отказа от многоуровневого дублирования, упрощение работы обслуживающего персонала снижения аварийности в процессе эксплуатации зданий и сооружений. Данное исследование является развитием идей, представленных автором в статье «Predicting the Elements Operation of Buildings’ Engineering Equipment Using the Big Data Analysis Technologies» [17]. 

Материалы и методы

Данные для анализа получены от управляющей компании ООО «Южный», путём оцифровки сведений, содержащихся в рабочих и аварийных журналах. В качестве предмета исследования использовались данные о установленных в жилых домах шаровых кранах с электроприводом, регистрирующих своё текущее состояние и ежедневно отправляющие данные по своему состоянию в управляющую компанию. 
Структура приложения включает шесть основных блоков.

1.База данных, - в блоке хранятся данные необходимые для анализа;
2.Блок «Предварительной оценки», — где с использованием «контрольных карт Шухарта» отделяются данные по бракованным и наиболее удачным устройствам, вышедшим из эксплуатации; 
3.Блок «Эталонная модель стандартная», — где с использованием метода кластерного анализа моделируется динамическая эталонная модель на основе данных, собранных с устройств, вышедших из строя в процессе эксплуатации;
4.Блок «Эталонная модель брак», — где с использованием метода кластерного анализа моделируется динамическая эталонная модель на основе данных, собранных с устройств, вышедших из строя в результате допущенного брака;
5.«Блок предсказания стандартный» — в блоке на основании эталонной модели и исходных данных из первого блока, с использованием квалиметрического и экспертного анализа, прогнозируются сроки выхода изделий из строя и формируются рекомендации сервисным службам для их проверки или замены;
6.«Блок предсказания брак», — в блоке на основании эталонной модели и исходных данных из первого блока, с использованием квалиметрического и экспертного анализа, прогнозируются сроки выхода изделий из строя и формируются рекомендации сервисным службам для их первоочередной проверки или замены. (Рис.1).

 

Рис.1. Структура приложения

Алгоритм работы приложения (Рис. 2):

Внешние данные поступают в логический блок, где проверяется, является ли изделие работающим? Если оно работает, передаём данные в блок прогнозирования. Если устройство не работает, снимаем дампы данных и передаём в следующий логический блок, где с использованием метода «Контрольных карт Шухарта» определяется является ли вышедшее изделие браком [18]. Если устройство вышло из строя штатно, данные передаются в модуль перерасчёта «Эталонной модели стандартной» с использованием метода «Кластерного анализа» [19]. Данные, полученные от работающего изделия, обрабатываются методом «Квалиметрического анализа» с эталоном, полученным в блоке «Эталонная модель стандартная» [20]. Если полученные данные приближаются к эталонной модели, выдаётся рекомендация на проверку состояния устройства, в противном случае никаких действий не предпринимается. Если устройство вышло из строя с показателями, находящимися в области «Брака», данные передаются в модуль перерасчёта «Эталонной модели брак» с использованием метода «Кластерного анализа». Данные, полученные от работающего изделия, обрабатываются методом «Квалиметрического анализа» с эталоном, полученным в блоке «Эталонная модель брак». Если полученные данные приближаются к эталонной модели выдаётся первоочередная рекомендация на проверку состояния устройства, в противном случае никаких действий не предпринимается (Рис.2).

 

Рис.2. Алгоритм работы приложения

Результаты исследования

Расчёты производились на массиве данных, сгенерированном для проверки работоспособности математической модели в приложении Microsoft Excel. Каждый объект описывается набором своих характеристик, называемых параметрами. Параметры могут быть числовыми или нечисловыми. Исходные данные на первоначальном этапе фильтруются с использованием экспертного метода и контрольных карт Шухарта (Рис.3.) Для построения карт были выбраны следующие параметры: наработка часов фактическая, количество включений, количество пропущенной воды. Для построения CL — центральной линии использовали среднее геометрическое значение параметров:

где  —  среднее геометрическое, n — число показателей, а t1×t2×….tn – набор показателей.

Рис.3. Контрольные карты Шухарта

С целью приведения параметров к сопоставимым величинам перед началом анализа используется метод нормализации данных:
           
где tj — нормализованный параметр, 
ti — ненормализованный параметр, 
  — сумма исходных значений параметра t, нуждающегося в нормализации
Для поиска расстояний между объектами в матрице несходства использовалась формула нахождения евклидова расстояния:


где d (x, y) — евклидово расстояние,
m — количество параметров у сравниваемых объектов,
xi, yi — значения параметров [21].
На первом этапе квалиметрического анализа рассчитывается процент ошибки на основании данных из эталонной модели кластерного анализа и показателей:

где q% — величина ошибки в процентах, 
tЭ — эталонное значение параметра, 
i=1…n — диапазон текущих параметров, 
– среднее геометрическое параметров, рассчитывается по формуле

где t — значение параметра для соответствующего устройства.

Параллельно указывается величина ошибки, полученная экспертным методом и все вычисления идут параллельно.

На втором этапе квалиметрического анализа нормализуем данные для анализа, используя следующие формулы:

1. Отклонение от эталонного значения параметра (∆ti):

 где ti — исходный параметр,
 tэ — эталонное значение параметра. 

2. Интегральный показатель качества (Qинт):

где ∆ti — отклонение от эталонного значения параметра, 
q% — величина ошибки в процентах.

На завершающем этапе квалиметрического анализа находим среднее значение по объектам, сортируем их по возрастанию, вычисляем интервалы в полученной последовательности и находим среднее геометрическое интервалов. На основании вычисленной среднегеометрической делим получившуюся последовательность на кластеры. Объединив результаты вычислений, полученных с использованием математического и экспертного методов, получаем итоговую диаграмму с прогнозом (Рис.4) [22].

 
Рис.4. Итоговая диаграмма прогноза

Заключение и обсуждение

Методика анализа больших данных с целью предсказания изменения фаз жизненного цикла элементов инженерного оборудования зданий и сооружений основана на использовании современных алгоритмов. Сами алгоритмы часто используются в целях обработки больших данных.

В качестве примера можно привести алгоритмы машинного обучения RFR (Random Forest Regressor), GBC (Gradient Busting Classifier) и GBR (Gradient Busting Regressor) описанные М.Р. Салиховым и Р.А. Юрьевой в статье «Алгоритм прогнозирования состояния оборудования на основе машинного обучения» [23].

Научная новизна состоит в подходе к анализу, в котором в отличие от классических схем, где кластерный и квалиметрический методы анализа используются для поиска наилучшего управленческого решения, в данной работе целью анализа, является поиск элементов оборудования близких к изменению фазы жизненного цикла.

На сегодняшний день исследование находится в активной фазе тестирования методики расчётов. Конечным результатом проведённого исследования будет являться полнофункциональный, гибкий программный комплекс, пригодный как для предприятия, от которого получены исходные данные, так и для любого предприятия строительной сферы, с целью увеличения эффективности обслуживания элементов инженерного оборудования.

Список литературы

1. Форман Д. Много чисел: анализ больших данных с помощью Excel. Альпина Паблишер, Москва, 2016, стр. 464.

2. Прокопец А. Конкурентное программирование на Scala ДМК-Пресс, Москва, 2018 стр.342.

3. Kagan P. Big data sets in construction. E3S Web Conf., International Science Conference SPbWOSCE-2018 “Business Technologies for Sustainable Urban Development”. 2019, Volume 110, Number 3, pages: 80-84, doihttps://doi.org/10.1088/1757-899X/869/2/022004

4. Lu W., Big data analytics to identify illegal construction waste dumping: A Hong Kong study. Resources, Conservation and Recycling, 2019. Vol., 141, pp.264-272. https://doi.org/10.1016/j.resconrec.2018.10.039

5. Zhang Z. and Xie X., Towards testing big data analytics software: the essential role of metamorphic testing. Biophysical reviews, 2019, Vol. 11(1), pp.123-125 https://doi.org/10.1007/s12551-019-00500-x

6. Youssra Riahi, Sara Riahi, 2018, Big Data and Big Data Analytics: Concepts, Types and Technologies, International Journal of Research and Engineering. | September-October 2018 |, Vol. 5 No. 9, PP. 524-528 DOI:https://doi.org/10.21276/ijre.2018.5.9.5

7. Blazquez D. and Domenech, J., 2018. Big Data sources and methods for social and economic analyses. Technological Forecasting and Social Change journal, Volume 130, pp. 99--113. https://doi.org/10.1016/j.techfore.2017.07.027

8. Breed D.G. and Verster T., 2019. An empirical investigation of alternative semi-supervised segmentation methodologies. South African Journal of Science, Volume 115, pp. pp.92-98. http://dx.doi.org/10.17159/sajs.2019/5359.

9. Lekhwar S., Yadav S. and Singh, A., Big Data Analytics in Retail. Singapore, Springer, 2019, pp. 469-477. DOIhttps://doi.org/10.1007/978-981-13-1747-7_45.

10. Асаул В.В., Лушников А.С. РЕАЛИЗАЦИЯ ЭЛЕМЕНТОВ ЦИФРОВОЙ ЭКОНОМИКИ В СТРОИТЕЛЬСТВЕ: ОТЕЧЕСТВЕННЫЙ И ЗАРУБЕЖНЫЙ ОПЫТ / Сборник «Экономические проблемы в архитектуре, градостроительстве и инвестиционно-строительной деятельности. Современное состояние и проблемы» - материалы Всероссийской научно-практической конференции членов РААСН, ППС, молодых ученых СПбГАСУ и специалистов инвестиционно-строительной отрасли. Санкт-Петербург, 2019, стр. 89-93. DOIhttps://doi.org/10.17513/vaael.1729.

11. Травуш В.И. Цифровые технологии в строительстве Академия. Архитектура и строительство. 2018, том 3 стр. 107-117. DOIhttps://doi.org/10.22337/2077-9038-2018-3-107-117.

12. Травуш В.И. Белостоцкий А.М., Акимов П.А. ЦИФРОВЫЕ ТЕХНОЛОГИИ В СТРОИТЕЛЬСТВЕ: ДЕКЛАРАЦИИ И РЕАЛЬНОСТЬ. ЧАСТЬ 2. ЭКСПЕРИМЕНТАЛЬНЫЕ И ЛОКАЛЬНЫЕ ИССЛЕДОВАНИЯ, ПРОИЗВОДСТВО МАТЕРИАЛОВ, ИЗДЕЛИЙ И КОНСТРУКЦИЙ, МАТЕРИАЛОВЕДЕНИЕ, ЭКОНОМИКА СТРОИТЕЛЬСТВА, ИНФОРМАЦИОННОЕ МОДЕЛИРОВАНИЕ / Сборник «Устойчивое развитие региона: архитектура, строительство, транспорт». Материалы 5-й Международной научно-практической конференции Института архитектуры, строительства и транспорта. 2018, С. 25-38.

13. Добрынин А.П., Черных К.Ю., Куприяновский В.П., Куприяновский П.В., Синягов С.А. Цифровая экономика - различные пути эффективного применения технологий (BIM, PLM, CAD, IOT, Smart City, BIG DATA и др.) International Журнал открытых информационных технологий, 2016, том 4, выпуск 1, стр. 4-11. DOI:https://doi.org/10.23968/1999-5571-2020-17-2-4-11.

14. Корабельникова С.С., Корабельникова С.К. ЦИФРОВЫЕ ТЕХНОЛОГИИ КАК ЭЛЕМЕНТ СНИЖЕНИЯ РИСКОВ В СТРОИТЕЛЬСТВЕ. Дискуссия. 2019, том 2 (93) С. 18-27. DOI: 24411/2077-7639-2019-10002.

15. Лескова Ю.Г. ПРИМЕНЕНИЕ ИНФОРМАЦИОННЫХ (ЦИФРОВЫХ) ТЕХНОЛОГИЙ В САМОРЕГУЛИРОВАНИИ КАК УСЛОВИЕ РАЗВИТИЯ СТРОИТЕЛЬНОЙ ОТРАСЛИ И ПРАВОВОЕ РЕГУЛИРОВАНИЕ Издательская группа "Юрист". Гражданское право. 2018, том 5 стр. 9-11 DOI:https://doi.org/10.18572/2070-2140-2018-5-9-11.

16. Kagan P. The use of digital technologies in building organizational and technological design. E3S Web Conf. 2021, Vol. 263, XXIV International Scientific Conference “Construction the Formation of Living Environment” (FORM-2021), Article Number 04040, https://doi.org/10.1051/e3sconf/202126304040

17. Kagan P., Sigitov A. Predicting the Elements Operation of Buildings’ Engineering Equipment Using the Big Data Analysis Technologies. Lecture Notes in Civil Engineering, 2022, 231, стр. 87-93. DOI:https://doi.org/10.1007/978-3-030-96206-7_9.

18. Дорофеев М. Практикум использования контрольных карт Шухарта. Электронный ресурс. Электронный журнал Хабр. Публ. от 07.03.2012. - URL: https://habr.com/ru/post/139596/ (дата обращения: апрель 2022). - Текст: электронный.

19. Университет ИТМО. Кластерный анализ - каждому. Электронный ресурс. Электронный журнал Хабр. Публ. от 19.01.2021. - URL: https://habr.com/ru/company/spbifmo/blog/534410/ (дата обращения: апрель 2021). - Текст: электронный

20. Азгальдов Г.Г., Азгальдова Л.А., Количественная оценка качества (Квалиметрия). - М.: Издательство стандартов, 1971, 176 с. - УДК 658.562.003.12 (048) - 5000 экз. - Текст: непосредственный.

21. Дюран Б., Одель П.: Кластерный анализ, «Статистика», Москва (1977).

22. Азгальдов Г.Г., Костин А.В., Садов В.В.: Квалиметрия для всех. «ИнформЗнание», Москва (2012).

23. Салихов М.Р., Юрьева Р.А., Алгоритм прогнозирования состояния оборудования на основе машинного обучения // Изв. Вузов. Приборостроение. 2022. Т. 65, №9. С. 648-655. DOI:https://doi.org/10.17586/0021-3454-2022-65-9-648-655


Войти или Создать
* Забыли пароль?