Russian Federation
Moscow, Moscow, Russian Federation
Russian Federation
2.1.2
2.1.3
2.1.5
2.1.6
2.1.7
2.1.8
2.1.9
2.1.10
2.1.11
2.1.12
2.1.13
2.1.14
2.1.15
004.65
51-37
696.117
67.01
308
Introduction. The most widespread today, modern predictive analytics platforms such as: “Foresight Analytical Platform”, KNIME Analytics Platform, SAS Enterprise Miner, Loginom, have a number of features that limit their use in small businesses. Materials and method. As part of the work on the dissertation on the topic "Management of the technical condition of engineering equipment for packaging and dosing in the production of building materials", a hypothesis was put forward that the combined use of cluster and qualimetric analysis of big data allows for the prediction of changes in the phases of the life cycle with an accuracy of at least 95%, which ensures a reduction in operating costs by at least 15-20% due to the optimization of the timing of maintenance and replacement of elements of engineering equipment. Results. The article compares modern predictive analytics platforms with the methodology developed in the dissertation. The implementation of the developed methodology in production conditions is considered.. Conclusions. The developed methodology for managing the technical condition of engineering equipment for packaging and dosing in the production of building materials is of interest in the field of construction.
Production of building materials, technical condition management, cluster analysis, predictive analytics, qualimetry, life cycle, forecasting systems.
ВВЕДЕНИЕ
Первые прогнозные модели начала формироваться в 1940-х годах, с появлением линейного программирования, метода Монте-Карло и симуляций нейронных сетей. С 1970-х по 1990-е годы, с развитием компьютерной техники, эти технологии получили широкое применение в бизнесе. Ведущие технологические компании сыграли ключевую роль в популяризации предиктивной аналитики — IBM (платформы IBM SPSS и Watson Analytics), Google (инструменты Google BigQuery ML и TensorFlow), Microsoft (платформа Azure Machine Learning), Amazon (платформа Amazon Web Services) и др. [1].
МАТЕРИАЛЫ И МЕТОДЫ
Наиболее часто применяемые на сегодняшний день платформы реализующие инструменты предиктивной аналитики: «Аналитическая платформа Форсайт», KNIME Analytics Platform, SAS Enterprise Miner, Loginom. В рамках проведённого исследования выполнено сравнение этих платформ с Microsoft Excel [2]. В качестве основных рассматриваемых показателей были выбраны следующие: простота использования, встроенные функции анализа, доступность, гибкость, стоимость лицензии, поддержка продвинутых методов анализа, работа с большими данными (от 1 до 100 ТБ), автоматизация процессов анализа, визуальное программирование, отсутствие необходимости в дополнительном обучении, встроенная поддержка временных рядов, объединение инструментов из разных областей. Общие результаты представлены в виде таблицы (рис.1) [3].
Рисунок 1– Сравнение современных платформ для прогнозирования.
Выбор инструмента Excel, можно обосновать следующим:
- Если данные небольшие (до 1ТБ), а задача ограничивается базовым анализом или визуализацией, Excel будет быстрее и удобнее.
- Excel проще в использовании для новичков, не имеющих опыта работы со специализированными платформами.
- Если задача не требует автоматизации или сложных методов анализа, Excel будет предпочтительнее.
- Самая доступная стоимость лицензии, значительно снижающая порог вхождения в задачи прогнозирования.
Научно-техническая гипотеза представленного исследования предполагает возможность совместного использования кластерного анализа и квалиметрических методов при обработке больших массивов эксплуатационных данных инженерного оборудования позволяет прогнозировать смену фаз его жизненного цикла с точностью ≥95%. Данный подход способствует сокращению затрат на эксплуатацию на 15–20% за счёт корректировки интервалов технического обслуживания и своевременной замены компонентов.
Методологическая основа исследования. В работе применены следующие методы анализа:
- Контрольные карты Шухарта для фильтрации исходных данных на первоначальном этапе, с целью исключения из последующего анализа бракованных элементов.
- Кластерный анализ, для группировки объектов выборки в однородные совокупности (кластеры), с целью получения эталонной модели, для следующего этапа анализа.
- Квалиметрия, для предсказания изменения фаз жизненного цикла ключевого элемента фасовочного оборудования, на основании полученных данных и эталонной модели, с целью повышения эффективности управления техническим состоянием инженерного оборудования [4-6].
Исходные данные для анализа были предоставлены ООО НТЦ «Гидрол-Кровля» (г. Москва) и обрабатывались в среде Microsoft Excel. На подготовительном этапе осуществлялась предварительная обработка данных, включающая:
- Экспертную оценку достоверности информации
- Применение методов статистического контроля [7].
Ключевые анализируемые параметры:
- Фактическая наработка в часах
- Количество циклов включения
- Объем переработанного полимерного материала
Кластерный анализ состоит из следующих этапов:
- Процедура нормализации, для обеспечения сопоставимости разно размерных параметров.
- Расчёт Евклидова расстояния в целях оценки степени различия между объектами.
- Расчёт эталонной модели.
Квалиметрический анализ проводился в три этапа:
- Расчёт процентного отклонение от эталонных значений, с целью оценки погрешности.
- Нормализация данных для анализа.
- На финальном этапе обработки производились: ранжирование объектов по возрастанию значений; расчет интервальных показателей; определение среднего геометрического для интервалов.
Математические инструменты были подробно рассмотрены автором статье «Современное состояние и перспективы развития систем предиктивной аналитики в области строительства» [8].
Итоги вычислений, полученные путём сложения порядковых номеров изделий в ранжированных промежуточных таблицах и номеров их кластеров, представлены в виде таблицы и диаграммы (рис. 2, 3).
Рис. 2 –Итоговая таблица квалиметрического анализа системы
Рис. 3 – Итоговая диаграмма квалиметрического анализа
Исследуемые шнеки по результатам проведённого квалиметрического анализа разделились на три группы: первая шнеки № 2, 5, 7, 10 с рекомендацией провести полный внеочередной контроль; во второй группе № 3, 4, 6, 8 работают в штатном режиме; № 1, 9, из третей группы, находящиеся в наилучшем состоянии.
Для проверки методики был проведён фактический замер износа шнеков и сравнение замеров с моделью, полученной в результате прогноза. Результаты сравнения представлены в виде таблицы и диаграммы (рисунок 4, 5) [9].
Рис. 4 – Сравнение результатов прогноза и фактических замеров таблица
Рис. 5 – Сравнение результатов прогноза и фактических замеров диаграмма
Анализ сравнения результатов прогноза и фактических замеров остатка ресурса шнеков:
- Общие наблюдения. В таблице представлены данные по 10 шнекам, включая прогнозируемые и фактические значения износа (в %), а также процент отклонения прогноза от реальных данных. Нормализация значений позволяют провести сравнение прогноза и фактических замеров остатка.
- Ключевые выводы. Точность прогноза – наибольшее занижение прогноза (факт> прогноз) у шнека №3 (–17,11%), шнека №4 (–13,51%), шнека №2 (–13,17%); наибольшее завышение прогноза у шнека №5 (+18,41%), шнека №8 (+12,49%), шнека №10 (+14,77%); наиболее точные прогнозы у шнека №7 (+1,30%), шнека №9 (+7,53%), шнека №6 (+8,61%)
- Средняя величина отклонения составила 1,09%.
Модель демонстрирует приемлемую среднюю точность, но требует доработки для уменьшения крайних отклонений. Такие результаты обусловлены экспериментальным характером работы и небольшим объёмом данных, полученных на момент проведения анализа [10].
ЗАКЛЮЧЕНИЕ И ОБСУЖДЕНИЕ
Проведенное исследование подтвердило выдвинутую гипотезу о возможности эффективного управления техническим состоянием инженерного оборудования фасовки и дозирования при производстве строительных материалов, методами анализа больших данных с использованием комбинированного подхода, использующего кластерный и квалиметрический подход. Разработанная методика обладает существенными преимуществами перед существующими аналогами для задач, когда ключевое значение имеет низкая стоимость программного обеспеченья, низкий порог вхождения, новизна области исследования и может быть рекомендована к внедрению в промышленности и строительстве.