Я работаю над проектом последнего года для набора данных без метки, состоящего из данных о вибрации от нескольких компонентов внутри ветряной турбины.
Наборы данных:
У меня есть данные от 4 ветряных турбин, каждая из которых состоит из 415 10-секундных интервалов .
О данных 10-секундного интервала:
- Каждый из 415 10-секундных интервалов состоит из данных вибрации для генератора, коробки передач и т. Д. c. (Всего 14 функций)
- Данные вибрации (14 функций) имеют разрешение 25,6 кГц (262144 строк в каждом интервале)
- 10 секунд записываются один раз каждые день , в разное время => Данные чуть более 1 года
Заголовок кадра данных с некоторыми показанными функциями:
План:
Мой текущий план -
Выполнить быстрое преобразование Фурье (БПФ) из временная область для каждого из различных датчиков (коробка передач, генератор и т. д. c) для каждого из 415 интервалов. Из БПФ я могу извлечь информацию о частоте, чтобы поместить в фрейм данных. (Статистические данные от FFT, как спектральная RMS на ячейку)
Создание различных наборов данных для разных компонентов.
Добавьте такие функции, как скорость ветра, направление ветра, вырабатываемая мощность и т. Д. c.
Затем я создам без присмотра * Модели 1055 * ML, которые могут обнаруживать аномалии.
Необслуживаемыми моделями, которые я рассматриваю, являются Encoder-Decorder и кластеризация .
Вопросы:
- Похоже, у меня достаточно данных для этого типа задачи? 415 интервалов х 4 разных турбины = 1660 рядов и ок. 20 функций
- Должны ли данные рассматриваться как временной ряд? (Он отбирается в течение 10 секунд один раз в день в случайное время ..)
- Какие другие модели / подходы без надзора ML могут быть полезны для этой задачи?
Я надеюсь, что это было ясно написано. Заранее спасибо за любой вклад!