Идеи о том, что делать с набором данных только с метками времени, для проекта машинного обучения - PullRequest
0 голосов
/ 24 апреля 2019

Я пишу проект машинного обучения (я новичок в этом), и теперь я немного застрял в том, что делать дальше.

У меня есть 2, несколько небольших набора данных, один из них имеет временные метки, когда произошел вывод, другой такой же, но имеет временные метки ввода, они имеют формат: год / месяц / день / час / минута /second.

Я попытался немного поработать над особенностями и разбил эти столбцы, а также изучил разницу между ближайшими входами и ближайшими выходами, чтобы лучше понять, как работает задержка, а также попытаться увидеть время простоя. Я сделал много визуализаций, чтобы увидеть, куда я могу пойти отсюда, и теперь я застрял. Я не вижу никаких очевидных закономерностей.

Мне не нужно делать прогнозирование временных рядов, и сейчас я пытаюсь обнаружить аномалии того, что у меня есть.

  • Моя проблема в том, что я понятия не имею, что мне делать с этим дальше, может быть, у вас есть какой-нибудь совет относительно того, какие алгоритмы я могу применить?

  • Я также застрял, чтобы посмотреть, смогу ли я подключить вход к его выходной метке времени, есть ли какие-нибудь очевидные способы, которые обычно применяются для этого?

  • В основном я хочу видеть закономерности и отклонения в данных. Я попытался просмотреть генерируемые данные брака. Я действительно не знаю, какие хорошие модели / эксперименты можно применить и опробовать в моем случае.

  • Есть ли какие-либо методы извлечения данных, которые вы могли бы посоветовать мне использовать?

1 Ответ

0 голосов
/ 29 апреля 2019

Похоже, вы на правильном пути!

Вот несколько идей для рассмотрения:

  • Есть ли тенденция по дням недели?Пик выходных или нет?
  • Имеет ли значение время суток в сочетании с днем ​​недели?
  • Вы смотрели на объем в сочетании с другими переменными?Всплеск трафика в среду вечером в 2 часа ночи может быть красным флагом.

По сути, я бы попытался закодировать в ваших данных сезонность, час, день недели, месяц, год и т. Д.

Ссылка: Как использовать машинное обучение для обнаружения аномалий и мониторинга состояния ; Расстояние Махаланобиса

...