Использование данных временных рядов сотрудников для прогнозирования текучести кадров (двоичное прогнозирование с использованием данных временных рядов) - PullRequest
0 голосов
/ 14 ноября 2018

У меня есть данные временного ряда сотрудника, такие как hours worked, shift type, Overtime, no show hours, missed punch и т. Д. В настоящее время я собираю данные о нескольких сменах времени в одну строку на сотрудника, где флаги, такие как no show, overtime, принимаются как сумма, а числовые значения, такие как рабочее время, часы работы - как среднее. Затем я отправляю его на machine learning модель, где он может прогнозировать на сотрудника.

Почему я не смог провести анализ временных рядов, таких как ARIMA или RNN, из-за того, что у него нет вывода regression, такого как рыночная цена акций или что-то другое. У меня есть только данные о том, был ли уволен сотрудник после этой смены или нет. Таким образом, Y value остается 0 в течение длительного времени в данных табеля рабочего времени и внезапно изменяется на 1, и данные заканчиваются. Поэтому эти данные не могут быть использованы при анализе временных рядов.

Мы могли бы установить Y value уровень удовлетворенности после каждой смены, но я понятия не имею, реализовать его с помощью набора данных, который у меня есть.

Я мог бы найти его где угодно в любых статьях. Ребята, вы можете помочь?

...