Бинарная классификация с данными временных рядов - PullRequest
0 голосов
/ 27 марта 2019

Я получил ряд точек данных для некоторых дат в моде временных рядов и добавил недостающие даты в исходную серию.отсутствующие даты помечены как 0, а исходные даты помечены как 1.

При создании модели классификации я пытаюсь предсказать вероятность на каждую будущую дату.функция, которую я использую, получена только на основе даты (день недели, неделя месяца, квартал_старт, квартал_ конец и т. д.)

Я не могу использовать информацию, доступную для предыдущих точек данных.Разница в количестве дней может быть важным фактором, однако при добавленной дате она будет отсутствовать.

В поисках лучшего подхода к моделированию, который также может принимать запаздывающую информацию.

Используется логистический / наивный байесовский классификатор.

У меня есть ряд точек данных для некоторых дат в моде временных рядов.Разница в размерах в днях 01-январь-2018 NAN 100 03-янв-2018 2 дня 200 05-янв-2018 2 дня 150 08-янв-2018 3 дня 134

Затем я создал данные с отсутствующими датами и добавилк оригинальной серии.

Дата разницы в днях суммы Y 01-январь-2018 NAN 100 1 02-янв-2018 NAN 0 0 03-янв-2018 2 дня 200 1 04-янв-2018 NAN 0 0 05-янв-2018 2 дня150 1 06-Jan-2018 NAN 0 0 07-Jan-2018 NAN 0 0 08-Jan-2018 3 дня 134 1

В поисках лучшего подхода к решению проблем

...