Оранжевый: стратификация и разделение по времени и категории - PullRequest
0 голосов
/ 21 февраля 2020

Предположим, у меня есть набор данных со столбцом datetime. Я хотел бы сделать временную задержку для этих данных с оговоркой: мне нужно также сделать вторичную задержку с точки зрения категории, чтобы мои тестовые данные имели строки только раз после обучающих данных И содержали только строки с категориями, которые никогда не видели данные обучения. Категории являются GUID, и строки могут повторяться, так что это необходимо.

Существует ли виджет или способ для разделения данных на поезд и наборы тестов таким образом, чтобы набор тестов находился в будущем, набор поездов был в прошлом, а набор тестов еще более расслаивался по сравнению с набором тренировок дополнительная переменная (хотя бы одна)?

...