Является ли проблемой, если независимые переменные в наборе тестов перекрываются с зависимыми переменными в наборе поездов? - PullRequest
0 голосов
/ 08 мая 2020

Я хочу создать модель временных рядов для прогнозирования продаж на один период вперед. Для этого я включил продажи за предыдущие периоды времени x в качестве независимых переменных. Если я хочу разделить свои данные на поезд и тестовый набор, независимые переменные в тестовом наборе перекрываются с зависимыми переменными в моем наборе поездов. Например: представьте, что у меня есть набор данных с T = 100 наблюдений, и я разделил данные на 70 поездов и 30 тестовых наблюдений. Первые несколько наблюдений в наборе тестов используют продажи за предыдущие периоды в качестве независимых переменных, но эти продажи включены как зависимые переменные в набор поездов. Это вызывает какие-то проблемы? Или мне следует исключить x наблюдений, чтобы они вообще не перекрывались?

...