Работа с «отсутствующими» данными при добавлении новых функций позже - PullRequest
0 голосов
/ 09 сентября 2018

Условия:

У меня есть набор данных с 2 функциями

каждый день я собираю новые данные. поэтому строки увеличены

Я собрал данные за 1000 дней, поэтому у меня есть 1000 строк

Я добавил новую функцию (функция 3) в день 900

Я не могу получить прошлые данные.

Проблема в том, что у меня разные строки:

функция 1 и функция 2 имеют 1000 строк

функция 3 имеет 100 строк

какое лучшее решение? я должен сделать вменение? я должен сделать несколько подмножеств?

Я думаю, что условие снова возникнет, потому что у меня есть план добавить новую функцию в будущем (функция 4, функция 5 и т. Д.)

1 Ответ

0 голосов
/ 10 сентября 2018

Не существует лучшего решения для всех.

В некоторых случаях может быть просто отказаться от старых данных.

Вменение, вероятно, не очень хорошая идея. Я бы лучше использовал алгоритм, который может просто игнорировать пропущенные значения.

...