повторяющиеся значения, означающие в концепции машинного обучения - PullRequest
0 голосов
/ 14 февраля 2020

У меня есть концептуальный вопрос о повторяющихся значениях в кадре данных, который предназначен для проекта машинного обучения для прогнозирования sth.

Ошибки данных (тот же индекс, те же значения и т. Д. c) должны быть отброшены, потому что это не реально, создает шум и вырабатывается из-за ошибки. В этом нет никаких сомнений.

Но что, если у меня разные наблюдения (другой индекс), но у меня одинаковые значения? их тоже надо уронить? или, поскольку это другое наблюдение, оно должно оставаться как есть? или просто не важно?

Заранее спасибо,

...