У меня есть концептуальный вопрос о повторяющихся значениях в кадре данных, который предназначен для проекта машинного обучения для прогнозирования sth.
Ошибки данных (тот же индекс, те же значения и т. Д. c) должны быть отброшены, потому что это не реально, создает шум и вырабатывается из-за ошибки. В этом нет никаких сомнений.
Но что, если у меня разные наблюдения (другой индекс), но у меня одинаковые значения? их тоже надо уронить? или, поскольку это другое наблюдение, оно должно оставаться как есть? или просто не важно?
Заранее спасибо,