У меня есть очень большие данные оценки деформаций, которые я импортирую как 2d массивы в python.Краткий пример:
X = np.array([[210, 211, 209, 10000, 215, -5000],
[220, 221, 219, 10000, 225, -10000],
1400, 225, 230, 10000, 235, -98]])
Некоторые измеренные значения можно интерпретировать напрямую как ошибки измерения (например: 10000,-5000
).Я определяю их с интервалом (например: <-10, >1000
).Затем значения должны быть удалены из массива и заменены подходящими значениями.Ошибки измерения должны быть либо интерполированы, либо заменены другими методами.
У меня уже было несколько попыток с функцией Панды asfreq()
и классом вменения из scikit-learn.С asfreq()
у меня была проблема, что он заполняет только NaN
значения.С imputer()
есть только четыре стратегии (среднее, среднее, наиболее частое и постоянное).