У меня есть набор данных, содержащий столбец значений, однако некоторые строки в столбце содержат выбросы (например, -999,999 или 999,999) из-за системной ошибки, которую я хотел бы попытаться исправить в Pandas.
Исходный набор данных выглядит следующим образом:
Value Column
-2092.925951
910.9736
-910.9736
-2024.96475
-2024.96475
999947.438 - (outlier)
67.4672
-999993.313 - (outlier)
9.8603
49.5318
17.5591
Я хотел бы добавить 1000000 только к строкам с числами от -800000 до -999999 и вычесть 1000000 из строк с числами от 800000 до 999999.
Пример желаемого набора данных ниже:
Value Column
-2092.925951
910.9736
-910.9736
-2024.96475
-2024.96475
-52.562 - (fixed outlier with 999,947.438 - 1,000,000)
67.4672
6.687 - (fixed outlier with -999,993.313 + 1,000,000)
9.8603
49.5318
17.5591
Любая помощь или идеи приветствуются!