Имеет ли смысл заменить значения nan на -99999? - PullRequest
0 голосов
/ 05 апреля 2020

как имеет смысл заменить nan значения в кадре данных на значение -99999? Я нашел это здесь, пример 3: https://www.geeksforgeeks.org/python-pandas-dataframe-replace/

df.replace(to_replace = np.nan, value =-99999)

Возможно -99999 должно просто представлять -infinite, но какое намерение может быть за этим операция? Есть идеи, догадки? : /

Буду признателен за любые советы!

Ответы [ 2 ]

1 голос
/ 06 апреля 2020

Я бы рекомендовал заменить отсутствующие значения на 0. Как упомянуто @Bruno, большинство machine learning algorithms не работают с пропущенными значениями в вашем наборе данных.

df.fillna(0, inplace=True)
0 голосов
/ 06 апреля 2020

Некоторые модели машинного обучения не работают со значениями NaN во входных данных, таких как RandomForest в scikit learn, поэтому имеет смысл заменить его на другое значение, чтобы вы могли запустить модель, не теряя информацию о том, что это значение является NaN , вы можете выбрать любое значение по значению, которое существенно отличается от другого, например, -99999, чтобы лучше представлять эту информацию

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...