Как рассчитать медианы, используя панд со значениями NaN? - PullRequest
0 голосов
/ 06 июня 2018

У меня есть импортированный CSV-файл с 59 столбцами.Я хочу рассчитать медианы в каждом столбце.

Каждый столбец имеет смесь значений NaN и действительных целочисленных значений, как и строки.

enter image description here

Я должен сохранить всезаписи, поскольку в каждой строке есть действительное измерение, и если я опускаю значения NaN по столбцу или строке, мой набор данных будет пустым.

Я установил значение NaN в ноль, но не смог заставить его игнорировать 0ценности.

В настоящее время у меня есть номер сайта и еще одна соответствующая мера, и я удаляю значения NaN для каждого столбца как независимую единицу, но это занимает очень много времени.

Существует ли лучший метод для расчета медианы, даннойданные обстоятельства?

1 Ответ

0 голосов
/ 06 июня 2018

pandas.DataFrame.median игнорирует NaN по умолчанию, вам необходимо явно изменить флаг skipna на False, чтобы включить NaN/null значения.

df = pd.DataFrame({'col1': [1,2,3,np.nan, 4,5], 'col2': [4,5,6,np.nan, np.nan,7]})

df.median()

col1    3.0
col2    5.5
dtype: float64

df.median(skipna=False)

col1   NaN
col2   NaN
dtype: float64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...