Question

У меня большой набор данных, содержащий много значений NaN в нескольких столбцах.

Я пробовал следующий код, но он не сбрасывает значение Nan из набора данных

df = pd.read_excel('sec3_data.xlsx')
df.dropna(subset=["Deviation from Partisanship"])
df['Deviation from Partisanship'].unique()

Вывод:

array([nan, 'Vote for opposing party', 'Vote for own party'], dtype=object)

Это ясно показывает, что все еще есть некоторые доступные значения nan. Как я могу их удалить?

Simon · Answer 1 · 09 ноября 2019

Вам необходимо либо переназначить новый фрейм данных:

df2 = df.dropna(subset=["Deviation from Partisanship"])

, либо выполнить сброс inplace:

df.dropna(subset=["Deviation from Partisanship"], inplace=True)

Более подробную информацию можно найти в документации здесь: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.dropna.html

Pierre Gourseaud · Answer 2 · 09 ноября 2019

# Method 1
df = pd.read_excel('sec3_data.xlsx')
df.dropna(subset=["Deviation from Partisanship"], inplace=True)
df['Deviation from Partisanship'].unique()

# Method 2
df = pd.read_excel('sec3_data.xlsx')
df2 = df.dropna(subset=["Deviation from Partisanship"])
df2['Deviation from Partisanship'].unique()

Как бороться со значениями NaN в данных в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как бороться со значениями NaN в данных в Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы