как удалить категориальное значение из столбца фрейма данных в python? - PullRequest
0 голосов
/ 03 августа 2020

Я работаю с заголовком фрейма данных price_df. и я хотел бы удалить строки, содержащие '4wd', из столбца drive-wheels. Я попробовал price_df2 = price_df.drop(index='4wd', axis=0) и несколько других вариантов после прочтения страниц документации в pandas, но продолжаю получать коды ошибок. Может ли кто-нибудь указать мне, как правильно удалить строки, содержащие значения 4wd, из столбца и фрейма данных? Ниже приведен код, который я запускал, прежде чем пытаться сбросить значения:

# Cleaned up Dataset location
fileName = "https://library.startlearninglabs.uw.edu/DATASCI410/Datasets/Automobile%20price%20data%20_Raw_.csv"
# Import libraries
from scipy.stats import norm
import numpy as np
import pandas as pd
import math
import numpy.random as nr
price_df = pd.read_csv(fileName)
round(price_df.head(),2) #getting an overview of that data
price_df.loc[:,'drive-wheels'].value_counts()
price_df2 = price_df.drop(index='4wd', axis=0)

Ответы [ 3 ]

1 голос
/ 03 августа 2020

Вы можете использовать pd.DataFrame.query и обратные галочки для этого имени столбца с дефисом:

price_df.query('`drive-wheels` != "4wd"')
0 голосов
/ 03 августа 2020

Получите подмножество ваших данных с помощью этого однострочника:

price_df2 = price_df[price_df.drive-wheels != '4wd']
0 голосов
/ 03 августа 2020

Попробуйте это

price_df = pd.read_csv(fileName)
mask = price_df["drive-wheels"] =="4wd"
price_df = price_df[~mask]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...