Подход, который вы пытаетесь использовать, не сработает, я объясню, что делает ваш код:
y = df["SALE PRICE"]
В этой строке используется выбор столбца "SALE PRICE"
из вашего фрейма данных, который называется df
и устанавливает его в переменную y
. Обратите внимание, что возвращаемый объект является pd.Series
объектом, который не имеет столбцов. Вы можете проверить типы объектов, запустив type(df)
, а также type(y)
.
Когда вы запустите:
y = y[y['SALE PRICE'] != ' - ']
Ваш код просматривает индекс ряда, сохраненного в переменной y
(это, вероятно, диапазон от 0 до количества имеющихся у вас строк) для строки "SALE PRICE"
, которая не существует. Вы можете проверить индекс y с помощью y.index
.
. Вы можете либо заменить y
на df
, либо, если вы хотите сохранить имя столбца для использования в других местах, где вы Вам нужно будет просто сохранить строку в переменной, что-то вроде:
y = "SALE PRICE" #
print(df[y]) # Identical to running df["SALE PRICE"]