У меня есть pandas датафрейм с несколькими списками недвижимости. Подмножество набора данных выглядит следующим образом.
Neighborhood High School ...
WOODLEY LIBERTY
WOODLEY
COUNTRY CLUB
COUNTRY CLUB HERITAGE
COUNTRY CLUB HERITAGE
COUNTRY CLUB TUSCORORA
...
Многие районы не имеют информации, а другие неверны. Я пытаюсь сделать сопоставление, чтобы исправить это.
cleanHS = {"WOODLEY": "LIBERTY", "COUNTRY CLUB": "HERITAGE", ...}
dirty["High School"] = dirty["High School"].map(cleanHS)
К сожалению, это приводит к тому, что столбец High School
содержит только NaN
. Что я здесь делаю не так?