Как сравнить значения данных в Pandas со списком и поместить результат в новый столбец - PullRequest
0 голосов
/ 19 ноября 2018

У меня есть следующий набор данных для районов Манхэттена с наиболее распространенными местами в каждом районе:

df

Я составил список мест:

fit_venues = ['Coffee Shop', 'Café', 'Park', 'Hotel', 'Sandwich Place', 'Pizza Place', 'Gym / Fitness Center', 'Exhibit', 'Gym', 'Supermarket', 'Nightclub', 'Concert Hall', 'Jazz Club']

и я хочу добавить столбец к фрейму данных (например, назовем его «Подходящее соседство») и сравнить наиболее распространенные места каждого района (5 столбцов) со списком »fit_venues».Затем мы присваиваем результат столбцу «Fit Neighborhood» (Да / Нет или Правда / Ложь).Например, первые две строки должны возвращать Да / Правда, а третья строка должна возвращать Нет / Ложь.

Любая помощь?

Ответы [ 2 ]

0 голосов
/ 19 ноября 2018

Вы пытались использовать DataFrame.isin()?

Вы не дали мне названия наиболее распространенных столбцов места проведения, поэтому я предполагаю, что они являются единственными столбцами вDataFrame (df):

fit_venues = ['Coffee Shop', 'Café', 'Park', 'Hotel', 'Sandwich Place', 'Pizza Place', 'Gym / Fitness Center', 'Exhibit', 'Gym', 'Supermarket', 'Nightclub', 'Concert Hall', 'Jazz Club']

df['Fit Neighborhood'] = df.isin(fit_venues).any()
0 голосов
/ 19 ноября 2018

Проверьте, работает ли это:

 fit_venues = ['Coffee Shop', 'Café', 'Park', 'Hotel', 'Sandwich Place', 'Pizza Place', 'Gym / Fitness Center', 'Exhibit', 'Gym', 'Supermarket', 'Nightclub', 'Concert Hall', 'Jazz Club']

df["binary_check"] = df[df["5th Most Common Venue"].isin(fit_venues)]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...