Как переименовать все столбцы со счетом 1 как «другие» - PullRequest
0 голосов
/ 04 августа 2020

Я классифицирую фильмы по жанрам. (Научно-фантастический боевик, триллер, ужасы, ...) и так далее. Я получаю 200 классов, из которых 50 имеют только одно значение, когда я группируюсь. Я хочу переименовать каждую из этих строк по значению (или каждая из этих строк = 1) и переименовать их как «Другое», чтобы другое количество теперь было равно 50

Сообщите, пожалуйста, код.

фрейм данных - df, а имя столбца - жанр

спасибо

1 Ответ

0 голосов
/ 04 августа 2020

Вы можете вычислить частоту и использовать np.where для замены следующим образом:

# compute the frequency:
counts = df.groupby('genre').transform('size')

# maps:
df['new_genre'] = np.where(counts > 1, df['genre'], 'Other')
...