Замена менее встречающегося как Другие - PullRequest
0 голосов
/ 05 октября 2018

Замена менее встречающихся на другие.

В одном из столбцов, например, «Имя» фрейма данных, скажем, df, у меня есть данные, как показано ниже:

Пример ввода:

Имя

A

A

A

B

B

C

D

df['Name'].value_counts()


A      3
B      2
C      1
D      1

Мне потребуется вывод в следующем формате.

Ожидаемый вывод:

A   3

B   2

Others 2

Любой код в python3 приветствуется.Заранее спасибо.

1 Ответ

0 голосов
/ 05 октября 2018

Вам нужно:

x = list(df['name'].value_counts()[:2].index)  # This will fetch top N values
df['name'] = np.where(df['name'].isin(x), df['name'], 'others')

print(df['Name'].value_counts())

вывод

A         3
B         2
others    2
...