Как я могу рассчитать 3 жанра, наиболее часто встречающихся в питонах? - PullRequest
0 голосов
/ 22 ноября 2018

У меня есть датафрейм с одним столбцом, и мне нужно вернуть 3 наиболее часто используемых жанра.

INPUT

    genres
0   Drama
1   Animation|Children's|Musical
2   Musical|Romance
3   Drama
4   Animation|Children's|Comedy
5   Action|Adventure|Comedy|Romance
6   Action|Adventure|Drama
7   Comedy|Drama
8   Animation|Children's|Musical
9   Adventure|Children's|Drama|Musical
10  Animation|Children's|Musical
11  Musical
12  Drama
13  Comedy

Drama 6Мюзикл 6 Детский 5 Анимация 4 Комедия 4 Приключения 3 Действие 2

ВЫХОД - Кадр данных с:

  genres
0 Drama
1 Musical
2 Children's

1 Ответ

0 голосов
/ 22 ноября 2018

Сначала нужно split, сделать stack, затем использовать value_counts

df.genres.str.split('|',expand=True).stack().value_counts().head(3)
Drama         6
Musical       6
Children's    5
dtype: int64
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...