Получить количество уникальных пользователей, которые играли определенного исполнителя - PullRequest
0 голосов
/ 09 марта 2020

У меня есть фрейм данных, который содержит идентификаторы ArtistID и идентификаторы UserID для пользователей службы lastFM. Я сделал следующее, чтобы сгруппировать фрейм данных по ArtistID, чтобы увидеть, какие пользователи их воспроизводят

user_artists = pd.read_csv('user_artists.csv', delim = '\t')

group_by_artist = user_artists.groupby(["artistID","userID"])

, и когда я звоню group_by_artist.first(), я получаю таблицу, которая выглядит следующим образом.

GroupBy table

Это частично то, что мне нужно, однако основная цель - получить СКОЛЬКО уникальных пользователей, сыгравших каждого исполнителя, а затем подготовить сюжет, есть ли способ, которым я могу go из этой информации, чтобы получить необходимую информацию? Может быть, другой группой, а затем на гистограмме нанесите число уникальных пользователей на одного художника?

...