Как сгруппировать имя и объединить все отзывы в датафрейме python? - PullRequest
0 голосов
/ 16 апреля 2019
df = pd.read_csv('movie_lens')
df1 = df.groupby([['name of movie','reviews']])

##Groupby name of the movie and put all reviews for that movie into one row..#
#name of movie.............reviews#
#titanic...................good#
#titanic...................bad#
#titanic....................great#
#superbad..................funny#
#superbad..................ok#
#superbad..................hilarious#

#How to group movies into one row and concatenate all review it a CSV that's now a dataframe.example#  
#titanic....................good.bad.great#
#superbad....................funny.ok.hilarious#

1 Ответ

0 голосов
/ 16 апреля 2019

Вы просто сгруппированы по слишком многим вещам. Вы хотите:

df1 = df.groupby(['name of movie'])['reviews'].apply(list)

Или, немного проще:

df1 = df.groupby('name of movie').reviews.apply(list)

Как только у вас есть list отзывов, не стесняйтесь join() их, используя ' ' или подобное.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...