У меня есть DF, который обеспечивает частоты слов из корпуса, упорядоченного по рейтингу. Слова и частоты являются списком кортежей т.е. [(компания, 16), (работа, 14)]. Индекс DF - рейтинг комментария (рейтинг 1-5) Пример: рейтинг = 1 наиболее распространенные слова - «компания», «работа» и т. Д. Я хотел бы создать гистограмму частоты каждого слова по рейтинг.
Вот код, который дал мне DF, описанный выше.
group_by = df.groupby('rating')['list_lemma'].apply(lambda x: Counter(' '.join(x).split()).most_common(20))
dfgroup_by = pd.DataFrame(group_by)
Я хотел бы создать гистограмму частоты каждого слова по рейтингу.