Я пытаюсь подсчитать частоту слов хэштега в столбце «текст» моего фрейма данных.
index text
1 ello ello ello ello #hello #ello
2 red green blue black #colours
3 Season greetings #hello #goodbye
4 morning #goodMorning #hello
5 my favourite animal #dog
word_freq = df.text.str.split(expand=True).stack().value_counts()
Приведенный выше код выполнит подсчет частоты для всех строк в текстовом столбце , но я просто для того, чтобы вернуть частоты хэштегов.
Например, после запуска кода в моем фрейме данных выше он должен вернуть
#hello 3
#goodbye 1
#goodMorning 1
#ello 1
#colours 1
#dog 1
Есть ли способ немного изменить мой word_freq код, поэтому он считает только слова хэштега и возвращает их так, как я указал выше? Заранее спасибо.