Существуют ли какие-либо встроенные методы, которые я могу использовать для подсчета количества меток на моем графике? Например: top_words.min()
вернет, сколько раз слово должно появляться, чтобы оно отображалось на гистограмме. Ищу похожий метод, но только для ярлыков. Изображение гистограммы связано ниже моей функции.
Я строю слова в гистограмму, используя эту функцию
def plot_top_words(tweets, num_word_instances, top_words):
tdm_df = create_term_document_matrix(tweets, min_df=2)
word_frequencies = tdm_df[[x for x in tdm_df.columns if len(x) > 1]].sum()
sorted_words = word_frequencies.sort_values(ascending=False)
top_sorted_words = sorted_words[:num_word_instances]
top_sorted_words[:top_words].plot.bar()
return top_sorted_words
Вывод, который я получаю с помощью ввода ниже:
top_words = plot_top_words(clean_tweets, 50, 10)
top_words
Возвращаемое значение, которое я ищу в этом примере, равно 10.