Что я пытаюсь сделать, это проанализировать частоту букв в тексте.В качестве примера я буду использовать здесь небольшое предложение, но все, что, как предполагается, анализирует огромные тексты (так что лучше быть эффективным).
Хорошо, у меня есть следующий текст:
test = "quatre jutges dun jutjat mengen fetge dun penjat"
Затем я создал функцию, которая считает частоты
def create_dictionary2(txt):
dictionary = {}
i=0
for x in set(txt):
dictionary[x] = txt.count(x)/len(txt)
return dictionary
И затем
import numpy as np
import matplotlib.pyplot as plt
test_dict = create_dictionary2(test)
plt.bar(test_dict.keys(), test_dict.values(), width=0.5, color='g')
Я получаю
ПРОБЛЕМЫ: Я хочу видеть все буквы, но некоторые из них не видны (Контейнерный объект из 15 художников) Как расширить гистограмму?Затем я хотел бы отсортировать гистограмму, чтобы получить что-то вроде этого
этого