У меня есть файл pickle, содержащий более миллиона слов. Файл рассола можно загрузить из здесь .
Я хочу использовать Counter
для этих слов, чтобы отсортировать их. Вот мой код:
with open('data/words.pkl', 'rb') as f:
data = list(pickle.load(f))
print(Counter(data).most_common(3))
Печатный результат меняется каждый раз, но обычно это так:
[('', 1), ('fraksiyonal', 1), ('editado', 1)]
Итак, кажется, что слова не считаются, и каждое вхождение слова 1. Что я делаю не так?
Изменить: В качестве примера того, как выглядит список данных:
print(data[0:10])
Результат:
['', 'hillview', 'dipnota', 'дол', 'censusi', 'quathie', 'kalacağının', 'stralauerstrasse', 'sbaglio', 'keny']