Я создал словарь, показывающий частоты слов в качестве значений. Прежде всего мне нужно преобразовать эти частоты в проценты. Общее количество слов составляет 150482. Во-вторых, мне нужно поместить этот словарь в порядке убывания (на основе значений, которые являются частотами для слов в качестве ключей) и сравнить его с другим словарем, в котором часто встречаются слова. Любая идея, как сделать это двумя вещами: а именно изменить значения в процентах и поместить их в порядке убывания в одном дицитаре (эта последняя часть, если необходимо только для сравнения) и во-вторых, сравнивая этот словарь со словарем частых слов. Вот первый словарь, который мне нужен, чтобы изменить значения в процентах.
di=dict()
with open('content.txt',encoding='utf8') as newtext:
for line in newtext:
line=line.rstrip()
words=line.split()
for word in words:
di[word]=di.get(word,0)+1
Цель состоит в том, чтобы выяснить, какой процент часто встречающихся слов в словаре частых слов встречается в ди (который показывает частоту слов в текстовом файле). Первый словарь похож на {the: TRUE}. Другими словами, нет ценностей. Просто ключи - это слова, которым необходимо найти их встречаемость с соответствующим процентом частоты в тексте файла.