Поскольку мы работаем с несколькими предложениями здесь и с учетом характера TF-IDF, частоты слов в общем документе и частоты слов в общем корпусе, мы можем просто упорядочить ваш результат от большего к меньшему. Для этого мы можем использовать метод для сортировки словаря, который вы показали в своем вопросе.
def sort_dictionary(my_dict):
return {k: v for k, v in sorted(my_dict.items(), key=lambda item: item[1], reverse=True)}
Таким образом, мы получаем результат:
{'a': 0.09902102579427789, 'for': 0.09902102579427789, 'man': 0.09902102579427789, 'out': 0.09902102579427789, 'walk': 0.09902102579427789, 'went': 0.09902102579427789, 'the': 0.0}
В соответствии с документами, или предложения, которые мы использовали в качестве ввода. Хотя в предложениях содержится тринадцать слов, у нас есть только 7 уникальных, но если бы у нас их было сотни, мы могли бы ограничить наш поиск первой десяткой в отсортированном словаре, и это дало бы нам первую десятку.