Я использую nltk FreqDist для создания распределения частот с использованием python3. Я хочу сравнить частотное распределение всего корпуса с частотным распределением многих текстовых файлов один за другим. Кроме того, я хочу вывести некоторые числовые значения сравнения.
corpusTokens = []
для документа в наборе документов:
corpusTokens.extend(document)
fdist = FreqDist(self.corpusTokens)
Как сравнить fdist всего корпуса с fdist какого-либо текстового файла?