Как сравнить два частотных распределения (созданных с помощью nltk FreqDist) в python3? - PullRequest
0 голосов
/ 07 мая 2018

Я использую nltk FreqDist для создания распределения частот с использованием python3. Я хочу сравнить частотное распределение всего корпуса с частотным распределением многих текстовых файлов один за другим. Кроме того, я хочу вывести некоторые числовые значения сравнения.

corpusTokens = []

для документа в наборе документов:

    corpusTokens.extend(document)
    fdist = FreqDist(self.corpusTokens)

Как сравнить fdist всего корпуса с fdist какого-либо текстового файла?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...