Как использовать python и TextBlob, чтобы получить список неправильно написанных слов в моем корпусе nltk - PullRequest
0 голосов
/ 04 октября 2018

Я хочу проверить орфографию созданного мной nltk корпуса

Когда я передаю необработанный текст из корпуса nltk через проверку орфографии textblob (), я получаю следующую ошибку Object has no len() и раздел кода ниже.

Есть ли способ получить список неправильных написаний, обнаруженных в моем тексте, без предварительной их корректировки

site-packages\textblob\_text.py in suggest(self, w)
   1386         if len(self) == 0:
   1387             self.load()
-> 1388         if len(w) == 1:
   1389             return [(w, 1.0)] # I
   1390         if w in PUNCTUATION:

TypeError: object of type 'method' has no len()

1 Ответ

0 голосов
/ 13 октября 2018

Похоже, что мой корпус не был настроен правильно, чтобы перебирать нужные мне базовые файлы PlaintextCorpusReader(completeFolder, '.*txt') вместо PlaintextCorpusReader(completeFolder, '.txt')

. Выдача была, что Corpus.fileids () ничего не возвращал, пока яисправил код

...