Ошибка при использовании самостоятельно созданного корпуса с nltk в python - PullRequest
0 голосов
/ 17 января 2020

Я хочу сам сделать простой анализ настроений.

Для этого у меня на компьютере есть папка «Test Data Model FR», в которой у меня есть две подпапки: «pos» и «neg». Папка «pos» содержит положительные отзывы, а папка «ne» содержит отрицательные отзывы.

Я использовал средство CategoryorPlaintextCorpusReader из ntlk для создания корпуса на основе этой папки. Это сработало.

После этого я хотел преобразовать корпус в «документ», который я мог бы использовать для дальнейшего анализа. Тем не менее, когда я запускаю код, я получаю сообщение об ошибке: Ошибка TypeError: объект «CategoryorPlaintextCorpusReader» не вызывается.

Это мой код:

from nltk.corpus.reader import CategorizedPlaintextCorpusReader

reader = CategorizedPlaintextCorpusReader('C:\Test Data Model FR', r'.*\.txt', cat_pattern=r'(\w+)/*')

#Create a document out of the corpus to use in the analyses
documents = [(list(reader(fileid)), category)
              for category in reader.categories()
              for fileid in reader.fileids(category)]

Ошибка появляется при запуске часть «документы = ...». Кто-нибудь может мне помочь? Почему объект не вызывается?

Спасибо.

...