Ошибка категории обзоров фильмов - NTLK - PullRequest
0 голосов
/ 13 июня 2018

Я изучаю анализ настроений, тестируя встроенный корпус обзоров фильмов NLTK.Я пытаюсь извлечь идентификаторы файлов из положительной категории:

from nltk.corpus import movie_reviews as mr

poslearn1 = mr.fileids(categories="pos"[667:])

, но постоянно получаю сообщение об ошибке:

"Категория не найдена"

, хотя poslearn1 = mr.fileids(categories="pos"[:667]), кажется, работает.

Любая помощь будет принята с благодарностью, я застрял на этом некоторое время.

1 Ответ

0 голосов
/ 13 июня 2018

Следующая строка не имеет никакого смысла

poslearn1 = mr.fileids(categories="pos"[:667])

Это просто эквивалентно написанию

poslearn1 = mr.fileids(categories="pos")

Вы можете попробовать следующее

categories="pos"[:667]
print(categories) # prints pos

И этострока

categories="pos"[667:]

не найдет ничего, кроме пустой строки.Он пытается создать подстроку "pos", начиная с индекса 667, которая не существует.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...