Я только что скачал последнюю версию NLTK со всеми ее ресурсами.
Я вижу, could
и would
не указаны в качестве стоп-слов.
Но should
рассматривается как стоп-слово.
Это какая-то известная ошибка или ...?
In [7]: import nltk
In [8]: "shouldn't" in nltk.corpus.stopwords.words("english")
Out[8]: True
In [9]: "couldn't" in nltk.corpus.stopwords.words("english")
Out[9]: True
In [10]: "wouldn't" in nltk.corpus.stopwords.words("english")
Out[10]: True
In [11]: "should" in nltk.corpus.stopwords.words("english")
Out[11]: True
In [12]: "could" in nltk.corpus.stopwords.words("english")
Out[12]: False
In [13]: "would" in nltk.corpus.stopwords.words("english")
Out[13]: False