создание набора стоп-слов в nltk python - PullRequest
0 голосов
/ 23 декабря 2019

Я знаю, что в стоп-словах NLTk много языков, но что, если я хочу создать свой собственный набор стоп-слов и хочу использовать их в стоп-словах NLTK, это выполнимо?

import nltk
from nltk.corpus import stopwords
stops=set(stopwords.words('My own set'))
words=["Don't", 'hesitate','to','ask','questions']
print([word for word in words if word not in stops])

Ответы [ 2 ]

1 голос
/ 26 декабря 2019

Альтернативный или, возможно, более дешевый способ - создать файл FILENAME.py с стоп-словами в виде списка. Затем импортируйте FILENAME.py и вызовите список стоп-слов. Это исключит ввод / вывод.

1 голос
/ 23 декабря 2019

Сохранить набор стоп-слов с пробелом в качестве разделителя в текстовом файле, таком как stop.txt stop_words = open('stop.txt','r').read().split()

Это вернет список со стоп-словами в нем.

...