Я пытаюсь добавить пользовательский STOP_WORDS в spacy.Следующий код должен добавить пользовательский STOP_WORD "Bestellung" к стандартному набору STOP_WORDS.У меня проблема в том, что добавление работает, т.е. набор содержит «Bestellung» после добавления, но при тестировании пользовательского стоп-слова «Bestellung» с помощью .is_stop python возвращает FALSE.
Другой тест с STOP_WORD по умолчанию (т. Е. Он является стандартным в STOP_WORDS), «darunter» возвращает TRUE.Я не понимаю, потому что оба слова "Bestellung" и "darunter" находятся в одном наборе STOP_WORDS.
У кого-нибудь есть идеи, почему он так себя ведет?
Спасибо
import spacy
from spacy.lang.de.stop_words import STOP_WORDS
STOP_WORDS.add("Bestellung")
print(STOP_WORDS) #Printing STOP_WORDS proofs, that "Bestellung" is part of the Set "STOP_WORDS". Both tested words "darunter" and "Bestellung" are part of it.
nlp=spacy.load("de_core_news_sm")
print(nlp.vocab["Bestellung"].is_stop) # return: FALSE
print(nlp.vocab["darunter"].is_stop) # return: TRUE
Спасибо