У меня есть следующий код
import nltk
from nltk.corpus import stopwords
nltk.download('stopwords')
import re
text='Director Of IT'
pattern = re.compile(r'\b(' + r'|'.join(stopwords.words('english'))+ r')\b\s*') #remove stop words
textmod5 = pattern.sub('', text)
print(textmod5)
Я хотел бы сделать только стоп-слово «Of» в нижнем регистре «of». Как добиться этого, используя то же выражение выше.
Я пробовал следующее, но безрезультатно
pattern = re.compile(r'\b(' + r'|'.join(stopwords.words('english'))+ r')\b\s*'.lower)
pattern = re.compile(r'\b(' + r'|'.join(stopwords.words.lower(('english')))+ r')\b\s*')
Каков будет правильный шаблон для достижения моей цели
Токовый выход: директор IT
Требуемый выход: директор IT