У меня есть текст, который был помечен с использованием библиотеки НЛП:
text=("I/PRP guess/VBP my/PRP$ point/NN that/IN I/PRP be/VBD try/VBG to/TO communicate/VB ,/, be/VBZ how/WRB do/VBP these/DT pedo/NN ring/NNS get/VBP so/RB big/JJ before/IN they/PRP be/VBP expose/VBN ./.)"
, и у меня есть слова:
words=["my", "I"]
Я хочу найти все вхождения слова в текст и для этой части у меня есть:
pattern = r'\W.*?({})\W.*?'.format('|'.join(words))
s = re.findall(pattern, text, flags=re.IGNORECASE)
, но сначала мне нужно игнорировать части, которые идут после "/", иначе ничего не совпадает. Как я могу это сделать?