Я пытаюсь разбить предложения на части с использованием RegEx на слово «но» (или на любые другие слова с координированным соединением).Это не работает ...
sentence = nltk.pos_tag(word_tokenize("There are no large collections present but there is spinal canal stenosis."))
result = nltk.RegexpParser(grammar).parse(sentence)
DigDug = nltk.RegexpParser(r'CHUNK: {.*<CC>.*}')
for subtree in DigDug.parse(sentence).subtrees():
if subtree.label() == 'CHUNK': print(subtree.node())
Мне нужно разделить предложение "There are no large collections present but there is spinal canal stenosis."
на два:
1. "There are no large collections present"
2. "there is spinal canal stenosis."
Я также хочу использовать один и тот же код для разделения предложений в 'ии другие слова координирующего соединения (СС).Но мой код не работает.Пожалуйста, помогите.