Как избежать сегментации предложения от союза в пространстве - PullRequest
0 голосов
/ 14 июля 2020

Я использую spacy для интеллектуального анализа текста в одном из моих проектов. Есть ли способ избежать сегментации предложений из координационного соединения (и, или, еще, et c ..) без использования пользовательской сегментации.

document = "I love swimming and i love playing badminton too"
doc = nlp(document)
for sent in doc.sents:
    print(sent)

Вывод:

I love swimming 
and i love playing badminton too

Ожидаемый результат:

I love swimming and i love playing badminton too

1 Ответ

0 голосов
/ 14 июля 2020

Перейти на spaCy 2.3.0 и en_core_web_sm 2.3.0. Последние версии spaCy нестабильны.

pip install spacy==2.3.0
python -m spacy downoad en_core_web_sm

Если в вашей виртуальной среде уже установлен spaCy, то вам следует удалить и создать новую виртуальную среду, поскольку spaCy имеет множество зависимостей, и непросто определить причину проблемы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...