Моя библиотека, spaCy , предоставляет высокопроизводительный анализатор зависимостей.
Установка:
pip install spacy
python -m spacy.en.download all
Использование:
from spacy.en import English
nlp = English()
doc = nlp(u'A whole document.\nNo preprocessing require. Robust to arbitrary formating.')
for sent in doc:
for token in sent:
if token.is_alpha:
print token.orth_, token.tag_, token.head.lemma_
Choi et al.(2015) признал spaCy самым быстрым из доступных анализаторов зависимостей.Он обрабатывает более 13 000 предложений в секунду в одном потоке.По стандартной оценке WSJ он набрал 92,7%, более чем на 1% точнее, чем любая из моделей CoreNLP.