трубопровод stanfordNLP - Python - PullRequest
0 голосов
/ 30 мая 2019

Мне было интересно, как на самом деле использовать конвейер StanfordNLP через python с использованием библиотеки stanfordnlp. Кажется, что нет четкой документации относительно того, как на самом деле вводить аннотаторы, их атрибуты и т. Д.?

Например, nlp = stanfordnlp.Pipeline () устанавливает новый конвейер. Есть ли способ указать, какие аннотаторы он использует?

Например, я хочу указать следующие команды:

-annotators tokenize,ssplit,pos,lemma,ner,depparse,coref,quote -coref.algorithm statistical

Как мне это сделать с помощью команды stanfordnlp.Pipeline ()?

1 Ответ

0 голосов
/ 01 июня 2019

Есть два трубопровода:

  • собственный конвейер Python запускает tokenize, mwt, pos, lemma, depparse
  • традиционный конвейер Java

Если вы хотите использовать конвейер Java, вам нужно использовать сервер.

Подробное обсуждение этого здесь: https://stanfordnlp.github.io/stanfordnlp/corenlp_client.html

...