Как вы используете PyTextRank или другие конвейеры spaCy параллельно между несколькими процессами? - PullRequest
0 голосов
/ 13 апреля 2020

Я пытаюсь суммировать многие документы и у меня возникают проблемы с повышением производительности, потому что я не могу понять, как использовать расширение PyTextRank для spaCy для параллельного суммирования документов между несколькими процессами. Единственный метод параллельной обработки, указанный в документах , показывает использование nlp.pipe() (Language.pipe) . Однако вы не можете вызвать PyTextRank для документа внутри nlp.pipe(), он позволяет использовать себя только через Language.add_pipe(). Я посмотрел код для pytextrank.pytextrank , чтобы убедиться в этом.

Как вы используете параллельный конвейер без использования nlp.pipe()? Как вы делаете nlp.add_pipe() параллельно?

...