Я пытаюсь суммировать многие документы и у меня возникают проблемы с повышением производительности, потому что я не могу понять, как использовать расширение PyTextRank для spaCy для параллельного суммирования документов между несколькими процессами. Единственный метод параллельной обработки, указанный в документах , показывает использование nlp.pipe()
(Language.pipe) . Однако вы не можете вызвать PyTextRank для документа внутри nlp.pipe()
, он позволяет использовать себя только через Language.add_pipe()
. Я посмотрел код для pytextrank.pytextrank , чтобы убедиться в этом.
Как вы используете параллельный конвейер без использования nlp.pipe()
? Как вы делаете nlp.add_pipe()
параллельно?