Как лучше всего обрабатывать несколько документов вместе в компоненте spaCy? - PullRequest
0 голосов
/ 08 ноября 2018

Я учусь spaCy, чтобы включить его в качестве инструмента goto NLP.

Я хочу создать компонент, соответствующий заданному правилу POS, если выражение соответствует минимальному порогу частоты для всех документов.

Является ли лучшая практика для

  1. создать отдельную Pipe
  2. обработать документы вместе после завершения первого Pipe
  3. отправка документов через второй канал
...