Я учусь spaCy, чтобы включить его в качестве инструмента goto NLP.
Я хочу создать компонент, соответствующий заданному правилу POS, если выражение соответствует минимальному порогу частоты для всех документов.
Является ли лучшая практика для
- создать отдельную
Pipe
- обработать документы вместе после завершения первого Pipe
- отправка документов через второй канал