Возможно, вы захотите включить ключевое слово as_tuples
в nlp.pipe
, что позволит вам передать список из (text, context)
кортежей и даст (doc, context)
кортежей. Таким образом, вы можете сделать что-то вроде этого:
data = [('Some text', 1), ('Some other text', 2)]
def process_text(data):
for doc, chapter_id in nlp.pipe(data, as_tuples=True):
doc._.chapter_id = chapter_id
yield doc