Я хочу извлечь пару (глагол-существительное) из каждой строки. Я хочу добавить другой столбец и поместить туда всю пару. Я использую набор данных Eron. Я работал над предварительной обработкой первой части (удалить число, пунктуацию ...) и знаю, что хочу чтобы обнаружить (глагол-существительное) любую помощь, пожалуйста
import spacy
import numpy as np
nlp = spacy.load('en')
a=nlp(str(train['text_lemmatized'])
noun_adj_pairs=[]
for i,token in enumerate(a):
if token.pos not in ('VERB','NOUN'):
continue
for j in range(i+1,len(a)):
if a[j].pos_ == 'NOUN':
noun_adj_pairs.append((token,a[j]))
break
noun_adj_pairs
данные