Извлечь пару (ГЛАГОЛ-Существительное) из списка - PullRequest
1 голос
/ 12 июля 2020

Я хочу извлечь пару (глагол-существительное) из каждой строки. Я хочу добавить другой столбец и поместить туда всю пару. Я использую набор данных Eron. Я работал над предварительной обработкой первой части (удалить число, пунктуацию ...) и знаю, что хочу чтобы обнаружить (глагол-существительное) любую помощь, пожалуйста

import spacy
import numpy as np
nlp = spacy.load('en')

a=nlp(str(train['text_lemmatized'])
noun_adj_pairs=[]
for i,token in enumerate(a):
    if token.pos not in ('VERB','NOUN'):
        continue
    for j in range(i+1,len(a)):
        if a[j].pos_ == 'NOUN':
           noun_adj_pairs.append((token,a[j]))
        break

noun_adj_pairs

данные

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...