Я занимаюсь анализом настроений по заданным документам, моя цель в том, чтобы я хотел найти наиболее близкие или окружающие прилагательные слова относительно целевой фразы в моих предложениях. У меня есть идея, как извлечь окружающие слова относительно целевых фраз, но как мне найти относительно близкое или ближайшее прилагательное или NNP
или VBN
или другой тег POS относительно целевой фразы.
Вот набросок идеи о том, как заставить окружающие слова относиться к моей целевой фразе.
sentence_List= {"Obviously one of the most important features of any computer is the human interface.", "Good for everyday computing and web browsing.",
"My problem was with DELL Customer Service", "I play a lot of casual games online[comma] and the touchpad is very responsive"}
target_phraseList={"human interface","everyday computing","DELL Customer Service","touchpad"}
Обратите внимание, что мой исходный набор данных был задан как фрейм данных, в котором был дан список предложения и соответствующие целевые фразы. Здесь я просто смоделировал данные следующим образом:
import pandas as pd
df=pd.Series(sentence_List, target_phraseList)
df=pd.DataFrame(df)
Здесь я токенизирую предложение следующим образом:
from nltk.tokenize import word_tokenize
tokenized_sents = [word_tokenize(i) for i in sentence_List]
tokenized=[i for i in tokenized_sents]
затем я пытаюсь выяснить окружающие слова относительно моих целевых фраз, используя этот лут здесь . Тем не менее, я хочу выяснить относительно ближе или скрытнее adjective
, или verbs
или VBN
относительно моей целевой фразы. Как я могу это сделать? Любая идея, чтобы сделать это? Спасибо