Распознавание сущностей в R с использованием OpenNLP, проходящего через строки и генерирующего новый столбец - PullRequest
0 голосов
/ 14 апреля 2020

Я все еще очень новичок как в R (в основном использовал SAS раньше), так и в стеке, поэтому я надеюсь, что задаю этот вопрос правильно. У меня есть 100 документов, читаемых в DF, и я хочу l oop через каждую строку и создать третий столбец с сущностями.

вот код для рабочих примеров, с которыми я работаю

library(NLP)
library(rJava)
library(openNLP)
library(openNLPdata)


# Create the data frame.
example1 <- data.frame(
  text_name = c("text01", "text02", "text03", "text04", "text05"),
  text = c(" James wants pizza for dinner, Rick is a person","Dan said goodbye","Michelle is confused","Ryan wants to go home","Gary said hey"),
  stringsAsFactors = FALSE
)


sent_token_annotator <- Maxent_Sent_Token_Annotator()
word_token_annotator <- Maxent_Word_Token_Annotator()
example123 <- as.String(example1[1,2]) # i want this to loop through all rows 

a3 <- NLP:: annotate(example123, list(sent_token_annotator, word_token_annotator))

entity_annotator <- Maxent_Entity_Annotator()
entity_annotator
NLP:: annotate(example123, entity_annotator, a3)
## Directly:

entity_annotator(example123, a3)
## And slice ...
example123[entity_annotator(example123, a3)] #This is the values i want in the third column! 

Я действительно застрял, и у меня возникают некоторые серьезные проблемы с переходом на R. Любая помощь была бы прекрасной!

...