Я все еще очень новичок как в R (в основном использовал SAS раньше), так и в стеке, поэтому я надеюсь, что задаю этот вопрос правильно. У меня есть 100 документов, читаемых в DF, и я хочу l oop через каждую строку и создать третий столбец с сущностями.
вот код для рабочих примеров, с которыми я работаю
library(NLP)
library(rJava)
library(openNLP)
library(openNLPdata)
# Create the data frame.
example1 <- data.frame(
text_name = c("text01", "text02", "text03", "text04", "text05"),
text = c(" James wants pizza for dinner, Rick is a person","Dan said goodbye","Michelle is confused","Ryan wants to go home","Gary said hey"),
stringsAsFactors = FALSE
)
sent_token_annotator <- Maxent_Sent_Token_Annotator()
word_token_annotator <- Maxent_Word_Token_Annotator()
example123 <- as.String(example1[1,2]) # i want this to loop through all rows
a3 <- NLP:: annotate(example123, list(sent_token_annotator, word_token_annotator))
entity_annotator <- Maxent_Entity_Annotator()
entity_annotator
NLP:: annotate(example123, entity_annotator, a3)
## Directly:
entity_annotator(example123, a3)
## And slice ...
example123[entity_annotator(example123, a3)] #This is the values i want in the third column!
Я действительно застрял, и у меня возникают некоторые серьезные проблемы с переходом на R. Любая помощь была бы прекрасной!