Извлечение текста начинается с конкретных слов на R - PullRequest
0 голосов
/ 29 января 2019

Я извлекаю текст из строки.Пример данных выглядит следующим образом:

index <- c(1,2)
tag <- c('{"tags":["test_apple","test_orange","result_grape"]}',
'{"tags":["test_kiwi","test_pear","result_apple"]}')
sample <- data.frame(index,tag)  

Я хочу создать новый столбец и извлекать текстовые звездочки только с «результатом» из «тега».Результат должен выглядеть так:

result <- c('"result_grape"','"result_apple"')
sampleresult <- data.frame(index,result)

Я пробовал tstrsplit, но он не работал.

tstrsplit(sampledata, "rep_")[[2]]

1 Ответ

0 голосов
/ 29 января 2019

Я бы посоветовал stringr library:

library(stringr)
result <- str_extract(sample[,2],"result_[A-z]+")
sampleresult <- data.frame(index,result)

  index       result
1     1 result_grape
2     2 result_apple

Если вы хотите сохранить кавычки, используйте str_extract(sample[,2],"\"result_[A-z]+\"").

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...