Regex поможет вычесть информацию из текста в R с помощью str_subset - PullRequest
0 голосов
/ 23 мая 2019

Привет и заранее спасибо за любую помощь

У меня длинный текст, он содержит много информации, но я хочу вычленить ее часть.

структуратекст и что мне нужно, так это

" requires_shipping = c(TRUE, TRUE), taxable = c(TRUE, TRUE), gift_card = c(FALSE, FALSE), tax_code = c(\"PC040204\", \"PC040204\"\n), name = c(\"Julian Backpack\", \"Mini M.A.C. Crossbody\"), variant_inventory_management = c(\"shopify\", \"shopify\") "

, что я ищу, это элементы внутри «имени», разделенные запятыми, поэтому в этом случае результат будет

"\"Julian Backpack\", \"Mini M.A.C. Crossbody\"

Я использую пакет stringr и пытаюсь использовать str_subset или grep

, когда я использую проверку моего регулярного выражения на https://regex101.com/

Я использую это регулярное выражение \bname\s[=].+?(?=\))и я могу получить это совпадение

name = c(\"Julian Backpack\", \"Mini M.A.C. Crossbody\"

, но когда я пытаюсь использовать его в RI, появляется ошибка

grep("\bname\s[=].+?(?=\))", string)
Error: '\s' is an unrecognized escape in character string starting ""\bname\s"

Еще раз спасибо

1 Ответ

0 голосов
/ 23 мая 2019

Использование sub

> sub(".*name.*\\((.*)\\),.*$", "\\1", string)
[1] "\"Julian Backpack\", \"Mini M.A.C. Crossbody\""
...