У меня есть какая-то строка, в которой есть слово и номер.
[1] "\r\nfund \r\ncompany \r\nfee \r\nsales \r\ngroup \r\npayment \r\nmanagement \r\nfirm \r\nfee \r\ntotal \r\npayment \r\nsubtotal \r\nfee \r\nsynthetic \r\nfee... sth ... \r\n0.646 0.030 0.030 0.015 1.253....
Как вы можете видеть, есть шаблон, в котором есть оплата, оплата. Моя конечная цель - сгруппировать слова, чтобы составить эту таблицу, используя функцию сканирования или еще (если у вас есть идеи, пожалуйста, ответьте с этим.)
Поэтому я попытался удалить все пустые, потому что функция сканирования (я думаю) идентифицируйте с некоторым пробелом в качестве стандартного для разделения слов группы.
Опять же, я хочу сделать эту строку такой:
[1] "\r\nfundcompanyfee \r\nsalesgrouppayment \r\nmanagementfirmfee \r\ntotalpayment \r\nsubtotalfee \r\nsyntheticfee... sth ... \r\n0.646 0.030 0.030 0.015 1.253....
Я пытался использовать функцию gsub следующим образом
gsub("\r\n\\w\\w.*?fee|payment","\\w\\w",strings)
но результат был ужасен. он делает строку вроде этой
ww ww ww ww........ 0.646 0.030 0.030 ....
, то есть он не распознает \ w как слово ... просто переведите его в 'w' как есть!
Так что мне нужна помощь, чтобы справиться с этим. Спасибо за чтение.