R lib Как вложить регулярное выражение и создать категориальную переменную - PullRequest
0 голосов
/ 23 сентября 2019

Я пытаюсь классифицировать отдельные URL-адреса из журнала веб-сервера. Из-за специфических специфических URL-адресов (используя определенные шаблоны, и я хотел создать категорию для каждого шаблона), К сожалению, я не нашел хорошего способа размещения нескольких шаблонов
пример кода:

URL_List <- c("/WX_PaymentTran/Acct/12345","/WY_PaymentTran/Acct/678", "/DL_PaymentDaily/Acct/890") # sample , 100s of URLs
URL_df <- data.frame(URL_List)
URL_df$NewCat <- "N/A"
URL_df$NewCat <- gsub("^/.*PaymentTran/.*","A",URL_df$URL_List)
URL_df$NewCat <- gsub("^/.*PaymentDaily/.*","B",URL_df$URL_List) 

2-й оператор gsub Значение NewCat перезаписывается (как поставить условие в этой строке, чтобы не обновлять уже классифицированную категорию

Примечание: есть категория более 100, над выражениями gsubвсего 2 сэмпла

Таким образом, результирующий фрейм данных будет иметь NewCat с различными значениями "A" / "B", / "C" и т. д. на основе шаблонов. Любой намек?

...