Я пытаюсь классифицировать отдельные URL-адреса из журнала веб-сервера. Из-за специфических специфических URL-адресов (используя определенные шаблоны, и я хотел создать категорию для каждого шаблона), К сожалению, я не нашел хорошего способа размещения нескольких шаблонов
пример кода:
URL_List <- c("/WX_PaymentTran/Acct/12345","/WY_PaymentTran/Acct/678", "/DL_PaymentDaily/Acct/890") # sample , 100s of URLs
URL_df <- data.frame(URL_List)
URL_df$NewCat <- "N/A"
URL_df$NewCat <- gsub("^/.*PaymentTran/.*","A",URL_df$URL_List)
URL_df$NewCat <- gsub("^/.*PaymentDaily/.*","B",URL_df$URL_List)
2-й оператор gsub Значение NewCat перезаписывается (как поставить условие в этой строке, чтобы не обновлять уже классифицированную категорию
Примечание: есть категория более 100, над выражениями gsubвсего 2 сэмпла
Таким образом, результирующий фрейм данных будет иметь NewCat с различными значениями "A" / "B", / "C" и т. д. на основе шаблонов. Любой намек?