У меня есть основной фрейм данных, в котором содержится множество веб-сайтов, с которыми я работаю, а другой фрейм данных содержит список плохих веб-сайтов, которые можно сопоставить и определить, есть ли у меня плохие веб-сайты в моем основном фрейме данных. Поскольку я очень новичок в этом, я не уверен, как сопоставить и заменить плохие веб-сайты на «www.badwebsite.com»? Спасибо.
Вот пример фреймов данных:
site_list <- data.frame("host" = c("www.companya.com", "www.companyb.com", "www.malwaresite.com",
"www.companyc.com", "www.companyd.com", "www.virussite.com",
"www.companye.com", "www.companyf.com", "www.phishingsite.com"),
"URL" = c("www.companya.com/home", "www.companyb.com/home", "www.malwaresite.com/home",
"www.companyc.com/home", "www.companyd.com/home", "www.virussite.com/home",
"www.companye.com/home", "www.companyf.com/home", "www.phishingsite.com/home"))
bad_site_list <- data.frame("host" = c("www.malwaresite.com", "www.virussite.com", "www.phishingsite.com"))
Я надеюсь достичь этого результата:
host URL
www.companya.com www.companya.com/home
www.companyb.com www.companyb.com/home
www.badwebsite.com www.badwebsite.com/home
www.companyc.com www.companyc.com/home
www.companyd.com www.companyd.com/home
www.badwebsite.com www.badwebsite.com/home
www.companye.com www.companye.com/home
www.companyf.com www.companyf.com/home
www.badwebsite.com www.badwebsite.com/home