У меня есть список векторов:
vector <- c("Retail","real consumption","jobs")
Я хочу сравнить список векторов с онлайн-статьей:
https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html
Я хочу вывести количество совпадений для каждого персонажа. Например, сколько раз в статье встречается «Розница» и сколько раз в статье встречается «реальное потребление», независимо от капиталов.
Первый шаг, который я сделал, - это загрузить ссылку на веб-сайт, используя
article <- download.file("https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html",destfile="basename(url)",method="libcurl")
Но я получил сообщение об ошибке:
cannot open URL 'https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html'
In addition: Warning message:
In download.file("https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html", :
URL 'https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html': status was 'Couldn't resolve host name'
Новое редактирование: я также пробовал ниже, но Я не уверен, где это go?
con <- url("https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html", "rb")
article <- read_html(con)
Выше всего лишь пример, в моем реальном примере мне нужно сравнить список векторов со многими онлайн-статьями. Может ли кто-нибудь показать мне, как это сделать, есть ли какой-нибудь встроенный пакет, который я мог бы использовать? Большое спасибо!