R - как сравнить список персонажей с онлайн-статьей - PullRequest
0 голосов
/ 16 июня 2020

У меня есть список векторов:

vector <- c("Retail","real consumption","jobs")

Я хочу сравнить список векторов с онлайн-статьей:

https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html

Я хочу вывести количество совпадений для каждого персонажа. Например, сколько раз в статье встречается «Розница» и сколько раз в статье встречается «реальное потребление», независимо от капиталов.

Первый шаг, который я сделал, - это загрузить ссылку на веб-сайт, используя

article <- download.file("https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html",destfile="basename(url)",method="libcurl")

Но я получил сообщение об ошибке:

cannot open URL 'https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html'
In addition: Warning message:
In download.file("https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html",  :
  URL 'https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html': status was 'Couldn't resolve host name'

Новое редактирование: я также пробовал ниже, но Я не уверен, где это go?

con <- url("https://finance.yahoo.com/news/coroanvirus-covid-may-2020-retail-sales-171911895.html", "rb") 
article <- read_html(con)

Выше всего лишь пример, в моем реальном примере мне нужно сравнить список векторов со многими онлайн-статьями. Может ли кто-нибудь показать мне, как это сделать, есть ли какой-нибудь встроенный пакет, который я мог бы использовать? Большое спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...