Сбор заголовков и субтитров с разных страниц - PullRequest
0 голосов
/ 05 мая 2020

Я студент и хожу дома на уроки в университете. Мой учитель только что дал мне эту работу, заключающуюся в том, чтобы взять все заголовки и подзаголовки из итальянского онлайн-журнала, которые включают слова «коронавирус» и / или «covid 19» в определенный промежуток времени (с 22 по 29 января и только 1 и 8 апреля) и записать их в файл Excel, чтобы проанализировать используемые слова. вроде 100-150 заголовков плюс субтитры, и у меня очень короткий срок. К сожалению, я тоже новичок в этом, и все, что я мог сделать сам, это найти способ собрать только заголовок с веб-страницы. Я использую, как и полагается новичку, Data Miner с Google Chrome.

Практически я должен найти все заголовки и субтитры с веб-сайта La Gazzetta dello Sport (ссылка на который я прилагаю ниже) который содержит слова «коронавирус» и / или «covid 19», но есть проблема: я вижу только заголовки на странице поиска, но чтобы получить субтитры, я должен щелкнуть статью и go перейти на другую страницу. Есть ли способ получить все результаты с помощью Data Miner или мне следует использовать другую программу?

Итак, просто для упрощения: я не могу понять, как заставить Data Miner собирать заголовок из поиска страницу, щелкните его до go на странице статьи, соберите подзаголовок и go обратно на страницу поиска, чтобы перейти к следующему заголовку и подзаголовку, и повторите. Я не знаю, возможно ли это, или это просто фантастика, как я уже сказал: я новичок ie в этом, и впервые использую такие инструменты.

URL: https://www.gazzetta.it/nuovaricerca/home.shtml?q=coronavirus&dateFrom=2020-01-22&dateTo=2020-01-29

...