Как извлечь данные с веб-сайта с помощью пагинации, когда номер страницы не назначен? - PullRequest
0 голосов
/ 21 июня 2020

Я использую расширение майнера данных для Google Chrome для извлечения данных с веб-страниц. Для извлечения данных с нескольких страниц одновременно майнер данных использует опцию разбивки на страницы. Вот ссылка на веб-сайт, с которого я хочу извлечь данные.

http://case.doe.gov.bd/index.php?option=com_content&view=category&id=8&Itemid=32

В настоящее время я могу щелкнуть каждую ссылку и получить таблицу данных с помощью майнера данных .

http://case.doe.gov.bd/index.php?option=com_content&view=article&id=2342: air-quality-index & catid = 8: aqi-archives & Itemid = 32

  1. Как я могу получить данные со всех страницы за раз с помощью пагинации?

  2. Дата назначается над таблицей. Как я могу получить это в виде столбца для каждой таблицы?

...