Извлечение данных с веб-страницы в лист Excel - PullRequest
0 голосов
/ 18 октября 2018

Как я могу извлечь информацию с веб-страницы в лист Excel?

Веб-сайт https://www.proudlysa.co.za/members.php, и я хотел бы извлечь все перечисленные там компании и всю их соответствующую информацию.

Ответы [ 2 ]

0 голосов
/ 18 октября 2018

Я пытался создать что-то, чтобы захватить все страницы.Но прошло время и были ошибки.Это должно немного помочь вам.Вам придется сделать это на всех 112 страницах.

Используя chrome, перейдите на страницу

, наберите javascript: в URL, а затем вставьте приведенный ниже код.это должно дополнительно, что вам нужно.тогда вам нужно будет просто скопировать и вставить его, чтобы преуспеть.

var list = $(document).find(".pricing-list");
var csv ="";
for (i = 0; list.length > i;i++) {
    var dataTags = list[i].getElementsByTagName('li');
    var dataArr = [];
    for (j = 0; dataTags.length > j;j++) {
        dataArr.push(dataTags[j].innerText.trim());

    }
    csv += dataArr.join(', ') + "<br>";
}

вы получите что-то подобное

enter image description here

РЕДАКТИРОВАННЫЙ

используйте вместо этого автоматически загружать каждую страницу как CSV, а затем вы можете просто объединить их после того, как.

Убедитесь, что набрали javascript: в URLперед вставкой и нажатием введите

Также работает с Chrome, не уверен в других браузерах.я не пользуюсь ими много

var list = $(document).find(".pricing-list");
var csv ="data:text/csv;charset=utf-8,";
for (i = 0; list.length > i;i++) {
    var dataTags = list[i].getElementsByTagName('li');
    var dataArr = [];
    for (j = 0; dataTags.length > j;j++) {
        dataArr.push(dataTags[j].innerText.trim());

    }
    csv += dataArr.join(', ') + "\n";
}
var a = document.createElement("a");
a.href = ""+ encodeURI(csv);
a.download = "data.csv";
a.click();
0 голосов
/ 18 октября 2018

Процесс, на который вы ссылаетесь, называется очисткой веб-страниц, и вы можете попробовать несколько учебных пособий по VBA.

Кроме того, вы всегда можете попробовать
image

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...