Соскреб в Интернете со страницы поиска Google с использованием HTML-тега - PullRequest
0 голосов
/ 08 мая 2019

Я пытаюсь выполнить поиск в Google и получить первые 5 результатов (заголовок / URL) в документе Excel.

Я пытался использовать «Очистку данных», но в зависимости от условия поиска Google отобразит другую страницу. Иногда его будут иметь видео, изображения или связанные с ним условия поиска. Поэтому большую часть времени я не мог получить весь результат со страницы, так как uiPath не мог их распознать, возможно, из-за различий в div. Поэтому я подумал о том, чтобы получить их по тегу html, поскольку каждый заголовок использует H3, но я не могу найти способ сделать это.

Также пытался найти детей> получить атрибуты, но безуспешно, я чувствую, что это может быть лучшим способом, но я просто недостаточно экспериментировал с этим, чтобы заставить его работать. Пытался часами.

Кто-нибудь сталкивался с подобной проблемой и нашел решение?

1 Ответ

0 голосов
/ 15 мая 2019

Когда я делал это раньше, мне приходилось делать несколько операций очистки для получения данных.Первая очистка получит начальные результаты страницы, а затем вы можете сделать секунду, чтобы получить данные на странице 2 вперед.У меня были случаи, когда мне приходилось делать несколько записей на первой странице, чтобы получить всю информацию, но после страницы 1 данные были последовательными и их легко было почистить.Надеюсь, это поможет.

...