Автоматизируйте очистку от большого списка URL, чтобы извлечь конкретный текст - PullRequest
0 голосов
/ 06 ноября 2019

Я пытаюсь автоматизировать извлечение из большого списка URL-адресов для извлечения конкретного текста.

URL-адреса веб-сайтов могут быть сгруппированы в наборы, в которых один набор может быть:

https://aecom.jobs/mackay-aus/senior-water-resources-engineer/624E99A0951B455E99C84ACEA0037A22/job/ https://aecom.jobs/sydney-au-aus/senior-track-engineer/EA2F94F54DE946C5B6FF47594CAC77E2/job/ https://aecom.jobs/sydney-au-aus/senior-sesa-engineer/856EB65733094A0D8467577640B9FC75/job/ https://aecom.jobs/sydney-au-aus/principal-ohw-engineer/ADDFF86B254841E1B00E6518B12A6778/job/

как я могу сделать это с помощью Azure или каким-либо другим лучшим способом, я пробовал несколько программ для очистки веб-сайтов, но результаты анализа /бесполезно.

Спасибо.

1 Ответ

0 голосов
/ 06 ноября 2019

Я все время скребу рабочие доски с помощью скребка, и это не должно быть сложно. Я не понимаю, где у вас возникли трудности: при запросе URL-адресов, анализе нужных вам данных или сохранении данных.

...