Извлечение файлов Sitemap с веб-сайта, когда он недоступен. заменитель hakrawler в Python - PullRequest
0 голосов
/ 19 июня 2020

Я ищу способ получить поддомены для определенного входного домена, когда домен явно не содержит файла карты сайта. Я нашел и использую hakrawler, но проблема в том, что он в golang, и мне сложно интегрировать его в мой проект в облаке. Если есть способ добиться таких же результатов в Python, пожалуйста, помогите.

например. для xyz.com

Мне нужно

xyz.com / ab c

xyz.com / lmn. html

и т. д. .

...