Невозможно получить ссылки с некоторого содержимого XML с веб-страницы. - PullRequest
0 голосов
/ 14 января 2019

Я написал скрипт на python для удаления различных ссылок из некоторого XML-контента с веб-страницы, но в результате ничего не получаю при выполнении следующего скрипта.

Какое возможное исправление я должен произвести, чтобы получить результат?

ссылка на сайт

Рассеянный кусок такого xml, содержащий ссылку:

<loc>
    https://www.bhphotovideo.com/c/product/163666-REG/Rosco_150053860016_Off_Broadway_Paint.html
</loc>

Моя попытка (скрипт не выдает никакого результата и не выдает никакой ошибки):

import requests
from bs4 import BeautifulSoup

link = 'https://www.bhphotovideo.com/SiteMap1.xml'

res = requests.get(link,headers={"User-Agent":"Mozilla/5.0"})
soup = BeautifulSoup(res.content,"xml")
for item in soup.select("url loc"):
    print(item.text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...