Заменить часть строки в python для скрипта bs4? - PullRequest
1 голос
/ 02 мая 2020

У меня есть скрипт BS4, который очищает ссылки. Он возвращает что-то похожее на это: "/ watch / f568a5e2sdfd783"

Я поместил это в Excel для массового преобразования, чтобы выглядеть так: https://website.com/f568a5e2sdfd783.jpg "

Как изменить код ниже, чтобы пропустить шаг Excel вручную, и просто заменить "/ watch /" на "https://website.com/" и добавить ".jpg" в конце, прежде чем будет напечатана ссылка?

Код:

    page = requests.get(URL)
    time.sleep(1)

    soup = BeautifulSoup(page.content, 'html.parser')

    for links in soup.find('div',id='view').find_all('a'):
        print(links['href'])
except:
    continue

1 Ответ

2 голосов
/ 02 мая 2020

Это должно работать для вашего случая:

website = "https://website.com/"

for links in soup.find('div',id='view').find_all('a'):
    parts = links['href'].split("/")
    new_link = parts[1].replace(parts[1], website) + '/'.join(parts[2:]) + ".jpg"
    print(new_link)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...