Мне нужно сохранить в переменной str всю страницу html. Я делаю это:
import requests
from bs4 import BeautifulSoup
url = my_url
response = requests.get(url)
page = str(BeautifulSoup(response.content))
Это работает, но страница в my_url не «завершена». Это веб-сайт, на котором до конца будут загружаться новые вещи, и мне нужна вся страница, а не только основная видимая часть.
Есть ли способ загрузить всю страницу, а затем сохранить ее?
Я также попытался загрузить страницу вручную, а затем посмотрел на исходный код, но последняя часть страницы все еще не видна.
В качестве альтернативы, все, что я хочу от страницы my_url, - это все ссылки внутри нее, и все они имеют вид:
my_url/something/first-post
my_url/something/second-post
Есть ли способ найти все ссылки другим способом? Итак, все возможные URL-адреса, которые начинаются с "my_url / something /"
Заранее спасибо