Код для сайта здесь: https://i.imgur.com/uIJO20R.png
Код, который я использую:
import requests
import time
from bs4 import BeautifulSoup
import sys
sys.stdout = open("links.txt", "a")
for x in range(0, 2):
try:
URL = f'https://link.com/{x}'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'html.parser')
rows = soup.find_all('div', id='view')
for row in rows:
print(row.text)
time.sleep(5)
except:
continue
Я просто хочу вывод списка ссылки, как показано в выделенном коде. Но вместо этого это приводит ко всему коду представления, а не только к HREF, что я и хочу.
Пример вывода, который он производит:
<div id="view">
<a href="/watch/8f310ba6dfsdfsdfsdf" target="_blank"><img src="/thumbs/jpg/8f310ba6dfsdfsdfsdf.jpg" width="300"/></a>
...
...
Когда то, что я хочу, чтобы это произвело это:
/watch/8f310ba6dfsdfsdfsdf
...
...