это рабочее решение, использующее BeautifulSoup и некоторое неприятное регулярное выражение, но оно работает нормально.Я люблю регулярные выражения, но кажется, что я делаю их странным образом, я могу объяснить вам, как они работают, если хотите.
import re, urllib.request
from bs4 import BeautifulSoup
url = "https://www.imdb.com/search/title?groups=top_250&sort=user_rating"
response = urllib.request.urlopen(url)
html = response.read()
soup = BeautifulSoup(html, 'html.parser')
i = 0
for txt in soup.findAll(attrs={"class" :"lister-item-header"}):
i += 1
print(str(i) + " ." + re.match("""^.*>(.*)</a>.*$""", re.sub('"', '', re.sub('\n', '', str(txt)))).group(1))
Мой вывод: (это французский ...)
Les évadés
Le parrain
Темный рыцарь: Le chevalier noir
Le parrain, 2ème partie
Le seigneur des anneaux: Le retour du roi
И этот список можно продолжить ...