Выскабливание остановка на первой линии - PullRequest
0 голосов
/ 10 мая 2018

Мне нужно отказаться от веб-сайта, чтобы получить некоторую информацию, такую ​​как название фильма и соответствующие ссылки. Мой код работает правильно, но он останавливается на первой строке сайта. Это мой код, заранее благодарю за помощь и извините, если это не умный вопрос, но я новичок.

import requests

from bs4 import BeautifulSoup

URL= 'http://www.simplyscripts.com/genre/horror-scripts.html'

def scarica_pagina(URL):
    page = requests.get(URL)
    html = page.text
    soup = BeautifulSoup(html, 'lxml') l
    films = soup.find_all("div",{"id": "movie_wide"})
    for film in films:
        link = film.find('p').find("a").attrs['href']
        title = film.find('p').find("a").text.strip('>')
        print (link)
        print(title)

1 Ответ

0 голосов
/ 10 мая 2018

Попробуйте нижеуказанным способом.Я немного изменил ваш сценарий, чтобы он служил цели и выглядел лучше.Дайте мне знать, если у вас возникнут какие-либо проблемы:

import requests
from bs4 import BeautifulSoup

URL = 'http://www.simplyscripts.com/genre/horror-scripts.html'

def scarica_pagina(link):
    page = requests.get(link)
    soup = BeautifulSoup(page.text, 'lxml')
    for film in soup.find(id="movie_wide").find_all("p"):
        link = film.find("a")['href']
        title = film.find("a").text
        print (link,title)

if __name__ == '__main__':
    scarica_pagina(URL)
...