BeautifulSoup Python: получить текст без тегов и получить соседние ссылки - PullRequest
0 голосов
/ 06 марта 2019

Я пытаюсь извлечь названия фильмов и ссылки на них с этого сайта

from bs4 import BeautifulSoup
from requests import get


link = "https://tamilrockerrs.ch"
r = get(link).content
#r = open('json.html','rb').read()
b = BeautifulSoup(r,'html5lib')
a = b.findAll('p')[1]

Но проблема в том, что нет тегов для заголовков. Я не могу извлечь заголовки, и если бы я мог сделать это, как я могу связать ссылки и заголовок вместе.

Заранее спасибо

1 Ответ

1 голос
/ 06 марта 2019

Таким способом можно найти title и link.

from bs4 import BeautifulSoup
import requests    

url= "http://tamilrockerrs.ch"

response= requests.get(url)

data = response.text

soup = BeautifulSoup(data, 'html.parser')

data = soup.find_all('div', {"class":"title"})

for film in data:
    print("Title:", film.find('a').text) # get the title here 
    print("Link:",  film.find('a').get("href")) #get the link here 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...