Question

Я использую bs4 в python для разбора веб-страниц и получения информации. У меня проблемы с получением только названия. Другая часть, с которой я боролся, - переход по ссылкам. Должно ли это быть сделано рекурсивно или я смогу сделать это через цикл?

def getTitle(link):
    resp = urllib.request.urlopen(link)
    soup = BeautifulSoup(resp, 'html.parser')
    print(soup.find("<title>"))

Martin Evans · Answer 1 · 27 апреля 2018

from bs4 import BeautifulSoup    
import urllib    

def getTitle(link):
    resp = urllib.request.urlopen(link)
    soup = BeautifulSoup(resp, 'html.parser')
    return soup.title.text

print(getTitle('http://www.bbc.co.uk/news'))

Который отображает:

Home - BBC News

Как получить заголовки с веб-страниц, используя Beautiful Soup в Python и проходя через

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить заголовки с веб-страниц, используя Beautiful Soup в Python и проходя через

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов