Скребковый стол с <br>между (не появляется) - PullRequest
0 голосов
/ 24 мая 2018

Я не могу получить таблицу из html с BeautifulSoup.Я пробовал с xpath, но я не знаю, как это работает ... Я хочу найти текст песни, но она не появляется в "супе".Зачем?Возможно ли получить его с BeautifulSoup?Является ли xpath лучшей альтернативой?

Пример из https://www.musica.com/letras.asp?letra=113. Упрощение моего кода:

from bs4 import BeautifulSoup
import requests
import re
import urllib

url = "https://www.musica.com/letras.asp?letra=113" 
soup = BeautifulSoup(requests.get(url).text, 'html5lib')
print(soup)

Я думаю, что проблема заключается в
, своего рода разрыве.

1 Ответ

0 голосов
/ 24 мая 2018

Попробуйте, чтобы получить текст с этой страницы:

from bs4 import BeautifulSoup
import requests

url = "https://www.musica.com/letras.asp?letra=113" 

soup = BeautifulSoup(requests.get(url).text, 'html5lib')
for items in soup.select_one("table[style='width:100%;margin:0px auto']").select("tr")[:-3]: #kicking out the last three blank rows
    data = '\n'.join([item.get_text() for item in items.select("td p")])
    print(data)

Вывод:

You can dance, you can jive 
Having the time of your life 
See that girl, watch that scene 
Dig in the Dancing Queen
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...