Я пытаюсь разобрать некоторые ссылки с этого сайта https://news.ycombinator.com/
Я хочу выбрать конкретную таблицу
document.querySelector("#hnmain > tbody > tr:nth-child(3) > td > table")
Я знаю, что существуют ограничения на css-селектор для bs4. Но проблема в том, что я даже не могу выбрать так просто, как #hnmain > tbody
с soup.select('#hnmain > tbody')
, так как он возвращает empty
с кодом ниже, я не могу разобрать tbody, тогда какс js я сделал (скриншот)
from bs4 import BeautifulSoup
import requests
print("-"*100)
print("Hackernews parser")
print("-"*100)
url="https://news.ycombinator.com/"
res=requests.get(url)
html=res.content
soup=BeautifulSoup(html)
table=soup.select('#hnmain > tbody')
print(table)
OUT:
soup=BeautifulSoup(html)
[]
