Почему Beautiful Soup не возвращает содержимое? - PullRequest
0 голосов
/ 17 февраля 2020

Я использую bs4, чтобы очистить некоторые результаты. Я мог видеть содержимое HTML в исходном коде, но когда я пытаюсь получить его с помощью bs4, он не выдает, а говорит: «Файл не существует»

from bs4 import BeautifulSoup
import requests

source = requests.get("https://result.smitcs.in/grade.php?subid=BA1106")    
soup = BeautifulSoup(source.text, "html.parser")

marks_pre = soup.find("pre")
marks = marks_pre.find("div")

print(marks.prettify())

Приведенный выше код возвращает

<div style="font-family: courier; line-height: 12px;font-size:
20px;background:white;">  File does not exist </div>

Приведенный выше код работает нормально, если я скопирую исходный код из Интернета и сохраню его локально как файл HTML, а затем извлек его.

1 Ответ

0 голосов
/ 17 февраля 2020

попробуйте

from bs4 import BeautifulSoup
import requests

URL = "https://result.smitcs.in/grade.php?subid=BA1106"
PAGE = requests.get(URL)

# get HTML content
SOUP = BeautifulSoup(PAGE.content, 'lxml')

marks = SOUP.find("div")

print(marks.prettify())
...