Web-scraping: невозможно извлечь необходимый текст - PullRequest
0 голосов
/ 21 января 2020

Я пытаюсь извлечь описание романа из этого URL https://www.wuxiaworld.co/Horizon-Bright-Moon-Sabre/

Howevery, когда я пытаюсь этот код:

html=requests.get(site)
html.encoding = html.apparent_encoding
soup = BeautifulSoup(html.text,"html.parser")
summary = soup.find(id ='intro').get_text()
print (summary)

Я получаю:

Описание

Процесс завершен с кодом выхода 0

Любая помощь будет признательна, спасибо заранее.

1 Ответ

0 голосов
/ 21 января 2020

Попробуйте:

site = "https://www.wuxiaworld.co/Horizon-Bright-Moon-Sabre/"
html = requests.get(site)
soup = BeautifulSoup(html.content)
summary = soup.find(id ='intro')
print(summary.text)

Это напечатано:

Описание Фу Хунсюэ был калекой, родился с хромой ногой и подвергался эпилептическим припадкам c. Он был также одной из самых могущественных, легендарных фигур в мире боевых искусств, с тупой черной саблей, которая не имела себе равных. Его известность делала его частой целью противников, но всякий раз, когда его сабля оставляла свои ножны, только трупы оставались на его пути. Однажды, однако, F ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...