Question

Я пытаюсь извлечь описание романа из этого URL https://www.wuxiaworld.co/Horizon-Bright-Moon-Sabre/

Howevery, когда я пытаюсь этот код:

html=requests.get(site)
html.encoding = html.apparent_encoding
soup = BeautifulSoup(html.text,"html.parser")
summary = soup.find(id ='intro').get_text()
print (summary)

Я получаю:

Описание

Процесс завершен с кодом выхода 0

Любая помощь будет признательна, спасибо заранее.

petezurich · Answer 1 · 21 января 2020

Попробуйте:

site = "https://www.wuxiaworld.co/Horizon-Bright-Moon-Sabre/"
html = requests.get(site)
soup = BeautifulSoup(html.content)
summary = soup.find(id ='intro')
print(summary.text)

Это напечатано:

Описание Фу Хунсюэ был калекой, родился с хромой ногой и подвергался эпилептическим припадкам c. Он был также одной из самых могущественных, легендарных фигур в мире боевых искусств, с тупой черной саблей, которая не имела себе равных. Его известность делала его частой целью противников, но всякий раз, когда его сабля оставляла свои ножны, только трупы оставались на его пути. Однажды, однако, F ...

Web-scraping: невозможно извлечь необходимый текст

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Web-scraping: невозможно извлечь необходимый текст

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов