Question

Я хотел бы получить полный текст веб-страницы, к сожалению, мой скребок также захватывает код CSS, как я могу завершить код ниже, чтобы удалить также код стиля CSS:

page = " ".join(response.xpath('//body//descendant-or-self::*[not(self::script)]/text()').extract())

Umair · Answer 1 · 29 января 2019

Попробуйте

//body//descendant-or-self::*[not(self::script or self::style)]

Я тестировал, и он работает, он исключает теги STYLE и SCRIPT

удалить код стиля CSS, когда я получаю текст веб-страницы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

удалить код стиля CSS, когда я получаю текст веб-страницы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов