Question

Я хочу сканировать следующий код HTML с помощью Scrapy:

<tbody id="pageData11">
<tr>
<td>
<div style="border-left:3px solid #1A8CFF  !important; float: left; padding-right: 5px;">&nbsp;</div>
2018-May-29 Tuesday
</td>

Awaish Kumar · Answer 1 · 31 мая 2018

Просто учитывая ваш данный пример в вопросе.

response.css('td::text').extract())

neverlastn · Answer 2 · 31 мая 2018

Строго говоря, ответ на ваш вопрос - response.xpath('/html/body/tbody/tr/td/div/following::text()').extract_first().strip(), но в данном случае это также текст в td.Таким образом, вы также можете сделать что-то вроде "".join(i.strip() for i in response.css('td::text').extract()).

Текст Scrapy после <div>

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Текст Scrapy после <div>

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов