Question

Привет, у меня проблема с получением кода HTML без "\ n" Я попробовал normalize-space , но кажется, что он просто получает первый абзац (Не все сообщение )

Вот код, который я использую

response.xpath("normalize-space(//div[@class = 'messageContent'])").extract_first()

URL: https://teslamotorsclub.com/tmc/threads/tesla-tsla-the-investment-world-the-2019-investors-roundtable.139047/

Без нормализации-пробела

<div> class="sample">\n
<span style="color:red;">Sample Message\n</span</div>

с нормализованным пробелом

Sample Message

Я хотел также сохранить HTML-код без "\ n"

<div> class="sample">
<span style="color:red;">Sample Message</span</div>

Tomáš Linhart · Answer 1 · 29 апреля 2019

Если все, что вам нужно, это удалить символ новой строки из вывода, просто сделайте это:

response.xpath("//div[@class = 'messageContent']").extract_first().replace('\n', '')

Scrapy: как получить весь контент HTML без "\ n"

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Scrapy: как получить весь контент HTML без "\ n"

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов