Scrapy: как получить весь контент HTML без "\ n" - PullRequest
0 голосов
/ 29 апреля 2019

Привет, у меня проблема с получением кода HTML без "\ n" Я попробовал normalize-space , но кажется, что он просто получает первый абзац (Не все сообщение )

Вот код, который я использую

response.xpath("normalize-space(//div[@class = 'messageContent'])").extract_first()

URL: https://teslamotorsclub.com/tmc/threads/tesla-tsla-the-investment-world-the-2019-investors-roundtable.139047/


Без нормализации-пробела

<div> class="sample">\n
<span style="color:red;">Sample Message\n</span</div>

с нормализованным пробелом

Sample Message

Я хотел также сохранить HTML-код без "\ n"

<div> class="sample">
<span style="color:red;">Sample Message</span</div>

1 Ответ

1 голос
/ 29 апреля 2019

Если все, что вам нужно, это удалить символ новой строки из вывода, просто сделайте это:

response.xpath("//div[@class = 'messageContent']").extract_first().replace('\n', '')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...