Я пытаюсь извлечь несколько сообщений на форуме, используя стандартный метод XPath:
response.xpath('.//div[contains(@class, "Message userContent")]')
Этот ответ возвращает полный список комментариев по желанию.
Нокак только я включаю //text()
или string(...)
, длина списка увеличивается до 100 или 150 элементов, что делает невозможным понимание или перебор списка и объединение его с другими данными, такими как автор или дата ...
normalize-space(...)
возвращает только первый комментарий.
Он должен что-то делать со всеми новыми строками и разрывами в HTML-коде, но на данном этапе я не знаю, как с этим справиться.
Будет ли string-join(...[normalize-space()])
вариант здесь?