Я очищаю сайт, используя Scrapy, который возвращает файл типа json в строковом формате.
Когда я использую селектор ниже, я получаю полные данные, как и ожидалось, внутри списка.
response.xpath('//p/text()').extract()
Данные в этом списке представляют собой строки в формате json, которые мне нужно преобразовать в словарь, для которого я использую json.loads()
Но проблема возникает при использовании приведенного нижеселектор для получения json-подобной строки, присутствующей в списке.
response.xpath('//p/text()').extract_first()
Это дает частично усеченную строку как и вывод, и, следовательно, json.loads()
дает и ошибку неопределенной строки.
Примечание: Iпробовал похожие селекторы типа .extract()[0], getall()[0]
и т. д. все сталкиваются с той же проблемой.Также при печати печатается усеченная частичная строка.