Попытка удалить escape-символы и пробелы из списка html.
Я использую normalize-space (), но не смог применить его ко всему списку.
Я тестирую свой код, используя scrapy shell
scrapy shell https://universalmotors.ru/boardmotors/suzuki/suzuki-df-4-s/
<tr itemprop="additionalProperty" itemscope="" itemtype="http://schema.org/PropertyValue">
<td class="label_table" itemprop="name">Мощность двигателя (л.с.)</td>
<td class="value_table">
<span itemprop="value">4</span>
</td>
</tr>
<tr itemprop="additionalProperty" itemscope="" itemtype="http://schema.org/PropertyValue">
<td class="label_table" itemprop="name">Тип масла в двигателе</td>
<td class="value_table">
<span itemprop="value">10W-30 10W-40</span>
</td>
</tr>
Вот что я попробовал
[item.normalize-space() for item in response.xpath('//tr[@itemprop="additionalProperty"]').extract()]
Но я получаю ошибку
Traceback (most recent call last):
File "<console>", line 1, in <module>
File "<console>", line 1, in <listcomp>
AttributeError: 'str' object has no attribute 'normalize'
Работает только для
[item.strip() for item in response.xpath('//tr[@itemprop="additionalProperty"]').extract()]
тогда я получаю следующий
['<tr itemprop="additionalProperty" itemscope="" itemtype="http://schema.org/PropertyValue">\n <td class="label_table" itemprop="name">Мощность двигателя (л.с.)</td>\n <td class="value_table">\n <span itemprop="value">4</span>\n </td>\n </tr>', '<tr itemprop="additionalProperty" itemscope="" itemtype="http://schema.org/PropertyValue">\n <td class="label_table" itemprop="name">Тип масла в двигателе</td>\n <td class="value_table">\n
Моя цель - начать:
Мощность двигателя (л.с.) 4
Тип масла в двигателе 10W-30 10W-40
Объем масла в двигателе 700