Я пытаюсь записать праздничную таблицу в файл этого сайта: /// C: /Users/alexa/AppData/Local/Temp/tmptz9muzp9.html
у меня есть заголовки и первый и третий столбцы, но 2-й столбец выглядит так:
<td>
<span>1<span>
<sup>er <sup>
<span> ...
когда я использую свой xpath: span_xpath = tree.xpath('//*[@id="main"]/article/div/table/tbody/tr/td/span/text()')
возвращает список, где sup 1 «er» отсутствует, и добавляет дополнительную строку с нежелательным кодом
['1',
'\xa0janvier (lundi)',
'1',
'\xa0janvier (mardi)',
'2 avril',
'1',
'\xa0mai (mardi)',
'1',
'\xa0mai (mercredi)',
'10 mai (jeudi)',
'21 mai',
'23 juin (samedi)',
'23 juin (dimanche)',
'15 août (mercredi)',
'1',
'\xa0novembre (jeudi)',
'1',
'\xa0novembre (vendredi)',
'25 décembre (mardi)',
'25 décembre (mercredi)',
'26 décembre (mercredi)']
Я хотел бы весь путь с пролетом и sup.