Вы можете собрать текст из каждого элемента td
и объединить их с помощью ' '.join(...)
:
import lxml.html as LH
content = '''
<table>
<tr>
<td colspan=2>Date</td>
</tr>
<tr id='something'>
<td>8 september</td>
<td>2008</td>
</tr>
</table>
'''
doc = LH.fromstring(content)
date = ' '.join(td.text for td in doc.xpath('//table/tr[@id = "something"]/td'))
print(date)
выходы
8 september 2008
Или, если вы можете обработать возврат каретки, вы можете использовать метод text_content()
:
for td in doc.xpath('//table/tr[@id = "something"]'):
print(td.text_content())
выходы
8 september
2008