Я использую ElementTree и не могу понять, является ли дочерний узел текстовым или нет.childelement.text
, похоже, не работает, поскольку дает ложное срабатывание даже на узлах, которые не являются текстовыми узлами.
Есть предложения?
Пример
<tr>
<td><a href="sdas3">something for link</a></td>
<td>tttttk</td>
<td><a href="tyty">tyt for link</a></td>
</tr>
После анализа этого xml-файла я делаю это на Python:
for elem_main in container_trs: #elem_main is each tr
elem0 = elem_main.getchildren()[0] #td[0]
elem1 = elem_main.getchildren()[1] #td[1]
elem0 = elem_main.getchildren()[0]
print elem0.text
elem1 = elem_main.getchildren()[1]
print elem1.text
Приведенный выше код не выводит elem0.text;это пустоЯ вижу elem1.text (то есть tttttk ) в выводе.
Обновление 2
Я на самом деле строю словарь.Текст из элемента с каждым, так что я могу отсортировать таблицу HTML.Как бы я получить с в этом коде?