Есть ли способ получить исходное местоположение элемента в документе, т.е.индекс начала и конца символа при разборе html / xml в Python?
Я просмотрел документацию по lxml и ничего не смог найти.
например.
<a>1</a><b>2</b>
...
print tree.find('b').original_position
# result: (9, 16)