@ PirateNinjas прямо сейчас. Объект Document
не имеет подкласса lxml.etree._Element
и поэтому не имеет метода .xpath()
. Это то, что указывает AttributeError
; каждый метод объекта является атрибутом (так же, как и переменная экземпляра), и, если метод с именем, которое вы запрашиваете, отсутствует, вы получите эту ошибку.
Однако Document._element
делает подклассом _Element
и может работать для вас. По крайней мере, это не даст вам этой ошибки и должно двигаться дальше в правильном направлении. Этот код должен предоставить вам все элементы <w:r>
в основной истории документа (т.е. тело документа, но не заголовки, сноски и т. Д.):
rs = document._element.xpath("//w:r")