Question

Я использую lxml для получения тега следующим образом:

el = doc.get_element_by_id('productDescription')

Насколько я понимаю, el содержит только этот тег и его дочерние элементы.

Когда я использую el.iterdescendants(), я получаю теги вне основного тега, который я извлекаю!
Как это возможно? (Это amazon.com, поэтому DOM хорош).

 el = doc.get_element_by_id('productDescription')
 for j in el.iterdescendants():
     print j.tag

Как правильно извлечь тег и работать только с потомками?

Jimbo Mombasa · Answer 1 · 17 января 2012

Вы должны использовать CSSSelector

import CSSSelector

, потому что это намного надежнее !!!

lxml python - извлечение тега и перебор дочерних элементов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

lxml python - извлечение тега и перебор дочерних элементов

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы