Question

С lxml.html как мне получить доступ к отдельным элементам без использования цикла for?

Это HTML:

<tr class="headlineRow">
  <td>
    <span class="headline">This is some awesome text</span>
  </td>
</tr>

Например, это приведет к ошибке IndexError:

 for row in doc.cssselect('tr.headlineRow'):
     headline = row.cssselect('td span.headline')
     print headline[0]

Это пройдет:

 for row in doc.cssselect('tr.headlineRow'):
     headline = row.cssselect('td span.headline')
     for first_thing in headline:
         print headline[0].text_content()

snapshoe · Answer 1 · 20 сентября 2010

Я обычно использую метод xpath для подобных вещей.Возвращает список подходящих элементов.

>>> spans = doc.xpath('//tr[@class="headlineRow"]/td/span[@class="headline"]')
>>> spans[0].text
'This is some awesome text'

Tim McNamara · Answer 2 · 26 августа 2010

Доступ к элементам осуществляется так же, как и к вложенным спискам:

>>> doc[0][0]
<Element span at ...>

Или с помощью селекторов CSS:

doc.cssselect('td span.headline')[0]

Steven · Answer 3 · 26 августа 2010

Ваш "провальный" пример отлично работает для меня? Либо вы ошиблись, когда пытались это сделать, либо вы используете более старую версию lxml, в которой есть - теперь исправленная - ошибка (я пробовал 2.2.6, а с 2.1.1 - самую старую из всех, что у меня были, и обе работали)

Manoj Govindan · Answer 4 · 26 августа 2010

Я опробовал ваш пример, используя CSSSelector и headline[0]. Смотрите ниже:

>>> html  ="""<tr class="headlineRow">
  <td>
    <span class="headline">This is some awesome text</span>
  </td>
</tr>"""
>>> from lxml import etree
>>> from lxml.cssselect import CSSSelector
>>> doc = etree.fromstring(html)
>>> sel1 = CSSSelector('tr.headlineRow')
>>> sel2 = CSSSelector('td span.headline')
>>> for row in sel1(doc):
    headline = sel2(row)
    print headline[0]

<Element span at 8f31e3c>

Доступ к первому элементу вывода в lxml.html

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Доступ к первому элементу вывода в lxml.html

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы