Question

Я пытаюсь использовать Nokogiri для отображения результатов из URL. (по сути, очистка URL).

У меня есть HTML-код, похожий на:

<p class="mattFacer">Matty</p>
<p class="mattSmith">Matthew</p>
<p class="suzieSmith">Suzie</p>

Итак, мне нужно найти все элементы, которые начинаются со слова «матовый». Что мне нужно сделать, это сохранить значение элемента и имя элемента, чтобы я мог ссылаться на него в следующий раз .. поэтому мне нужно захватить

"Matty" and "<p class='mattFacer'>"
"Matthew" and "<p class='mattSmith'>"

Я не понял, как захватить элемент HTML, но вот что у меня есть для элемента (он не работает!)

doc = Nokogiri::HTML(open(url))
tmp = ""
doc.xpath("[class*=matt").each do |item|
    tmp += item.text
end

@testy2 = tmp

Michael Kohl · Answer 1 · 21 мая 2011

Это должно помочь вам начать:

doc.xpath('//p[starts-with(@class, "matt")]').each do |el|
  p [el.attributes['class'].value, el.children[0].text]
end
["mattFacer", "Matty"]
["mattSmith", "Matthew"]

Dimitre Novatchev · Answer 2 · 22 мая 2011

* +1000 * Используйте

/*/p[starts-with(@class, 'matt')] | /*/p[starts-with(@class, 'matt')]/text()

Это выбирает любые элементы p, которые являются дочерними по отношению к верхнему элементу документа XML, и значение атрибута class которого начинается с "matt", а также любого дочернего элемента текстового узла любого такого элемента p.

При оценке по этому документу XML (ни один не был предоставлен!):

<html>
    <p class="mattFacer">Matty</p>
    <p class="mattSmith">Matthew</p>
    <p class="suzieSmith">Suzie</p>
</html>

следующие узлы выбраны (каждый на отдельной строке) и доступны по позиции:

<p class="mattFacer">Matty</p>
Matty
<p class="mattSmith">Matthew</p>
Matthew

Вот быстрая проверка XSLT :

<xsl:stylesheet version="1.0"
 xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
 <xsl:output omit-xml-declaration="yes" indent="yes"/>

 <xsl:template match="/">
  <xsl:for-each select=
  "/*/p[starts-with(@class, 'matt')]
  |
   /*/p[starts-with(@class, 'matt')]/text()
  ">
  <xsl:copy-of select="."/>
  <xsl:text>&#xA;</xsl:text>
  </xsl:for-each>
 </xsl:template>
</xsl:stylesheet>

Результатом этого преобразования при применении к тому же XML-документу (см. Выше) является ожидаемая правильная последовательность выбранных узлов :

<p class="mattFacer">Matty</p>
Matty
<p class="mattSmith">Matthew</p>
Matthew

Tom · Answer 3 · 02 июня 2013

Принятый ответ отличный, но другой подход заключается в использовании Nikkou , который позволяет сопоставлять с помощью регулярных выражений (без необходимости знакомиться с функциями XPATH):

doc.attr_matches('class', /^matt/).collect do |item|
  [item.attributes['class'].value, item.text]
end

Получить все элементы путем частичного совпадения атрибута класса

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Получить все элементы путем частичного совпадения атрибута класса

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы