Как отделить только часть строкового значения от элемента, используя Nokogiri? РУБИН, Механизировать - PullRequest
0 голосов
/ 23 июня 2011

Как извлечь числа из строки? если xpath равен 'td [5] p / @ title'

HTML:

<td valign="top" align="center">
  <p title="6 en su sucursal" style="margin-top: 0px; margin-bottom:0px; cursor:hand">   
   <b>10</b>
  </p>
</td>

Мне нужно извлечь из атрибута заголовка строковое значение "6 en su sucusal" только число 6

1 Ответ

0 голосов
/ 23 июня 2011

Дайте немного HTML внутри html, вы сделаете что-то вроде этого:

doc     = Nokogiri::HTML(html)
numbers = doc.xpath('//p[@title]').collect { |p| p[:title].gsub(/[^\d]/, '') }

Тогда у вас будут числа в массиве numbers.Вам, конечно, придется настроить XPath и регулярное выражение, чтобы они соответствовали вашим реальным данным, но основной метод должен быть понятен.

Немного времени с документацией и учебными пособиями Nokogiri может бытьплодотворный.

...