Как получить весь текст внутри тегов 'td' из тега 'table' на html-странице с помощью Mechanize gem? - PullRequest
0 голосов
/ 24 ноября 2010

Я пытаюсь разобрать таблицу, используя Mechanize gem, но я не знаю, как перебрать таблицу.

1 Ответ

2 голосов
/ 24 ноября 2010

Механизм использует nokogiri для анализа HTML, поэтому вам следует поискать там документацию.А именно, взгляните на метод xpath.

Вот пример анализа текущей страницы:

require 'open-uri'
require 'nokogiri'
doc = Nokogiri::HTML(open('/3474497/kak-poluchit-ves-tekst-vnutri-tegov-td-iz-tega-table-na-html-stranitse-s-pomoschy-mechanize-gem'))
table = doc.xpath('//table').first # getting the first table on the page
table.xpath('tr/td').count # getting all the td nodes right below table/tr and counting them
#=> 4
...