как читать документацию nokogiri.org? (Рубин + механизировать + nokogiri) - PullRequest
0 голосов
/ 24 января 2010

На прошлой неделе я начал писать скрипт на ruby. Мне нужно было почистить некоторые данные из Интернета, поэтому мне порекомендовали использовать механизацию, а затем nokogiri .

Документация по механизации гласит: Механизация использует nokogiri для анализа html. Что это значит для тебя? Вы можете рассматривать страницу механизации как объект nokogiri. После того, как вы использовали Mechanize, чтобы перейти к странице, которую нужно очистить, затем очистите ее, используя методы nokogiri.

Я знаю, что могу использовать .xpath .at_xpath, потому что он был частью одного ответа на мой вопрос , но я не знаю точного синтаксиса этих методов, различий и т. Д. Я пытался найти nokogiri web .

В этом ответе мне сказали *1018*, что Я часто использую выражение text (). Это не требуется с помощью Nokogiri. Вы можете извлечь узел, а затем вызвать текстовый метод на узле. Это намного дешевле. Я пытался искать nokogiri web , но ничего не нашел по этому поводу.

есть кто-то, кто может помочь мне, как читать документацию по nokogiri ?

скажем, я хочу знать, как использовать текстовый метод вместо text ().

Ответы [ 2 ]

2 голосов
/ 06 февраля 2010

Я не совсем уверен, в чем проблема при чтении документации Nokogiri. Быстрый поиск "nokogiri" в Google возвращает "nokogiri.org" в качестве первого попадания. Это страница документации.

В Ruby .text() совпадает с .text, если вы не передаете параметры. .text() - это псевдоним для .inner_text(), который будет «Получать внутренний текст всех содержащихся объектов Node». Поиск "text" на nokogiri.org поможет вам начать работу.

1 голос
/ 25 июня 2010

Я думаю, что одна из вещей, которые имеет в виду автор, заключается в том, что документация на сайте не соответствует стандартному формату / отображению , как и другие сайты, которые используют rdoc и различные методы для отображения информации. НАПРИМЕР. трудно читать .

Чтобы ответить или попытаться - мне повезло, я искал в github проекты, которые используют nokogiri, и пошел оттуда, читая источник.

...