Как экспортировать скрубыт экстрактор? - PullRequest
1 голос
/ 29 мая 2010

Я написал экстрактор scrubyt, основанный на методике «обучения» - то есть, указав текущий текст на странице и заставив его самостоятельно обрабатывать выражения XPath. Однако теперь я хочу экспортировать экстрактор, чтобы его можно было использовать даже после изменения страницы.

Документация для scrubyt, кажется, повсюду, но из того, что я могу найти, я смогу поставить строку extractor.export(__FILE__), и она должна работать. Это не - я просто получаю сообщение об ошибке, говорящее о том, что для экспорта задано неверное число аргументов, должно быть 0. Я пробовал это без каких-либо аргументов, и все равно не получается.

Я бы спросил на форуме scrubyt, но похоже, что никто не был там целую вечность!

Есть идеи, что здесь делать?

1 Ответ

1 голос
/ 25 марта 2011

Просто возникла та же проблема и попробовал "ставит google_data.export ()" (пытаясь получить что-то из гугла)

Это дало мне следующее:

=== Дерево экстрактора ===

 export() is not working at the moment, due to the removal or

ParseTree, ruby2ruby и RubyInline. На данный момент, если вы используете примеры, вы можете заменить их вручную на основе вывода ниже. Так что если ваш шаблон в экстракторе обучения выглядит как

 book "Ruby Cookbook" 

 and you see the following below:

 [book] /table[1]/tr/td[2]

 then replace "Ruby Cookbook" with "/table[1]/tr/td[2]" (and all the

другие XPaths) и вы готовы! [ссылка] / body / div / div / div / div / div / ol / li / h3 / a

который дал мне xpath, который я искал

версия scrubyt составляет 0,4.06

...