Механизировать получить файл вместо объекта страницы - PullRequest
1 голос
/ 26 сентября 2011

Я пытаюсь перебрать веб-страницу.Я использую Nokogiri / Mechanize.поэтому, если я делаю

page = agent.get(url)
page.class
 => Mechanize::File

, иногда я получаю объект страницы, иногда объект файла.но мне нужно каждый раз, когда объект страницы.Я попытался добавить pluggable_parser для обычного / текстового, но это не работает для меня.

есть у кого-нибудь идея, как я могу это исправить, или как я могу узнать тип содержимого из объекта файла илизнаете, как я могу привести файл к объекту страницы?

Спасибо, Майкл

1 Ответ

0 голосов
/ 24 октября 2011

Скорее всего, запрашиваемая вами страница недоступна, и сервер возвращает страницу с открытым текстом ошибки.

См. Документы по Механизация :: Файл .

Тип содержимого: page.response['content-type'].

Определенно возможно изменить тип содержимого ответа, а затем создать Mechanize :: Page из данных без необходимости их повторной загрузки - но я не думаю, что это даст вам что-нибудь полезное .

Проверьте также код ответа, он находится в page.code.

...