Снимок экрана, который следует перенаправляет и кодирует в UTF-8 - PullRequest
1 голос
/ 09 апреля 2011

Я ищу драгоценный камень (или комбинацию драгоценных камней), который может, учитывая URL, возвращать содержимое страницы в формате UTF-8. Следует также следовать перенаправлениям, если URL-адрес изменен.

Кто-нибудь знает такое?

Спасибо!

1 Ответ

1 голос
/ 10 апреля 2011

Вы смотрели на Нокогири ? Это похоже на то, что вы ищете с точки зрения кодировки:

КОДИРОВАНИЕ:

Строки всегда хранятся как UTF-8 внутренне. Методы, которые возвращают текст значения всегда будут возвращать UTF-8 закодированные строки. Методы, которые возвращают XML (например, to_xml, to_html и inner_html) вернет строку закодирован как исходный документ.

Вы также можете автоматизировать некоторые операции очистки экрана с помощью Механизировать (щелкать ссылки, отправлять формы и т. Д.). Механизация основана на Nokogiri, так что это хорошее дополнение к ней.

Некоторые веб-трансляции, которые вы можете посмотреть:

...