Я ищу драгоценный камень (или комбинацию драгоценных камней), который может, учитывая URL, возвращать содержимое страницы в формате UTF-8. Следует также следовать перенаправлениям, если URL-адрес изменен.
Кто-нибудь знает такое?
Спасибо!
Вы смотрели на Нокогири ? Это похоже на то, что вы ищете с точки зрения кодировки:
КОДИРОВАНИЕ: Строки всегда хранятся как UTF-8 внутренне. Методы, которые возвращают текст значения всегда будут возвращать UTF-8 закодированные строки. Методы, которые возвращают XML (например, to_xml, to_html и inner_html) вернет строку закодирован как исходный документ.
КОДИРОВАНИЕ:
Строки всегда хранятся как UTF-8 внутренне. Методы, которые возвращают текст значения всегда будут возвращать UTF-8 закодированные строки. Методы, которые возвращают XML (например, to_xml, to_html и inner_html) вернет строку закодирован как исходный документ.
Вы также можете автоматизировать некоторые операции очистки экрана с помощью Механизировать (щелкать ссылки, отправлять формы и т. Д.). Механизация основана на Nokogiri, так что это хорошее дополнение к ней.
Некоторые веб-трансляции, которые вы можете посмотреть: