Я получаю HTML-документ, который анализируется с помощью Nokogiri.HTML использует кодировку ISO-8859-1.Проблема в том, что в документе есть некоторые символы Unicode, которые конвертируются в кодовые точки Unicode вместо их соответствующих символов.
Например, это некоторый текст в HTML в том виде, в котором он был получен (в ISO-8859-1):
\x95\x95 JOHNNY VENETTI \x95\x95
И при попытке работать с этим текстом он преобразуется в следующее:
\u0095\u0095 JOHNNY VENETTI \u0095\u0095
Итак, мой вопрос, как я могу гарантировать, что эти символы представлены как соответствующиесимвол вместо кодовой точки?Я попытался сделать gsub для текста, но это кажется неправильным для этого.Кроме того, я не могу контролировать кодировку HTML-документа.