У меня есть HTML-документ, сохраненный в моей базе данных следующим образом:
\\u003cp style=\\\"text-align: center; opacity: 1;\\\"\\u003e\\u003cstrong\\u003e\\u003cspan style=\\\"font-size: 18pt;\\\
Я знаю, это уродливо, и я знаю, что это не тот путь, но это устаревшая система.
Моя задача - получить все эти HTML-коды и преобразовать их в документ в Документах Google.На самом деле, Документы Google могут довольно хорошо разобрать HTML в их внутреннем формате, но HTML должен быть действительным HTML, с <p>
вместо \\u003cp
.
Я пытаюсь конвертировать / декодировать / анализировать /Независимо от этой строки в действительный HTML, но пока безуспешно.
Вещи, которые я уже пробовал
htmlentities gem, CGI-декодирование, Nokogiri::HTML.parse
, JSON.parse
и никто из них не сделалработа.
Я тоже пытался string.encode(xxxx)
но тоже без везения.Я действительно надеялся, что метод .encode
сделает это, но я не смог заставить его работать, может быть, я использую неправильную кодировку?(Я пытался использовать все ISO-xxx
кодировки)