Лучший способ найти потенциальных символов UTF-8 из импортированной электронной почты - PullRequest
0 голосов
/ 04 сентября 2018

Поэтому, когда вы просматриваете источник письма, в нем есть несколько символов, которые должны быть преобразованы обратно в UTF-8 почтовым клиентом.

Например, в Outlook исходное письмо может содержать =C2=A9, которое преобразуется в символ авторского права.

В ruby, есть ли способ найти эти типы символов / шаблонов и преобразовать их в HTML, чтобы он отображался в форме HTML? Например, взять что-то вроде =C2=A9 и преобразовать его в связанный с ним формат HTML ©?

1 Ответ

0 голосов
/ 04 сентября 2018

Есть две вещи, которые следует учитывать. Во-первых, оригинальный формат строки, использующий =, называется «цитируемым-печатным». Принудительное кодирование UTF-8. Затем используйте htmlentities для преобразования в HTML-объекты. Вот пример:

require 'htmlentities'
coder = HTMLEntities.new
string = '=C2=A9'.unpack("M").first.force_encoding('UTF-8')

coder.encode(string) # => "©"
coder.encode(string, :named) # => "©"

Надеюсь, вы найдете это полезным.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...