У меня есть текст:
"
Csuklási roham gyötörheti a svédeket, annyit emlegetik mostanság is me sdé modellt Magyarországon. "
В этом оригинальном тексте вообще нет разрывов строк.
Когда я отправляю этот текст по электронной почте (с помощью gmail), я получаю его в следующем формате:
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
Csukl=E1si roham gy=F6t=F6rheti a sv=E9deket, annyit emlegetik mostans=E1g =
ism=E9t a
sv=E9d modellt Magyarorsz=E1gon.
В HTML:
Content-Type: text/html; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
<span class=3D"Apple-style-span" style=3D"font-family: Helvetica, Verdana, = sans-serif; font-size: 15px; ">Csukl=E1si roham gy=F6t=F6rheti a sv=E9deket= , annyit emlegetik mostans=E1g ism=E9t a sv=E9d modellt Magyarorsz=E1gon.
....
Когда я пытаюсь разобрать тело письма как текстовое / обычное, я не могу избавиться от знака = в "Mostans = E1g ="
ism = E9t "между двумя словами. Обратите внимание, что в сообщении в кодировке HTML отсутствует один и тот же символ. Я понятия не имею, каким может быть этот специальный символ, но мне нужно исключить его, чтобы вернуть исходный текст.
Я пытался заменить '\ n', но это не так, если я нажму 'Enter' в тексте, я могу правильно заменить его на любой символ, который мне нужен. Я также пробовал '\ r' и '\ t'.
Итак, вопрос в том, чего мне не хватает? Откуда этот особенный персонаж? Это из-за кодировщика и / или кодировки передачи? Если так, что мне нужно сделать, чтобы решить проблему и вернуть исходный текст.
Любая помощь будет приветствоваться.
Cheers,
Балаж