Какой тип кодирования используется? - PullRequest
1 голос
/ 22 июня 2010

В настоящее время я создаю программу, в которой одной из ее функций является извлечение HTML-части составного электронного письма.

Я выполнил эту задачу отлично, однако для некоторых символов существует кодировкачто я не могу понять, например,

',' into '=2C'
';' into '=3B'
'=' into '=3D'

, и это также помещает случайное '=' повсюду.

Кто-нибудь знает, есть ли для этого декодер (илидаже как его зовут)?Я заменил несколько вещей на код, но, возможно, есть еще много, чего мне не хватает, потому что я с ними еще не сталкивался.Таким образом, я хотел бы либо выяснить тип кодировки, чтобы я мог заменить все, либо найти библиотеку, которая уже сделала это.

Ps Я отправляю электронное письмо из учетной записи hotmail, если это возможнопричина.

Ответы [ 2 ]

2 голосов
/ 22 июня 2010

Это называется кодировка для печати в кавычках.

К сожалению, существующий QuotedPrintableStream от Microsoft является внутренним, поэтому его нельзя использовать. Однако вы можете взять один из проекта Mono или любой библиотеки, связанной с обработкой MIME.

1 голос
/ 22 июня 2010

Кодировка для печати в кавычках, поясняется в этом RFC . Позвольте мне предупредить вас, прежде чем тратить слишком много времени на свою задачу. Парсинг писем может превратиться в настоящую головную боль, поэтому не стоит делать это самостоятельно. попробуйте эту бесплатную библиотеку, это лучшая, которую я когда-либо видел (и я видел много) http://www.lumisoft.ee/lswww/download/downloads/Net/

...