Какую кодировку использует Outlook для текстовых сообщений? - PullRequest
2 голосов
/ 27 января 2011

Мне нужно расшифровать электронные письма, сохраненные из Outlook, только в текстовом режиме.К сожалению, они не соответствуют стандарту ISO-8859-1, так как содержат специальные символы «умной цитаты».Имеет ли кодовая страница, используемая в Outlook, настоящее имя (которое я могу передать unicode.decode () в Python) или это просто произвольная выдуманная ерунда, которую мне придется декодировать вручную?И если да, есть ли у кого-нибудь ссылка на все «специальные» символы, добавленные Microsoft?

Ответы [ 2 ]

2 голосов
/ 27 января 2011

Вполне вероятно, что Outlook сохранит сообщения в вашей текущей локали.Я предполагаю, что это будет Windows-1252.

Nitpick: То, что вы называете «умными цитатами», на самом деле должно выглядеть так, как должны выглядеть цитаты.Цитаты, которые вы использовали в своем посте, известны как «цитаты пишущей машинки»;для механических пишущих машинок количество клавиш было основным фактором стоимости, и кавычки, которые очень похожи друг на друга, и дюймовые символы были объединены в одну клавишу, к черту эстетику.

1 голос
/ 27 января 2011

Существует много (в зависимости от локали) кодовых страниц Windows , поэтому, возможно, в худшем случае это зависит от страны, в которой находится отправитель.

...