Я пытался создать регулярное выражение, соответствующее кодировке mime-сообщений, состоящих из нескольких частей, чтобы правильно их декодировать. Однако я обнаружил, что есть некоторые различия в формате, для которых я не могу разработать Regex, так как я не эксперт.
в настоящее время я использую (?<=charset=).*(?=;)
, однако примеры, которые я нашел, отправляя электронные письма от разных клиентов:
Тип содержимого: текст / обычный текст; кодировка = ISO-8859-1; Формат = потекла
кодировки = US-ASCII;
Тип содержимого: текст / обычный текст; кодировка = изо-8859-1
Так что мой Regex работает с первыми двумя, но не с последними, однако, если я удаляю (?=;)
, тогда я также сопоставлю часть format=flowed
, которую я не хочу.