Справочная информация: Я создаю много электронных рассылок на своей работе, и содержимое этих писем обычно отправляется мне в виде документа Word.Я вручную кодирую свои электронные письма с помощью XHTML 1.0 Transitional doctype и набора символов UTF-8.
Мой вопрос: Какой самый быстрый способ преобразования текста, скопированного из MS Word, в UTF-8 чтобы я мог вставить его в свои файлы XHTML?
Пока ... Я создал свой собственный конвертер кодировки символов в Coldfusion, но он очень прост и обрабатывает «проблемные символы» только в том случае, еслиЯ указываю их и только по одному за раз.Пример:
function HTMLEncode(string) {
string = Replace(string, '&', '&', 'ALL');
string = Replace(string, '©', '©', 'ALL');
string = Replace(string, '—', '-', 'ALL');
...
Должен быть лучший / более простой / быстрый способ.Есть предложения?