Как позволить jtidy не конвертировать китайские иероглифы в HTML-объекты? - PullRequest
1 голос
/ 16 января 2012

У меня есть html для преобразования по jtidy, который содержит несколько китайских символов:

<font>怎么回事</font>

Но результат выглядит так:

<font>&aelig;&#128;&#142;&auml;&sup1;&#136;&aring;&#155;&#158;&auml;&ordm;&#139;</font>

Как настроить jtidy и разрешить ему не преобразовывать китайские символы в html-сущности?

Ответы [ 2 ]

0 голосов
/ 05 декабря 2013
    tidy.setInputEncoding("utf-8");
    tidy.setOutputEncoding("utf-8");

Или какова кодировка вашего ввода и вывода.

0 голосов
/ 13 марта 2012

см.

http://www.pinyin.info/tools/converter/chars2uninumbers.html

это функция для преобразования китайских символов в юникодные числа

function convertToEntities() {
  var tstr = document.form.unicode.value;
  var bstr = '';
  for(i=0; i<tstr.length; i++) {
    if(tstr.charCodeAt(i)>127) {
      bstr += '&#' + tstr.charCodeAt(i) + ';';
    } else {
      bstr += tstr.charAt(i);
    }
  }
  document.form.entity.value = bstr;
}
...