хранение тамилов в базе данных - PullRequest
0 голосов
/ 05 июня 2010

Я сохранил тамильский контент как & agrave ..........

Но для некоторого контента он хранится как # 2220 .......

Таким образом, при поиске возникает проблема с ним, когда я пытаюсь декодировать его как оригинальный тамильский контент.

Как преобразовать значения из # 2220 ........ в & grave .......

1 Ответ

1 голос
/ 05 июня 2010

В XML & # xxxx; является шестнадцатеричным символьным объектом. Это относится к символу Unicode U + xxxx.

В HTML есть набор именованных символьных сущностей, таких как & agrave ;. Вы можете использовать их в XML, если ваше DTD включает их определения.

В любом случае любой соответствующий синтаксический анализатор XML преобразует любой из них в соответствующий символ Unicode. Когда вы поместите свой текст в базу данных, & grave; был преобразован в один символ Unicode. Когда вы вытащили его, механизм, который вы использовали для его извлечения, не решил представлять его с символическим именем, а использовал общую шестнадцатеричную форму.

Если вам нужны символические имена, есть вероятность, что вам потребуется постобработка, чтобы получить их.

...