скопировать текст (индийский язык - гуджарати) из текстового документа в текстовую область веб-страницы - PullRequest
2 голосов
/ 18 июня 2010

Я разрабатываю один сайт на индийском языке (гуджарати).

Моя проблема заключается в следующем:

Мой клиент хочет, чтобы он мог скопировать гуджаратский текст из текстового документа и вставить вТекстовая область.

Но когда я копирую текст из word doc и вставляю его в текстовую область, он преобразуется в английские буквы.

http://www.chanakyanipothi.com/gujchanakya/Gopika.ttf

Над ссылкойиз шрифтов, которые я использую.

Я могу предоставить вам демонстрационный код, чтобы вы могли поработать над ним.

Ответы [ 2 ]

4 голосов
/ 18 июня 2010

Вы должны установить шрифт TextArea на Gopika.

<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Gopika Test</title>
<style>
textarea {
    font-family:"Gopika";
}
</style>
</head>
<body>
<form><textarea>asdasdioasd</textarea></form>
</body>
</html>
2 голосов
/ 18 июня 2010

Невозможно воспроизвести, я могу вставить индийский ગુજરાતી на текстовые без каких-либо явных проблем. Проблема может заключаться в том, что вы на самом деле используете не индийские символы, а английские символы, или, скорее всего, это слово каким-то образом вас раздражает.

Я предлагаю вам вставить здесь код текстовой области и, возможно, загрузить файл слов или пример аналогичного файла (не то, что я собираюсь его понять), чтобы мы могли попытаться повторить проблемы.

Обновление:

Первый тестовый сценарий , я вставил некоторый текст из Википедии, который включал индийский, текст правильно отображался как на текстовой области, так и после публикации. Я предполагаю, что вы проводите некоторое тестирование на предмет того, что я вижу на картинке: альтернативный текст http://img8.imageshack.us/img8/5140/gujaratitest12768464518.png

Второй тестовый сценарий , я скопировал текст из файла docx и, когда он был вставлен в текстовую область, он выглядел как английские буквы. Зачем? Поскольку это не индийские символы, это английские символы, которые выглядят как индийские символы.

То есть, несмотря на то, что они выглядят как индейцы, они по-прежнему остаются теми же кодами ASCII, что и при переводе для текстовой области, они теряют свой «внешний вид». Вы должны попробовать с настоящим индийским текстом.

Например, в зависимости от шрифта, который вы используете, буква «а» будет выглядеть по-разному и на самом деле может быть птицей, деревом индийского персонажа или мотоциклом, что нам все равно, но если их скопировать и вставить куда-нибудь это позволяет просто текст, а не текст шрифта, мы все равно увидим букву «а», так как это всегда символ ASCII 97. Чтобы проверить это самостоятельно, перейдите к текстовому документу и нажмите клавишу ALT + 97 ( затем отпустите ALT) вы фактически введете букву «а», независимо от того, выглядит она или нет.

Надеюсь, вы поняли. Настоящий индийский, китайский или любой другой будет работать правильно, шрифты, которые выглядят так, не будут, если вы не установите шрифт textarea для этого конкретного шрифта -.-

Если это не убедит вас, если вы используете шрифт Cujarati для всех символов, которые не были на английском, допустим, что комментарий, который фактически цитировал английский, все равно будет отображаться шрифтом Cujarati и, следовательно, будет абсолютно не смысл вообще.

И последнее, но не менее важное: откройте карту персонажей, посмотрите карту Куджарати, а затем карту любого другого шрифта. Тогда вы можете увидеть, что символы на самом деле одинаковы. Но я отказываюсь от попытки убедить тех, кто не хочет видеть.

...