как utf-8 определяет разные языковые символы - PullRequest
1 голос
/ 28 декабря 2011

Я действительно изумлен, увидев магию utf-8, но не мог понять логику этого.Я просмотрел несколько документов, но все еще смущен, хотя знаю только основную информацию.

, пожалуйста, посмотрите первый пример .конвертирует from language character to utf-8.Есть два текстовых поля, в первом текстовом поле введите символы, нажмите кнопку и получите значения utf-8 во втором текстовом поле как utf-8.

. Пожалуйста, посмотрите на второй пример.Я использовал utf-8 char from the example 1 and put the value in html, и здесь я действительно не понимаю, как это переводится.как я тестировал три языка chinese, Hindi and Russian.

used google translator to translate from english to several language
Hello = 您好(chinese)

Hello = नमस्ते (Hindi)

Hello = привет (Russian) 

как веб-страница идентифицирует языковой символ на основе utf-8?Возможно ли, что другой компьютер будет показывать разные символы?

Ответы [ 2 ]

2 голосов
/ 28 декабря 2011

«Волшебство» за UTF-8 называется Юникод . Это одна из нескольких кодировок стандарта.

Юникод имеет диапазоны символов, которые соответствуют языкам, и многие символы специально связаны с языком.

Я предлагаю прочитать это - Абсолютный минимум, который должен знать каждый разработчик программного обеспечения Абсолютно, положительно должен знать о Юникоде и наборах символов (без оправданий!) .

1 голос
/ 28 декабря 2011

UTF-8 - это байтовая кодировка переменной длины Unicode, система нумерации символов для всех языков.

Интернет-страницы по умолчанию основаны на ISO-8859-1, так называемая Latin-1.Другие наборы символов могут быть установлены с помощью:

  1. Строки заголовка текста, предшествующие пустой строке, а затем текст содержимого HTML.Там есть строка заголовка:

    Content-Type: text/html; charset=UTF-8
    

    Для этого необходим сервер Java EE:

     response.setContentType("text/html; charset=UTF-8");
    
  2. В заголовке HTML метатег

    <html>
      <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
    ...
    
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...