Являются ли символы латинского кода безопасными для URL? - PullRequest
0 голосов
/ 10 июня 2011

Являются ли символы латинского кода безопасными для URL?

Прочитав этот пост , я знаю, что в этом документе выделены безопасные веб-символы. Однако в спецификациях не ясно, являются ли символы в латинском коде частью незарезервированного списка. Например: ç и õ.

Я не понимаю, почему эти символы не будут включены в незарезервированный список. Но, тем не менее, мне еще предстоит увидеть какие-либо URL, содержащие такие символы.

Соответствующий вопрос : Предполагается, что я могу использовать такие символы в своем URL, не так ли?

Мои URL будут создаваться при вводе пользователем. Должен ли я оставить заголовки с такими символами или заменить их? Например, ç to становится c и т. Д.

Родной язык моего читателя - португальский, но я не уверен, что они будут заботиться об этих символах в дружественном URL-адресе страницы.

1 Ответ

1 голос
/ 11 июня 2011

В RFC, который вы упомянули, в частности, упоминается ASCII как набор символов для URI:

Нотация ABNF определяет свои терминальные значения как неотрицательные целые числа (кодовые точки) на основе кода США-ASCIIнабор символов [ASCII].

Это сделало бы символы вне ASCII небезопасными с точки зрения RFC.

Конечно, это все до IDN существовал.Существует RFC , который определяет, как должны происходить преобразования между ASCII и Unicode в URL.

...