Использование предпочтительного значения в записях языковых тегов типа «Вариант» (RFC 5646) - PullRequest
0 голосов
/ 13 мая 2018

В RFC 5646, Теги для идентификации языков, § 3.1.2 Определения записей и полей , приведено следующее объяснение семантики поля Preferred-Value при появлении в записи, тип которой "Вариант ":

  • Для полей типа« скрипт »,« регион »или« вариант »« Preferred-Value »содержит подтэг того же типа, который предпочтителен для формированияязыковой тег.

Моя первоначальная интерпретация этого состояла в том, что если тип записи - вариант, , то значение предпочтительного значения также равно вариант - «подтег одного типа».Другими словами, я читаю «того же типа», что и «того же типа, что и сама запись».

Однако в текущей версии реестра языковых тегов имеются записи(2018-04-23 в то время, когда я пишу это - не похоже, что есть версионные ссылки), которые не соответствуют этой интерпретации.Например:

Type: variant
Subtag: arevela
Description: Eastern Armenian
Added: 2006-09-18
Deprecated: 2018-03-24
Preferred-Value: hy
Prefix: hy

Предпочтительное значение здесь не является вариантом - вариант должен состоять из 5-8 буквенно-цифровых символов ASCII или 1 цифры плюс три буквенно-цифровых символа.В частности, в данном случае ясно, что это относится к армянскому языку (первый сегмент языкового тега), а не к варианту.

Однако при просмотре других записей большинство значений Preferred-Valueсоответствовать моей первоначальной интерпретации.Например:

Type: region
Subtag: YD
Description: Democratic Yemen
Added: 2005-10-16
Deprecated: 1990-08-14
Preferred-Value: YE

Здесь Preferred-Value действительно является другим кодом региона.Правила для типов сценария / региона / варианта даны вместе - Preferred-Value является «одним и тем же типом» для всех этих.Если для записи региона «Preferred-Value» того же типа означает «также регион», то как для варианта записи Preferred-Value может указывать на другой тип?Что еще более важно, если это возможно, является ли единственный способ определить тип поля Preferred-Value для проверки его грамматики?

...