Сопоставление СИЛА и местная языковая связь - PullRequest
10 голосов
/ 18 сентября 2010

Я прочитал следующее из Javadoc Collator.

"Точное назначение сильных сторон языковым особенностям зависит от локали. Например, в чешском языке" e "и" f "считаются основными отличиями, в то время как«e» и «ê» - вторичные различия, «e» и «E» - третичные различия, а «e» и «e» идентичны ».

Означает ли это, что я должен установить СИЛУ на основеязык, который я использую?Если это так, кто-то может предложить значения по умолчанию для локалей: us_en, us_es, ca_fr, spain_spanish, chile_spanish, portuguese

1 Ответ

11 голосов
/ 24 сентября 2010

Это на самом деле зависит от того, что вы пытаетесь сделать.Следующее верно для большинства (всех?) Языков, которые используют латинский алфавит:

  • Основной
    • Разное: a, á, Á, b
    • То же:á, â
    • То же: a, A
  • Secondary
    • Разное: a, á, Á, b
    • Разное:á, â
    • То же: a, A
  • Высшее
    • Разное: a, á, B, b
    • Разное:á, â
    • Разное: a, A
  • Идентичный
    • Также рассмотрите различия, которые вы не видите, например между (accented A) и (A) + (accent)

Между языками будут небольшие различия, но по сути:

  • Если вы хотите сравнение с учетом регистра, используйте третичное.
  • Для сравнения без учета регистра используйте Первичный или Вторичный в зависимости от того, хотите ли вы сгруппировать с â.
  • Некоторые из правил сопоставления довольно странные.А отличается от А даже в Первичном, а А отличается от А даже в Первичном / Вторичном.Я не знаю почему;ошибка, может быть?
  • Кто знает, что происходит на нелатинских языках.
...