Question

Кроме преобразования в байты UTF-8 или написания функции сравнения, которая выполняет итерацию и сравнение, есть ли какой-то метод, который мне не хватает в JDK 1.6, который сравнивает две строки в полном порядке кодовой точки Unicode вместо кодовой точки UCS-2 заказ?

Я ценю, что это не сложная вещь для кодирования. Однако я был озадачен тем, что в 1.6 есть различные API-интерфейсы «codepoint» в java.lang.String, а также система Collation, но, очевидно, нечем просто сравнить две строки, не посмеиваясь над суррогатами.

Для удобства комментатора я должен передать некоторые данные инструменту, который хочет строки в этом порядке.

jarnbjo · Answer 1 · 23 января 2010

AFAIk, API не имеет такого метода, но это должно быть тривиально реализовать его самостоятельно. Просто из любопытства: зачем тебе что-то подобное?

Rolch2015 · Answer 2 · 03 июня 2018

Ради полноты ее моего решения проблемы. Может быть, есть лучшее решение:

   String sortedText = text
      .codePoints()
      .sorted()
      .mapToObj(i -> String.valueOf(Character.toChars(i)))
      .collect(Collectors.joining(""));

Строки сортировки Java в порядке кода (UTF-32)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Строки сортировки Java в порядке кода (UTF-32)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов