Хммм
Вы можете найти много случайных данных, используя поиск в Google (и посмотрите правильный столбец для вопросов, подобных этим на SO ...)
Однако, я рекомендую вам в значительной степени собратьваши тестовые строки в виде байтового массива.Дело не в том, «какие данные», просто в том, что юникод обрабатывается правильно.
Например, вам нужно убедиться, что идентичные строки в разных нормализованных формах (т.е. даже если не в канонической форме) все равно сравниваются.
Вы захотите убедиться, что определение длины строки является надежным (и распознает одиночные, двойные, тройные и четырехкратные байтовые символы).Вы захотите проверить, что обход строки от начала до конца учитывает ту же логику.Более целенаправленные тесты для произвольного доступа к символам Юникода.
Это все, что вы знали, я уверен.Я просто излагаю их, чтобы напомнить вам, что вам нужны тестовые данные, ориентированные именно на крайние случаи, логические свойства, присущие Unicode.
Только тогда у вас будут правильные тестовые данные.
За пределами этой области (технически правильная обработка Unicode) находится фактическая локализация (сопоставление, преобразование кодировки и т. Д.).Я имею в виду тест Турции
Вот полезные ссылки: