Получение первого символа из глифа - PullRequest
0 голосов
/ 29 июня 2011

Связанные (на самом деле, возможно, дубликат): как извлечь символы из корейской строки в VBA

Связанный вопрос не дает мне удовлетворительных ответов, и это 2 годастарый, поэтому я задаю новый вопрос.

Я хочу найти первый символ в корейском глифе, т.е."한" -> "ㅎ" или "가" -> "ㄱ".Я также хочу распознавать входные данные, которые уже являются единичными символами, такими как «ㄱ».

Я работаю с NSString, который, как мне кажется, использует UTF-8.Нужно ли преобразовывать строку в EUC-KR, затем начинать чтение байтов или как?

1 Ответ

1 голос
/ 27 декабря 2011

Отказ от ответственности, у меня нет опыта работы с iphone или NSString, за исключением того, что я прочитал в документации , чтобы ответить на этот вопрос.Я рассматриваю этот вопрос в основном как проблему Unicode.

Чтобы найти первый символ (jamo) в корейском глифе, вы должны выполнить декомпозицию, как описано в моем ответе на как извлечь символы из корейской строки в VBA (это новый ответ, поэтому вы не увидели его, когда отправили свой вопрос).Чтобы применить мой ответ (который получен непосредственно из стандарта Unicode), вы должны работать с кодовыми точками Unicode (числовые значения) корейских слогов.Похоже, вызов метода dataUsingEncoding с передачей NSUnicodeStringEncoding в качестве параметра должен помочь.

Чтобы идентифицировать отдельные символы, необходимо проверить, является ли кодовая точка Unicode проверяемого символав любом из следующих диапазонов:

Проверьте таблицу кодов Unicode для полной справки.

...