Небольшая библиотека Unicode с открытым исходным кодом для C / C ++ - PullRequest
16 голосов
/ 14 апреля 2009

Кто-нибудь знает великолепную небольшую открытую библиотеку Unicode для C или C ++? Я посмотрел на ICU , но он кажется слишком большим.

Мне нужна библиотека для поддержки:

  • все нормальные кодировки
  • Нормализация
  • поиск типов символов - поиск, разрешен ли символ в идентификаторах и комментариях
  • проверка - признание бессмыслицы

Ответы [ 4 ]

8 голосов
/ 14 апреля 2009

Я посмотрел на UT8-CPP и libiconv, и ни одна из них, казалось, не имела всех необходимых мне функций. Так что, думаю, я просто буду использовать ICU, хотя он действительно большой. Я думаю, что есть несколько способов удалить ненужные функции и данные, поэтому я попробую это. Эта страница (в разделе «Настройка библиотеки данных ICU») описывает, как вырезать некоторые данные.

8 голосов
/ 14 апреля 2009

UTF8-CPP было рекомендовано в принятом ответе на аналогичный вопрос: Переносимая и простая библиотека строк Unicode для C / C ++?

8 голосов
/ 14 апреля 2009

Ну, iconv - хорошая, по крайней мере, отправная точка.

Кроме того, поиск в Google возвращает другой вопрос stackoverflow! Ужас! SO: библиотека Unicode Light C

0 голосов
/ 14 апреля 2009

Сколько функций вам действительно нужно? Во многих случаях я нахожу преобразование внутри одного типа (например, UTF8) и обработку различных кодировок только тогда, когда загрузка или сохранение более чем достаточны. Если вы готовы потратить немного времени и написать класс, чтобы справиться с этим, я уверен, что вы будете использовать его снова и снова.

У меня где-то лежит, но iirc UTF32LE / BE не проверен: http://aaq.cc/d

Если вашему проекту действительно требуется обрабатывать различные кодировки, кроме загрузки / сохранения файлов, тогда вам, вероятно, лучше всего использовать библиотеку ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...