Использование gperf на кодированном входе UTF-16? - PullRequest
3 голосов
/ 24 ноября 2010

При перемещении кода, использующего сгенерированную gperf функцию хеширования, для использования UTF-16 для своих строк, как бы вы адаптировали / вызвали функцию хеширования?Я вижу следующие варианты:

  • Конвертировать UTF-16 в UTF-8 для хеширования.
    Это должно работать "из коробки", но включает в себя шаг преобразования, который я надеюсь сделатьбыть в состоянии избежать.
  • Используйте параметр -c, чтобы gperf использовал strncmp и соответствующим образом кодировал входной файл, записав \000h\000e\000l\000l\000o для hello.
    Я на самом деле не проверяли предпочел бы сохранить входной файл читабельным и grep-способным.Но я полагаю, что шаг преобразования можно выполнить с помощью сценария предварительной обработки из исходного файла.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...