Итак, я работаю над проектом на простом C (ANSI 9899: 1999) и пытаюсь понять, с чего начать: Unicode, UTF-8 и весь этот джаз.
В частности, это проект интерпретатора языка, и у меня есть два основных места, где мне нужно будет обрабатывать Unicode: чтение в исходных файлах (язык якобы поддерживает идентификаторы Unicode и т. Д.) И в объектах 'string'.
Я знаком со всеми очевидными основами, касающимися Unicode, UTF-7/8/16/32 и UCS-2/4, и т. Д. И т. Д. Я в основном ищу полезные, специфичные для C (которые пожалуйста, не используйте C ++ или C #, это все, что было задокументировано здесь на SO ранее) ресурсы относительно моих «следующих шагов» для реализации Unicode-дружественных вещей… в C.
Любые ссылки, справочные страницы, статьи в Википедии, примеры кода, приветствуются. Я также постараюсь вести список таких ресурсов здесь, в оригинальном вопросе, для всех, кто сталкивается с этим позже.