Будет ли приемлемым ответ преобразование из UTF-16 (форма Visual C ++ wchar_t
) в UTF-8, затем, возможно, из UTF-8 в UCS-4 (форма GCC wchar_t
)?
Если это так, то в Windows вы можете использовать функцию WideCharToMultiByte
(с CP_UTF8
для параметра CodePage
) для первой части преобразования. Затем вы можете либо вставить полученные строки UTF-8 непосредственно в вашу программу, либо преобразовать их дальше. Здесь - это сообщение, показывающее, как это сделал один человек; Вы также можете написать свой собственный код или сделать это вручную (официальная спецификация с разделом о том, как именно конвертировать UTF-8 в UCS-4, может быть найдена здесь ). Возможно, есть более простой способ, я еще не слишком знаком с вещами преобразования в Linux.