Согласно статье Википедии о GB18030 , «GB18030 можно рассматривать как формат преобразования Unicode (т.е. кодирование всех кодовых точек Unicode), который поддерживает совместимость с устаревшим набором символов». Таким образом, все символы Unicode могут быть закодированы в GB18030, но они будут закодированы с помощью последовательностей байтов, отличных от того, что будет сгенерировано с помощью UTF-8 или UTF-16. Обработка кодировки GB18030 не требует более специальных методов, чем для любой другой кодировки, отличной от Unicode.
Проект ICU - это библиотека с открытым исходным кодом (для C или Java), которая имеет полную поддержку многих различных кодировок, включая GB18030. Информацию о преобразовании между различными кодировками с ICU можно найти здесь .