Это верно для UCS2, но, скорее всего, это не то, что у вас есть. В настоящее время вы чаще сталкиваетесь с UTF-16. В отличие от UCS-2, UTF-16 кодирует символы Unicode как одну или две 16-битные единицы. Это необходимо, поскольку в текущей версии Unicode содержится более 65536 символов.
Более сложные преобразования обычно могут выполняться вашей ОС, и есть несколько (нестандартных) библиотек, которые предлагают одинаковую функциональность, например, ICU.