Мне нужно прочитать текстовый файл в формате Unicode с кодировкой UTF-8 и записать эти данные в другой текстовый файл. Файл содержит разделенные табуляцией данные в строках.
Мой код для чтения - это код C ++ без поддержки юникода. То, что я делаю, - это чтение файла построчно в string/char*
и помещение этой строки как есть в конечный файл. Я не могу изменить код, поэтому предложения по изменению кода не приветствуются.
Что я хочу знать, так это то, что при чтении построчно я могу встретить завершающий символ NULL ('\ 0') внутри строки, так как это юникод и один символ может занимать несколько байтов.
Я думал, что вполне возможно, что в строке может встретиться завершающий символ NULL. Ваши мысли?