Я работаю с дампом Wikipedia XML, который закодирован в UTF-8. Прямо сейчас я читаю все как std :: string, поэтому, когда я вывожу на экран std :: cout, посторонние символы отображаются как бред
Фактический процесс синтаксического анализа ищет только символы ASCII, но когда я записываю проанализированный файл на диск, я хочу сохранить посторонние символы. Другими словами, я хочу, чтобы выходные данные имели ту же кодировку, что и входные.
Можно ли использовать std :: string или мне придется использовать что-то вроде ICU? Библиотеки, на которые я смотрел, кажутся слишком сложными. Есть ли что-нибудь быстрое, что я могу использовать для этого?