Вы можете кодировать эти символы в UTF-8.
Ключ заключается в том, чтобы обеспечить постоянство пролога (<?xml version="1.0" encoding="utf-8" ?>
) и фактической кодировки файлов.
Весь смысл UTF-8 в том, чтобы иметь возможность кодировать все символы Юникода в меньшем размере. Согласно источнику всей мудрости, wikipedia , utf-8 кодирует каждую символьную точку от 1 до 4 байтов и обратно совместим с ASCII