Юникод Порядок следования байтов Кодовое значение - U + FEFF. Эта команда конкатенации удалит все символы спецификации при объединении двух файлов:
<concat encoding="UTF-8" outputencoding="UTF-8" destfile="nobom-concat.txt">
<filelist dir="." files="bom1.txt,bom2.txt" />
<filterchain>
<deletecharacters chars="" />
</filterchain>
</concat>
Эта форма команды concat
говорит задаче декодировать файлы как символьные данные UTF-8. Я предполагаю UTF-8, поскольку именно здесь обычно возникают проблемы с Java / BOM.
В UTF-8 спецификация кодируется как байты EF BB BF
. Если вам нужно, чтобы он отображался в начале результирующего файла, вы можете использовать последующую конкатенацию, чтобы снова поставить префикс выходного файла с спецификацией.
Кодированные значения для U + FEFF в других кодировках UTF перечислены здесь .