Проблемы с кодировкой vtd- xml - PullRequest
       20

Проблемы с кодировкой vtd- xml

0 голосов
/ 06 февраля 2020

Я сталкиваюсь с проблемами кодирования при использовании библиотеки vtd- xml (версия 2.11).

@Test
    public void test() throws Exception {
        final String originalXML = "<?xml version=\"1.0\"?>\r\n" + "<test>\r\n" + "öäüß\r\n" + "</test>\r\n" + "";
        final VTDGen vg;
        final XMLModifier xm;
        final AutoPilot ap;
        final VTDNav vn;

        vg = new VTDGen();
        // vg.setDoc(originalXML.getBytes()); --> results in
        // com.ximpleware.ParseException: UTF 8 encoding error: should never happen
        vg.setDoc(originalXML.getBytes("UTF-8"));
        vg.parse(false);

        ap = new AutoPilot();
        xm = new XMLModifier();

        vn = vg.getNav();
        ap.bind(vn);
        xm.bind(vn);

        final XMLByteOutputStream xms = new XMLByteOutputStream(xm.getUpdatedDocumentSize());
        xm.output(xms);
        xms.close();
        assertEquals(originalXML, xms.toString());
    }

Этот статут утверждения не выполняется с

java.lang.AssertionError: expected:<<?xml version="1.0"?>

<test>
öäüß
</test>
> but was:<<?xml version="1.0"?>
<test>
ᅢ쌔내태゚
</test>

Есть идеи, как это исправить?

Спасибо, Пол

1 Ответ

2 голосов
/ 06 февраля 2020

Я бы предложил использовать ByteArrayOutputStream вместо XMLByteOutputStream. В этом случае вы можете указать имя набора символов при построении строки из outputtream:

try (ByteArrayOutputStream os = new ByteArrayOutputStream()) {
    xm.output(os);
    assertEquals(originalXML, os.toString("UTF-8"));
}

В этом случае специальные символы должны быть сохранены.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...