Документ DOM4J: прочитайте ISO-8859-1 xml - PullRequest
1 голос
/ 08 декабря 2011

Мне нужно прочитать XML-файл, закодированный в ISO-8859-1.

Я использую:

Document document = reader.read(new File(sourceFile));
document.setXMLEncoding("ISO-8859-1");

Я получаю "cannot find symbol" ошибку для setXMLEncoding. Кажется, это должно быть просто, но я не могу понять, что я делаю неправильно.

1 Ответ

2 голосов
/ 11 декабря 2011

setXMLEncoding доступно с dom4j 1.6. Я полагаю, вы используете более старую версию.

Во всяком случае, как говорит Javadoc:

Устанавливает кодировку этого документа, как он будет отображаться в XML декларационная часть документа.

вам следует использовать этот метод, если вы пишете xml. Я предполагаю, что вы читаете существующий файл, поэтому, если он ISO-8859-1 закодирован и его пролог содержит ту же декларацию кодировки, у вас не должно возникнуть никаких проблем, dom4j должен сделать все для вас.

<?xml version="1.0" encoding="ISO-8859-1"?>
...