Question

Последние 48 часов я бьюсь головой об этой абсолютно бешеной клопе, поэтому решил, что наконец-то добавлю полотенце и попробую спросить здесь, прежде чем выбросить свой ноутбук в окно.

Я пытаюсь проанализировать XML-ответ от вызова, который я сделал в AWS SimpleDB. Ответ возвращается по проводам просто отлично; например, это может выглядеть так:

<?xml version="1.0" encoding="utf-8"?> 
<ListDomainsResponse xmlns="http://sdb.amazonaws.com/doc/2009-04-15/">
    <ListDomainsResult>
        <DomainName>Audio</DomainName>
        <DomainName>Course</DomainName>
        <DomainName>DocumentContents</DomainName>
        <DomainName>LectureSet</DomainName>
        <DomainName>MetaData</DomainName>
        <DomainName>Professors</DomainName>
        <DomainName>Tag</DomainName>
    </ListDomainsResult>
    <ResponseMetadata>
        <RequestId>42330b4a-e134-6aec-e62a-5869ac2b4575</RequestId>
        <BoxUsage>0.0000071759</BoxUsage>
    </ResponseMetadata>
</ListDomainsResponse>

Я передаю этот XML парсеру с

XMLEventReader eventReader = xmlInputFactory.createXMLEventReader(response.getContent());

и звоните eventReader.nextEvent(); несколько раз, чтобы получить нужные мне данные.

Вот странная часть - она прекрасно работает на локальном сервере. Ответ приходит, я его разбираю, все довольны. Проблема заключается в том, что при развертывании кода в Google App Engine исходящий запрос все еще работает, и XML-ответ мне кажется на 100% идентичным и правильным, но ответ не удается проанализировать со следующим исключением:

com.amazonaws.http.HttpClient handleResponse: Unable to unmarshall response (ParseError at [row,col]:[1,1]
Message: Content is not allowed in prolog.): <?xml version="1.0" encoding="utf-8"?> 
<ListDomainsResponse xmlns="http://sdb.amazonaws.com/doc/2009-04-15/"><ListDomainsResult><DomainName>Audio</DomainName><DomainName>Course</DomainName><DomainName>DocumentContents</DomainName><DomainName>LectureSet</DomainName><DomainName>MetaData</DomainName><DomainName>Professors</DomainName><DomainName>Tag</DomainName></ListDomainsResult><ResponseMetadata><RequestId>42330b4a-e134-6aec-e62a-5869ac2b4575</RequestId><BoxUsage>0.0000071759</BoxUsage></ResponseMetadata></ListDomainsResponse>
javax.xml.stream.XMLStreamException: ParseError at [row,col]:[1,1]
Message: Content is not allowed in prolog.
    at com.sun.org.apache.xerces.internal.impl.XMLStreamReaderImpl.next(Unknown Source)
    at com.sun.xml.internal.stream.XMLEventReaderImpl.nextEvent(Unknown Source)
    at com.amazonaws.transform.StaxUnmarshallerContext.nextEvent(StaxUnmarshallerContext.java:153)
    ... (rest of lines omitted)

Я дважды, трижды, вчетвером проверил этот XML на наличие «невидимых символов» или символов, не кодированных в UTF8, и т. Д. Я просматривал его побайтно в массиве для меток порядка следования байтов или чего-то подобного , Ничего такого; он проходит каждый проверочный тест, который я мог бы выполнить. Даже странно, что это происходит, если я использую синтаксический анализатор на основе Saxon, но ТОЛЬКО в GAE он всегда работает нормально в моей локальной среде.

Очень сложно отследить код на наличие проблем, когда я могу запускать отладчик только в среде, которая отлично работает (я не нашел хорошего способа удаленной отладки в GAE). Тем не менее, используя примитивные средства, которые у меня есть, я попробовал миллион подходов, в том числе:

XML с прологом и без него
С символами перевода строки и без них
С и без атрибута "encoding =" в прологе
Оба стиля новой строки
С и без информации о фрагментации, присутствующей в потоке HTTP

И я попробовал большинство из них в нескольких комбинациях, где имело смысл, что они будут взаимодействовать - ничего! Я в конце своего остроумия. Кто-нибудь видел проблему, подобную этой, до этого, мы надеемся, пролить свет на это?

Спасибо!

Romain Hippeau · Answer 1 · 13 июня 2010

Кодировка в XML и XSD (или DTD) различна.
Заголовок файла XML: <?xml version='1.0' encoding='utf-8'?>
Заголовок файла XSD: <?xml version='1.0' encoding='utf-16'?>

Другой возможный сценарий, который вызывает это,когда что-либо предшествует объявлению типа документа XML.т.е. в буфере может быть что-то вроде этого:

helloworld<?xml version="1.0" encoding="utf-8"?>

или даже пробел или специальный символ.

В буфере могут быть некоторые специальные символы, называемые маркерами порядка байтов.Перед передачей буфера в Parser сделайте это ...

String xml = "<?xml ...";
xml = xml.trim().replaceFirst("^([\\W]+)<","<");

Sunmit Girme · Answer 2 · 07 мая 2013

Это сообщение об ошибке всегда вызывается недопустимым содержимым XML в начальном элементе.Например, дополнительная маленькая точка «.» В начале элемента XML.

Любые символы перед «<?xml….» будут вызывать значение выше « org.xml.sax.SAXParseException: содержимое недопустимов прологе »сообщение об ошибке.

Маленькая точка« . »перед “<?xml….

Чтобы исправить это, просто удалите все эти странные символы перед“<?xml“.

Ссылка: http://www.mkyong.com/java/sax-error-content-is-not-allowed-in-prolog/

Saturn CAU · Answer 3 · 23 мая 2014

Я столкнулся с той же проблемой.В моем случае XML-файлы были сгенерированы из программы на c # и переданы в AS400 для дальнейшей обработки.После некоторого анализа выяснилось, что я использовал кодировку UTF8 при создании файлов XML, тогда как javac (в AS400) использует «UTF8 без спецификации».Итак, пришлось написать дополнительный код, подобный указанному ниже:

//create encoding with no BOM
Encoding outputEnc = new UTF8Encoding(false); 
//open file with encoding
TextWriter file = new StreamWriter(filePath, false, outputEnc);           

file.Write(doc.InnerXml);
file.Flush();
file.Close(); // save and close it

F.O.O · Answer 4 · 18 июля 2018

Удаление объявления xml решило ее

<?xml version='1.0' encoding='utf-8'?>

techloris_109 · Answer 5 · 27 июля 2018

У меня была проблема при проверке xml-файла в notepad ++ и сохранении файла, хотя у меня был верхний xml-тег utf-8 как <?xml version="1.0" encoding="utf-8"?>

Исправлено сохранением файла в notpad ++ с помощью Encoding (Tab)> Encode in UTF-8: выбрано (было Encode в UTF-8-BOM)

dfritch · Answer 6 · 09 февраля 2015

В моем xml-файле заголовок выглядел так:

<?xml version="1.0" encoding="utf-16"? />

В тестовом файле я читал байты файла и декодировал данные как UTF-8 (не понимая, что заголовок в этом файле был utf-16) для создания строки.

byte[] data = Files.readAllBytes(Paths.get(path));
String dataString = new String(data, "UTF-8");

Когда я попытался десериализовать эту строку в объект, я увидел ту же ошибку:

javax.xml.stream.XMLStreamException: ParseError at [row,col]:[1,1]
Message: Content is not allowed in prolog.

Когда я обновил вторую строку до

String dataString = new String(data, "UTF-16");

Я смог отлично десериализовать объект. Итак, как заметил Ромен выше, кодировки должны совпадать.

Ravi Kiran · Answer 7 · 23 января 2015

Я столкнулся с той же проблемой, которая называется "Содержимое запрещено в прологе" в моем XML-файле.

Решение

Первоначально моей корневой папкой было '# Имя файла '.

Когда я удалил первый символ '#', ошибка была устранена.

Нет необходимости удалять #filename ... Попробуй вот так ..

Вместо передачи объекта File или URL-адресу методу unmarshaller, используйте FileInputStream.

File myFile = new File("........");
Object obj = unmarshaller.unmarshal(new FileInputStream(myFile));

miroxlav · Answer 8 · 19 февраля 2019

Неожиданная причина: `#` символ в пути к файлу

Из-за некоторой внутренней ошибки ошибка Содержимое недопустимо в прологе также появляется, если файлсамо содержимое на 100% правильно, но вы указываете имя файла, например C:\Data\#22\file.xml.

Это может также относиться и к другим специальным символам.

Как проверить: Если вы переместите свой файл в путь без специальных символов и ошибка исчезнет, то это была проблема.

Tamias · Answer 9 · 13 июня 2018

В духе «просто удалите все эти странные символы перед <? Xml», вот мой Java-код, который хорошо работает с вводом через BufferedReader: </p>

    BufferedReader test = new BufferedReader(new InputStreamReader(fisTest));
    test.mark(4);
    while (true) {
        int earlyChar = test.read();
        System.out.println(earlyChar);
        if (earlyChar == 60) {
            test.reset();
            break;
        } else {
            test.mark(4);
        }
    }

FWIW, байты, которые я видел (в десятичном виде): 239, 187, 191.

Muz · Answer 10 · 17 января 2018

В моем случае у меня была проблема с файлом build.xml.Это было решено с помощью перехода на Build > Clean Project.

«Содержимое недопустимо в прологе» при разборе совершенно корректного XML на GAE

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 13 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Неожиданная причина: `#` символ в пути к файлу

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

«Содержимое недопустимо в прологе» при разборе совершенно корректного XML на GAE

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 13 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Неожиданная причина: # символ в пути к файлу

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы

Неожиданная причина: `#` символ в пути к файлу