проверяющая схема Неверный байт 1 из 1-байтовой последовательности UTF-8 - PullRequest
0 голосов
/ 27 ноября 2011

Для моего файла XML у меня есть

<?xml version="1.0" encoding="UTF-8"?>
<forum>
  <post>
      <description>The Day is coming    </description>
      <date> Thu, 16 Apr 2009 </date>
      <title> cats  </title>
  </post>

  <post>
      <description> its raining </description>
      <date> Tues, 12 Apr 2010 </date>
      <title> dog </title>
  </post>

  <post>
      <description>Game over    </description>
      <date> Tues, 16 Apr 2009 </date>
      <title> frog  </title>
  </post>

  <post>
      <description> Watch </description>
      <date> wednesday, 12 Apr 2010 </date>
      <title> hats </title>
  </post>
</forum>

для моего файла xsd

<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs=”http://www.w3.org/2001/XMLSchema”>
<xs:element name="forum" type="xs:forumtype">
  <xs:complexType name = "forumtype">
    <xs:sequence>
      <xs:element name="post" type ="posttype"/>
    </xs:sequence>
   </xs:complexType> 
   <xs:complexType name="posttype">
       <xs:sequence>
            <xs:element name="description" type="xs:string"/>
            <xs:element name="date" type="xs:string"/>
            <xs:element name="title" type="xs:string"/>
          </xs:sequence>
        </xs:complexType>
       </xs:element>
    </xs:schema>

Когда я пытаюсь проверить схему, я получаю неверный байт 1 из 1-байтового UTF-8последовательность.Несмотря на то, что я установил кодировку "UTF-8", почему это все еще не нравится?

Ответы [ 3 ]

1 голос
/ 27 ноября 2011

Вы должны включить больше информации: платформа / язык, конкретное сообщение об ошибке, чтобы легче было что-то предлагать.Но если предположить, что сообщение об ошибке указывает на проблему с кодировкой UTF-8, это происходит на более низком уровне (во время синтаксического анализа XML) и не имеет ничего общего с проверкой схемы.

Вместо этого в базовом документе XML используется кодировка, отличная от той, о которой было сказано синтаксическому анализатору.так и должно быть - чаще всего контент использует что-то вроде Latin-1 (ISO-8859-1) кодирования (или аналогичного).Вы можете проверить это, просто проанализировав документ, и вы получите похожую ошибку, независимо от схемы.

Таким образом, у вас может быть поврежденный документ (используемая кодировка не является той, которую имеет объявление XML);или код, который вы используете, утверждает, что неверная кодировка.

0 голосов
/ 27 ноября 2011

Вы опубликовали XML text , но ошибка фактически вызывает жалобу на представление binary , хранящееся в источнике.Бинарный источник, по-видимому, не совсем UTF-8.

0 голосов
/ 27 ноября 2011

Я использовал бесплатный редактор, и он по умолчанию был Unicode. изменение кодировки исправило это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...