Исключение Ruby XMLParsing - PullRequest
0 голосов
/ 28 марта 2009

Я получаю ParseException каждый раз, когда пытаюсь проанализировать данные http get_response в Ruby. Исключением является наличие символа «&» в данных. Как мне это решить?

Недопустимый символ '&' в необработанной строке (REXML :: ParseException)

Ответы [ 3 ]

0 голосов
/ 29 марта 2009

Убедитесь, что данные, которые вы пытаетесь проанализировать, представляют собой правильно сформированный XML. Если вы пытаетесь передать HTML или RSS из Интернета, то это почти наверняка не правильно сформированный XML (HTML не XML, хотя XHTML может быть, и хотя RSS должен быть XML, есть много Генераторы RSS - это тот общий RSS, который плохо сформирован или недопустим).

Если вам нужно разобрать HTML, попробуйте Hpricot . Если вам нужно разобрать RSS, используйте встроенный анализатор RSS; Есть несколько примеров здесь .

0 голосов
/ 12 августа 2009

Если вы пытаетесь разобрать HTML, рассмотрите возможность использования Nokogiri .

Nokogiri::HTML("<html>...</html>")

Вы также можете попробовать Nokogiri::XML, но я считаю, что для этого требуется допустимая разметка.

0 голосов
/ 28 марта 2009

Данные передаются в синтаксический анализатор XML? Другие парсеры жалуются на это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...