YQL - CDATA]]> ошибка при выборе данных с использованием YQL - PullRequest
0 голосов
/ 02 мая 2011

Пытаюсь очистить данные с totalfilm.com с помощью YQL, но получаю странную ошибку:

«Последовательность символов»]]> «не должна появляться в контенте, если только не используется для обозначения конца раздела CDATA.»

select * from html where url="www.totalfilm.com"

ссылка

1 Ответ

2 голосов
/ 03 мая 2011

Как прокомментировано, может потребоваться некоторая путаница, чтобы сломанный XHTML работал так, как вам хотелось бы.

Вот быстрая, очень грубая таблица открытых данных для вас, которая удаляет любые <![CDATA[ и ]]> со страницы (X) HTML (а также Tidys it) перед применением необязательного выражения XPath, как в обычной таблице html, для получения необходимых данных.

Вы можете использовать его как:

use "https://github.com/salathe/yql-tables/raw/examples/data/nocdata.xml" as html;
select * from html where url="www.totalfilm.com"
...