Вопрос новичка по использованию YQL для получения html-страницы в json - PullRequest
0 голосов
/ 12 февраля 2011

Я пытаюсь почистить веб-страницу, используя yql.Я думал, что вывод его как json даст мне весь контент как один объект.Однако, если есть какие-либо HTML-теги, такие как , этот текст не включается в «контент».Есть ли способ обойти это, или я должен просто получить его в виде XML и регулярное выражение тегов?

1 Ответ

0 голосов
/ 13 февраля 2011

Он должен вернуть все элементы со страницы, если ваш оператор YQL равен select * from html , где url = "http://www.cnn.com".

select * from html where url="http://www.cnn.com".
...