Web Api для извлечения информации с сайта - PullRequest
3 голосов
/ 03 июня 2011

Мне нужен сервис, который извлекает заголовок с веб-страницы и возвращает его из json.Я не хотел бы анализировать веб-страницу или тратить ненужные циклы процессора.т.е. вызов должен быть примерно таким:

curl http://api.someservice.com/fetch?url=google.com&element=title&out=json

Ответ от API будет:

{
    response: {
        title: "Google"
        source: "google.com"
    }
    status: "success"

}

Любая подсказка будет высоко ценится

Ответы [ 2 ]

5 голосов
/ 03 июня 2011

Вам стоит взглянуть на YQL - это сервис общего назначения от Yahoo! это может сделать этот вид очистки очень легко. Попробуйте это:

select * from html where url="google.com" and xpath='//title'

Проверьте это здесь.

1 голос
/ 03 июня 2011

Я подозреваю, что YQL от Yahoo! Вероятно, довольно близко к тому, что вы ищете.

(На самом деле, я думаю, что краткое описание того, что такое YQL, будет, «веб-API для извлечения информации с веб-сайта»: -)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...