Мне нужен сервис, который извлекает заголовок с веб-страницы и возвращает его из json.Я не хотел бы анализировать веб-страницу или тратить ненужные циклы процессора.т.е. вызов должен быть примерно таким:
curl http://api.someservice.com/fetch?url=google.com&element=title&out=json
Ответ от API будет:
{ response: { title: "Google" source: "google.com" } status: "success" }
Любая подсказка будет высоко ценится
Вам стоит взглянуть на YQL - это сервис общего назначения от Yahoo! это может сделать этот вид очистки очень легко. Попробуйте это:
select * from html where url="google.com" and xpath='//title'
Проверьте это здесь.
Я подозреваю, что YQL от Yahoo! Вероятно, довольно близко к тому, что вы ищете.
(На самом деле, я думаю, что краткое описание того, что такое YQL, будет, «веб-API для извлечения информации с веб-сайта»: -)