yql и firebug xpath копирование / вставка не возвращая результата - PullRequest
1 голос
/ 25 февраля 2011

Я пытаюсь сделать небольшой скрининг скриншотов сторонней системы отслеживания ошибок поставщиков (jira), где я могу проанализировать количество / категорию всех неразрешенных ошибок.Я хочу разместить эту информацию в нашей интрасети, чтобы руководство могло видеть ее, не заходя на сторонний сайт (для которого у них нет учетных данных для входа).

У меня проблемы с получением результатов xpath, хотя,Вот что я делаю.Используя Firebug, я выбираю интересующий элемент DOM и щелкаю правой кнопкой мыши «copy as xpath».Затем я вставляю это в консоль YQL, поэтому у меня есть что-то похожее на:

select * 
from html 
where url='http://username:password@jira.3rdparty.com/path/to/page_i_want.aspx'
      and xpath='//*[@id="primary"]'

Мои результаты JSON возвращаются нулевыми.Если я удалю xpath в своем запросе, я получу обратно результаты.Если я выберу другие элементы на странице, мои результаты JSON вернутся на нуль.Если я начну настраивать xpath, скажем, удалить последний div в пути, я иногда получаю результаты, это зависит только от того, что я выбрал и что я настроил в xpath.

Кто-нибудь знает, почемуЯ не получаю никаких результатов, делая копию Firebug как xpath?Я не могу сказать, что я профессионал xpath:)

Редактировать: На самом деле, глядя на результаты я получаю без xpath, похоже, я неаутентификации.У моего имени пользователя есть @ и домен, поэтому я вхожу через браузер с чем-то вроде:

имя пользователя @ домен

пароль

YQLне похоже на @domain, и \ выход из @, похоже, не работает.У кого-нибудь есть идеи?

1 Ответ

0 голосов
/ 02 октября 2013

Это будет работать при условии соблюдения следующих критериев:

Модуль будет загружать только HTML-страницы размером менее 1,5 МБ, и страница также должна быть индексируемой (например, разрешено файлом robots.txt сайта)..)

Поскольку он находится за логином, он, вероятно, не индексируется.robots.txt является общедоступным, например:

http://internet.com/robots.txt

Для использования в будущем используйте двойные кавычки, чтобы не использовать символ коммерческого объявления:

'http://"username@domain:password"@jira.3rdparty.com/path/to/page_i_want.aspx'

ЗдесьВот некоторые ресурсы:

...