Извлечь названия альбомов Picasaweb - PullRequest
0 голосов
/ 14 мая 2011

Я просто хотел бы получить названия альбомов.Вот пример страницы:

http://picasaweb.google.com/sunnchoi

Но когда я его wget и grep для шаблона заголовка, я получаю 100 результатов.Я понимаю, что должен эмулировать, щелкнув ссылку "Показать больше альбомов".Как мне это сделать (используя bash utils / perl)?

Ответы [ 2 ]

0 голосов
/ 15 мая 2011

Если у вас есть xmlstarlet, вы можете напрямую проанализировать соответствующий URL-адрес RSS данного веб-сайта:

xmlstarlet sel --net -T -t -m '//item' -v 'title' -n \
'http://picasaweb.google.com/data/feed/base/user/sunnchoi?alt=rss&kind=album&hl=en_US&access=public' | 
nl
0 голосов
/ 14 мая 2011

Попробуйте API веб-альбома Picases .

У них есть примеры на Python / Java и других языках. Вот запрос списка альбомов (этот с использованием python).

...