Автоматизация поиска ссылок на книги - PullRequest
1 голос
/ 07 февраля 2010

У меня есть список книг, перечисленных по названию в текстовом файле. Я хочу написать скрипт, который может использовать веб-сервис, такой как Google scholar или amazon, для поиска книг и вернуть мне файл xml или bibtex с информацией о цитировании для каждой книги. Какие инструменты программирования я могу использовать для этого вида автоматического поиска?

Ответы [ 2 ]

1 голос
/ 10 февраля 2010

Python будет моей рекомендацией.

  • Получить имена из текстового файла, простое чтение файла
  • Создание запроса REST URL для книги Google API

    http://books.google.com/books/feeds/volumes?q=Elizabeth+Bennet&start-index=21&max-results=10

  • Простой код Python для получения данных с этого URL (может потребоваться ключ API, рекомендуется использовать urllib2 с обработкой ошибок, а не urllib)

Пример кода,

 import urllib
 url = 'http://foo.api.request'
 data = urllib.urlopen(url).read()
  • См. Схемы возврата для этого API (вы можете использовать XML так, как вам нравится).
  • См. BibTeXML для преобразования между двумя форматами.

НТН

0 голосов
/ 07 февраля 2010

Я думаю, это может быть полезно, если вы укажете, какой сценарий вы хотите написать!

В любом случае ... вы могли бы сделать небольшую работу и написать свой собственный HttpRequest для Google и Amazon или просто положиться на их API, например: http://code.google.com/apis/books/

Есть отличный проект, который делает нечто похожее на то, что вы хотите сделать, он называется Shelves. Он написан для Android, но должен дать вам некоторые идеи, как обрабатывать ваши запросы. Вместо того, чтобы скачивать цитаты, он загружает обложку.

http://code.google.com/p/shelves/

Так же, как краткое примечание, сохранение ваших книг в xml-файле также может быть вариантом. В некоторых случаях это облегчает их анализ.

...