Запросы от Scopus API пишутся только на первой странице PDF - PullRequest
1 голос
/ 23 октября 2019

Я пытаюсь загрузить полнотекстовые версии PDF из Elsevier API. Я могу загрузить всю статью в формате XML, JSON и в виде простого текста. Итак, ключ API работает нормально. Однако я не могу загрузить полный текст в формате PDF. Когда я пытаюсь изменить заголовок так, чтобы он принимал PDF-файлы, он записывает только первую страницу статьи

. Я пробовал много разных DOI, но все они возвращают первую страницу статьи.

Это команда запроса, которую я использую для доступа к бумаге

import requests
r = requests.get('http://api.elsevier.com/content/article/doi/10.1016/0038-1098(87)90044-5?httpAccept=application/pdf', headers=headers)

И я пишу, используя следующий код

with open('test.pdf','wb') as f:
    f.write(r.content)

Нет ошибки, кроме теста.pdf - это только первая страница статьи.

1 Ответ

1 голос
/ 14 ноября 2019

По умолчанию API поиска статей (https://dev.elsevier.com/documentation/ArticleRetrievalAPI.wadl) позволяет осуществлять полнотекстовый поиск статей в формате XML или JSON, а не в формате PDF (за исключением содержимого с открытым доступом, где полный текст доступен во всех форматах). Для содержимого, не относящегося к OA, по умолчанию доступна только первая страница PDF.

...