Разбор онлайн PDF-файла с Python и PDFMiner - PullRequest
0 голосов
/ 19 января 2019

Как я могу проанализировать онлайн PDF файл с Python?

Мне просто нужна вторая строка первой страницы. Мне нужно сделать это без загрузки файла, и я использую Python 3.5

Я пробовал что-то подобное, но это не сработало: Использование PDFMiner (Python) с онлайн-файлами PDF. Кодировать URL?

from pdfminer.pdfparser import PDFParser
import urllib.request
from io import StringIO
import io

url = 'url_with_the_pdf'

open = urllib.request.urlopen(url).read()

memoryFile = io.StringIO(open)

parser = PDFParser(memoryFile)

Я получаю эту ошибку:

memoryFile = io.StringIO(open) TypeError: initial_value must be str or None, 
not bytes
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...