Как я могу проанализировать онлайн PDF файл с Python?
Мне просто нужна вторая строка первой страницы. Мне нужно сделать это без загрузки файла, и я использую Python 3.5
Я пробовал что-то подобное, но это не сработало: Использование PDFMiner (Python) с онлайн-файлами PDF. Кодировать URL?
from pdfminer.pdfparser import PDFParser
import urllib.request
from io import StringIO
import io
url = 'url_with_the_pdf'
open = urllib.request.urlopen(url).read()
memoryFile = io.StringIO(open)
parser = PDFParser(memoryFile)
Я получаю эту ошибку:
memoryFile = io.StringIO(open) TypeError: initial_value must be str or None,
not bytes