Question

Как я могу проанализировать онлайн PDF файл с Python?

Мне просто нужна вторая строка первой страницы. Мне нужно сделать это без загрузки файла, и я использую Python 3.5

Я пробовал что-то подобное, но это не сработало: Использование PDFMiner (Python) с онлайн-файлами PDF. Кодировать URL?

from pdfminer.pdfparser import PDFParser
import urllib.request
from io import StringIO
import io

url = 'url_with_the_pdf'

open = urllib.request.urlopen(url).read()

memoryFile = io.StringIO(open)

parser = PDFParser(memoryFile)

Я получаю эту ошибку:

memoryFile = io.StringIO(open) TypeError: initial_value must be str or None, 
not bytes

Разбор онлайн PDF-файла с Python и PDFMiner

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Разбор онлайн PDF-файла с Python и PDFMiner

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов