Как читать PDF-файлы с помощью Tabula в Google Drive - PullRequest
0 голосов
/ 03 февраля 2020

Привет Я сейчас пытаюсь сделать некоторую автоматизацию, которая будет конвертировать PDF-файлы в CSV, а затем загружать их в большой запрос. единственная проблема, с которой я сталкиваюсь - это чтение и преобразование файла PDF из Папки Google Диска .

В настоящее время я использую tabula через colab.

--------------------
My code: (Note that i've already installed everything...)
import tabula

# Read pdf into list of DataFrame
df = tabula.read_pdf('/content/drive/My\ Drive/GDriveToGCS-Folder/TestPDFFileConversion.pdf', pages=2)
--------------------
Error Message: 

FileNotFoundError: [Errno 2] No such file or directory: '/content/drive/My\\ Drive/GDriveToGCS-Folder/TestPDFFileConversion.pdf'
--------------------

Имеет кто-нибудь пробовал это?

1 Ответ

0 голосов
/ 03 февраля 2020

Проблема в том, что это backsla sh

My\ Drive

Замените его на

My Drive

Это уже внутри python цитата строки: '/ content / drive / My Drive /...'

...