PDF-Scraping, организация очищенных данных - PullRequest
0 голосов
/ 16 октября 2019

Я трачу много времени в день на ввод данных, потому что наш commercehub не связан с нашей учетной записью на станции, очевидно, они не совместимы без третьей стороны, такой как eBridge или Logicbroker.

Тем не менее, ввод информации об отправке и номеров счетов в commercehub не является проблемой, временный присоска вводит каждый заказ вручную в UPS Worldship.

Ранее я просматривал html, но не pdf, я пробовал Tabulizer здесь: https://github.com/ropensci/tabulizer. НО мне нужны данные с каждой страницы в одну строку. Прилагается ниже: образец PDF и мой результат. pdf-scraping образец

И мне нужно это (образец с корабля):

https://docs.google.com/spreadsheets/d/1DAqVgNoEjmHboKU2_jLSld90snxIAK-PSKpC1hBKCeE/edit?usp=sharing

Как мненастроить код, чтобы вытащить его таким образом?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...