Извлечение данных таблицы из PDF из URL - PullRequest
0 голосов
/ 21 апреля 2020

Добрый день, заранее спасибо за любую помощь. Я новичок, поэтому наивен ...

Я пытаюсь создать небольшой интерфейс на своем веб-сайте, который позволит вам сравнивать себя с другими с точки зрения оценок, используя Javascript. Данные таблиц распределения оценок легко доступны, и через XMLHttpRequest и обходя CORS с использованием «cors -where» мне удается получить все данные с соответствующего веб-сайта. Тем не менее, соответствующий веб-сайт представляет собой чистый PDF-файл, поэтому я получаю только HTML и много гиббери sh. Я только хочу вычеркнуть чистые числа из PDF на этом сайте. Могу ли я как-то временно загрузить PDF, извлечь из него числа и вскоре после этого выбросить? Возможно ли это, скажем, в PDF. js? Поскольку я все еще новичок в кодировании, я бы предпочел сделать его простым и использовать как можно меньше библиотек!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...